Alibaba VLM¶
Qwen-VL 시리즈로 다국어 VLM을 제공한다.
모델 목록¶
| 모델 | 출시 | 설명 |
|---|---|---|
| Qwen-VL | 2023.08 | 다국어 VLM |
Qwen-VL 특징¶
| 항목 | 내용 |
|---|---|
| 파라미터 | 9.6B |
| 해상도 | 448px |
| 다국어 | 중/영/한/일 등 |
| 라이선스 | Tongyi Qianwen License |
주요 기능: - Grounding: 객체 위치(bbox) 출력 - 다중 이미지: 여러 이미지 동시 처리 - OCR: 중국어/영어 문서 인식 - 대화: 멀티턴 이미지 대화
Qwen-VL-Plus/Max¶
| 모델 | 특징 |
|---|---|
| Qwen-VL-Plus | API 전용, 고해상도 |
| Qwen-VL-Max | 최고 성능, GPT-4V 경쟁 |