중국 LLM¶
중국은 자국 시장을 중심으로 LLM 생태계를 구축하고 있다. 미국 GPU 수출 규제 속에서 비용 효율성과 자체 기술 개발에 집중한다.
시장 현황¶
- 미국 칩 수출 규제로 자체 하드웨어/소프트웨어 개발 가속
- Alibaba, Baidu, Tencent 등 빅테크의 대규모 투자
- DeepSeek의 저비용 고성능 모델로 글로벌 주목
기업 목록¶
| 기업 | 설립 | 본사 | 대표 모델 | 특징 |
|---|---|---|---|---|
| Alibaba | 1999 | 항저우 | Qwen 2.5 | 다국어, 코딩 특화 |
| DeepSeek | 2023 | 항저우 | DeepSeek V3 | 극한의 비용 효율 |
| 01.AI | 2023 | 베이징 | Yi 1.5 | 이궈칭(Kai-Fu Lee) 설립 |
| Baichuan | 2023 | 베이징 | Baichuan 2 | 중국어 특화 |
주요 특징¶
비용 효율성¶
DeepSeek V3는 GPT-4 수준 성능을 훨씬 낮은 학습 비용으로 달성. H100 대신 A100으로 학습하는 전략.
다국어 지원¶
Qwen 시리즈는 중국어뿐 아니라 영어, 한국어, 일본어 등 다국어를 잘 지원.
오픈소스 전략¶
대부분의 모델을 오픈소스로 공개하여 커뮤니티 확산 추구.
모델 현황¶
| 기업 | 모델 수 | 주요 시리즈 |
|---|---|---|
| Alibaba | 3 | Qwen |
| DeepSeek | 4 | DeepSeek V2/V3/R1 |
| 01.AI | 2 | Yi |
| Baichuan | 1 | Baichuan |