Mistral Large 2
개요
- 출시일: 2024년 7월 24일
- MoE 구조 여부: No (Dense Model)
사양
| 항목 |
내용 |
| 파라미터 (총/활성) |
123B / 123B |
| Context Window |
128K tokens |
| GPU RAM (bf16/fp4) |
약 297GB / 75GB |
라이선스
- Mistral Research License (MRL)
- 연구 및 비상업적 용도: 무료
- 상업적 용도: 별도 상용 라이선스 필요
가격 (API)
| Provider |
Input |
Output |
| Mistral AI |
$2.00/1M tokens |
$6.00/1M tokens |
| Google Vertex AI |
$2.00/1M tokens |
$6.00/1M tokens |
주요 특징
- 128K 컨텍스트 윈도우로 장문 처리에 최적화
- 80개 이상 프로그래밍 언어 지원 (Python, Java, C, C++, JavaScript, Bash 등)
- 다국어 지원: 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어, 한국어
- 향상된 함수 호출(Function Calling) 기능
- 병렬 및 순차적 함수 호출 지원
- 단일 노드 추론에 최적화
장점
- GPT-4o, Claude 3 Opus, Llama 3 405B와 동등한 코드 및 추론 성능
- MMLU 84.0% (사전학습 버전) 달성
- 환각(Hallucination) 감소를 위한 집중적인 학습
- 정보가 부족할 때 인정하도록 훈련됨
- 간결한 응답 생성으로 비용 효율적
단점/한계
- 상업적 사용 시 별도 라이선스 필요
- 대규모 파라미터로 인한 높은 하드웨어 요구사항
- 2025년 3월 30일 지원 종료 예정 (Mistral Large 3로 대체)
참고 자료
- 공식 발표: https://mistral.ai/news/mistral-large-2407
- HuggingFace: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
- 공식 문서: https://docs.mistral.ai/models/mistral-large-2-0-24-07