Claude 3 Opus¶
개요¶
- 개발사: Anthropic
- 출시일: 2024년 3월 4일
- 모델 계열: Claude 3 (3세대)
- Constitutional AI: Anthropic의 Constitutional AI 방법론 적용. ASL-2 (AI Safety Level 2). BBQ (Bias Benchmark for Question Answering) 기준 이전 모델 대비 편향 감소.
사양¶
| 항목 | 내용 |
|---|---|
| Context Window | 200,000 tokens (최대 1M tokens 요청 시 가능) |
| 최대 출력 토큰 | 4,096 tokens |
| 모델 유형 | Standard (비추론 모델) |
| 비전 지원 | 지원 |
| 도구 사용 | 지원 |
가격¶
| 타입 | 가격 (per 1M tokens) |
|---|---|
| Input | $15.00 |
| Output | $75.00 |
| Prompt Caching Write | $18.75 |
| Prompt Caching Read | $1.50 |
주요 특징¶
- Claude 3 모델 중 가장 지능적인 모델
- 대부분의 AI 시스템 평가 벤치마크에서 경쟁 모델 능가
- 복잡한 작업에서 인간에 가까운 이해력과 유창성
- NIAH (Needle In A Haystack) 테스트에서 99% 이상 정확도
- 스페인어, 일본어, 프랑스어 등 비영어권 언어 대화 능력 향상
장점¶
- 개방형 프롬프트와 처음 보는 시나리오에서 뛰어난 유연성
- 고급 분석 및 예측 능력
- 정교한 콘텐츠 생성
- 복잡한 코드 생성 및 인터랙티브 코딩
- 장문 컨텍스트에서 거의 완벽한 정보 회수
- Claude 2.1 대비 정확도 2배 향상
단점/한계¶
- 높은 가격 (Output $75/MTok)
- Claude 2/2.1과 비슷한 속도 (Sonnet, Haiku보다 느림)
- Claude 4 및 Claude 3.5 모델에 의해 대체됨
- Extended Thinking 미지원
적합한 사용 사례¶
- 작업 자동화: API 및 데이터베이스 전반의 복잡한 액션 계획 및 실행
- 연구개발: 연구 리뷰, 브레인스토밍, 가설 생성, 신약 발견
- 전략: 차트/그래프 고급 분석, 재무 및 시장 동향 분석, 예측
- 인터랙티브 코딩
벤치마크 성능¶
| 벤치마크 | Claude 3 Opus |
|---|---|
| MMLU (지식) | 업계 최고 수준 |
| GPQA (추론) | 업계 최고 수준 |
| GSM8K (수학) | 업계 최고 수준 |
| NIAH (검색) | 99%+ |
현재 상태¶
- Legacy Model: Claude 4 및 Claude 3.5 모델 출시로 레거시 모델로 분류
- 여전히 API를 통해 사용 가능하나, 신규 프로젝트에는 최신 모델 권장