Claude 3.5 Sonnet¶
개요¶
- 개발사: Anthropic
- 출시일: 2024년 6월 20일 (초기), 2024년 10월 22일 (업그레이드)
- 모델 계열: Claude 3.5
- Constitutional AI: Anthropic의 Constitutional AI 방법론 적용. ASL-2 (AI Safety Level 2) 유지. 영국 AISI 및 미국 AISI의 사전 배포 안전성 평가 완료.
사양¶
| 항목 | 내용 |
|---|---|
| Context Window | 200,000 tokens |
| 최대 출력 토큰 | 8,192 tokens |
| 모델 유형 | Standard (비추론 모델) |
| 비전 지원 | 지원 (최고 수준의 비전 모델) |
| Computer Use | 지원 (베타) |
가격¶
| 타입 | 가격 (per 1M tokens) |
|---|---|
| Input | $3.00 |
| Output | $15.00 |
| Prompt Caching Write | $3.75 |
| Prompt Caching Read | $0.30 |
주요 특징¶
- Claude 3 Opus를 능가하는 성능을 Claude 3 Sonnet의 가격과 속도로 제공
- SWE-bench Verified 49.0% 달성 (업그레이드 버전)
- TAU-bench: 소매 도메인 69.2%, 항공 도메인 46.0%
- Computer Use 기능 최초 공개 (베타)
- Claude 3 Opus 대비 2배 빠른 속도
- 업계 최고 수준의 비전 능력
장점¶
- 뛰어난 가격 대비 성능 (Opus급 성능을 Sonnet 가격에)
- 복잡한 지시사항, 뉘앙스, 유머 이해 능력
- 고품질 콘텐츠 작성 (자연스럽고 공감 가능한 톤)
- 불완전한 이미지에서도 텍스트 전사 가능
- 코드 번역 및 레거시 코드 마이그레이션 능력
- Artifacts 기능으로 동적 협업 환경 제공
단점/한계¶
- Claude 4 모델 대비 코딩 성능 낮음
- Extended Thinking 미지원
- Computer Use 기능은 아직 실험적이며 오류 발생 가능
- 병렬 도구 실행 미지원
적합한 사용 사례¶
- 컨텍스트 기반 고객 지원
- 멀티스텝 워크플로우 오케스트레이션
- 코드 생성 및 트러블슈팅
- 레거시 애플리케이션 업데이트 및 코드베이스 마이그레이션
- 차트, 그래프 해석이 필요한 비전 작업
- 소매, 물류, 금융 서비스의 이미지 분석
벤치마크 성능¶
| 벤치마크 | 점수 |
|---|---|
| SWE-bench Verified | 49.0% (업그레이드 버전) |
| TAU-bench (소매) | 69.2% |
| TAU-bench (항공) | 46.0% |
| OSWorld (스크린샷) | 14.9% |
버전 히스토리¶
- 2024년 6월: 초기 버전 출시 (SWE-bench 33.4%)
- 2024년 10월: 업그레이드 버전 출시 (SWE-bench 49.0%, Computer Use 베타)