Gemini 2.0 Flash¶
개요¶
- 출시일: 2024년 12월
- 개발사: Google DeepMind
- 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 네이티브 이미지 생성, 텍스트-투-스피치 출력 기능 제공
사양¶
| 항목 | 내용 |
|---|---|
| Context Window | 1,000,000 tokens |
| 최대 출력 토큰 | 8,192 tokens |
| 파라미터 | 비공개 |
| 지식 기준일 | 2024년 8월 |
가격¶
Google AI Studio¶
| 유형 | 가격 (1M tokens) |
|---|---|
| 입력 (텍스트/이미지/비디오) | 무료 (일일 한도 내) |
| 출력 | 무료 (일일 한도 내) |
Vertex AI¶
| 유형 | 가격 (1M tokens) | Batch API |
|---|---|---|
| 입력 (텍스트/이미지/비디오) | $0.15 | $0.075 |
| 입력 (오디오) | $1.00 | $0.50 |
| 출력 (텍스트) | $0.60 | $0.30 |
| 출력 (이미지) | $30.00 | - |
Gemini 2.0 Flash Lite¶
| 유형 | 가격 (1M tokens) | Batch API |
|---|---|---|
| 입력 | $0.075 | $0.0375 |
| 출력 (텍스트) | $0.30 | $0.15 |
주요 특징¶
- Gemini 2.0 세대의 첫 번째 모델로 속도와 성능 균형 최적화
- 네이티브 멀티모달 출력: 이미지 생성 및 텍스트-투-스피치 기능 내장
- Live API 지원으로 실시간 스트리밍 대화 가능
- Agentic 워크플로우를 위한 네이티브 도구 사용 기능
- Google Search Grounding 지원
- 1M 토큰의 대규모 컨텍스트 윈도우
장점¶
- 뛰어난 가성비: 저렴한 가격에 높은 성능 제공
- 멀티모달 입출력 모두 지원하는 통합 모델
- 빠른 응답 속도로 실시간 애플리케이션에 적합
- Function Calling 및 Code Execution 기능 내장
- Batch API로 대량 처리 시 50% 비용 절감
단점/한계¶
- 파라미터 수 비공개로 정확한 성능 예측 어려움
- GPT-4 Turbo 대비 복잡한 추론 작업에서 다소 부족
- 이미지 생성 품질이 전용 이미지 모델 대비 제한적
- 일부 언어에서 성능 편차 존재
적합한 사용 사례¶
- 실시간 챗봇 및 대화형 에이전트
- 멀티모달 콘텐츠 분석 및 요약
- 코드 생성 및 디버깅 보조
- 대량 문서 처리 및 분석 (Batch API 활용)
- 비용 효율적인 프로덕션 배포