Gemini 2.0 Flash
개요
- 출시일: 2024년 12월
- 개발사: Google DeepMind
- 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 네이티브 이미지 생성, 텍스트-투-스피치 출력 기능 제공
사양
| 항목 |
내용 |
| Context Window |
1,000,000 tokens |
| 최대 출력 토큰 |
8,192 tokens |
| 파라미터 |
비공개 |
| 지식 기준일 |
2024년 8월 |
가격
Google AI Studio
| 유형 |
가격 (1M tokens) |
| 입력 (텍스트/이미지/비디오) |
무료 (일일 한도 내) |
| 출력 |
무료 (일일 한도 내) |
Vertex AI
| 유형 |
가격 (1M tokens) |
Batch API |
| 입력 (텍스트/이미지/비디오) |
$0.15 |
$0.075 |
| 입력 (오디오) |
$1.00 |
$0.50 |
| 출력 (텍스트) |
$0.60 |
$0.30 |
| 출력 (이미지) |
$30.00 |
- |
Gemini 2.0 Flash Lite
| 유형 |
가격 (1M tokens) |
Batch API |
| 입력 |
$0.075 |
$0.0375 |
| 출력 (텍스트) |
$0.30 |
$0.15 |
주요 특징
- Gemini 2.0 세대의 첫 번째 모델로 속도와 성능 균형 최적화
- 네이티브 멀티모달 출력: 이미지 생성 및 텍스트-투-스피치 기능 내장
- Live API 지원으로 실시간 스트리밍 대화 가능
- Agentic 워크플로우를 위한 네이티브 도구 사용 기능
- Google Search Grounding 지원
- 1M 토큰의 대규모 컨텍스트 윈도우
장점
- 뛰어난 가성비: 저렴한 가격에 높은 성능 제공
- 멀티모달 입출력 모두 지원하는 통합 모델
- 빠른 응답 속도로 실시간 애플리케이션에 적합
- Function Calling 및 Code Execution 기능 내장
- Batch API로 대량 처리 시 50% 비용 절감
단점/한계
- 파라미터 수 비공개로 정확한 성능 예측 어려움
- GPT-4 Turbo 대비 복잡한 추론 작업에서 다소 부족
- 이미지 생성 품질이 전용 이미지 모델 대비 제한적
- 일부 언어에서 성능 편차 존재
적합한 사용 사례
- 실시간 챗봇 및 대화형 에이전트
- 멀티모달 콘텐츠 분석 및 요약
- 코드 생성 및 디버깅 보조
- 대량 문서 처리 및 분석 (Batch API 활용)
- 비용 효율적인 프로덕션 배포
참고 자료