콘텐츠로 이동

Gemini 1.5 Flash

개요

  • 출시일: 2024년 5월 (Google I/O 2024)
  • 개발사: Google DeepMind
  • 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오 입력 지원. 1.5 Pro의 경량화 버전으로 속도에 최적화

사양

항목 내용
Context Window 1,000,000 tokens
기본 Context 128,000 tokens
최대 출력 토큰 8,192 tokens
파라미터 비공개 (1.5 Pro보다 경량화)
지식 기준일 2023년 11월

가격

Google AI Studio

유형 가격 (1M tokens) - 128K 이하 가격 (1M tokens) - 128K 초과
입력 $0.075 $0.15
출력 $0.30 $0.60

Vertex AI

유형 가격 (1M tokens) - 128K 이하 가격 (1M tokens) - 128K 초과
입력 $0.075 $0.15
출력 $0.30 $0.60
Context Caching $0.01875 (입력) $0.0375 (입력)

주요 특징

  • Gemini 1.5 Pro 대비 60% 이상 빠른 응답 속도
  • 1M 토큰 컨텍스트 윈도우로 장문맥 처리 가능
  • 1.5 Pro의 지식 증류(distillation) 기반 학습
  • 극도로 저렴한 가격 (1M 입력 토큰 $0.075)
  • Fine-tuning 지원

장점

  • 업계 최고 수준의 가성비
  • 빠른 응답 속도로 실시간 애플리케이션에 적합
  • 1M 컨텍스트로 장문서 처리 가능
  • GPT-3.5 Turbo 대비 우수한 성능
  • Context Caching으로 추가 비용 절감

단점/한계

  • 1.5 Pro 대비 복잡한 추론 능력 저하
  • 코드 생성 품질이 Pro 모델 대비 낮음
  • 이미지 생성 기능 미지원
  • 매우 복잡한 지시사항에서 성능 저하

적합한 사용 사례

  • 대용량 문서 분류 및 요약
  • 고빈도 API 호출이 필요한 서비스
  • 채팅 애플리케이션
  • 비용 민감한 프로덕션 환경
  • 멀티모달 콘텐츠 빠른 분석

참고 자료