콘텐츠로 이동

Gemini 1.5 Pro

개요

  • 출시일: 2024년 2월 (Preview), 2024년 5월 (GA)
  • 개발사: Google DeepMind
  • 멀티모달 특징: 텍스트, 이미지, 비디오, 오디오, PDF 입력 지원. Mixture-of-Experts (MoE) 아키텍처 기반의 획기적인 장문맥 처리

사양

항목 내용
Context Window 2,000,000 tokens (최대)
기본 Context 128,000 tokens
최대 출력 토큰 8,192 tokens
파라미터 비공개 (MoE 아키텍처)
지식 기준일 2023년 11월

가격

Google AI Studio

유형 가격 (1M tokens) - 128K 이하 가격 (1M tokens) - 128K 초과
입력 $1.25 $2.50
출력 $5.00 $10.00

Vertex AI

유형 가격 (1M tokens) - 128K 이하 가격 (1M tokens) - 128K 초과
입력 $1.25 $2.50
출력 $5.00 $10.00
Context Caching $0.3125 (입력) $0.625 (입력)

주요 특징

  • 업계 최초 2M 토큰 컨텍스트 윈도우 지원
  • MoE (Mixture-of-Experts) 아키텍처로 효율성 극대화
  • Near-perfect recall: 1M 토큰 내에서 99% 이상의 정보 검색 정확도
  • 비디오 전체 분석 가능 (최대 1시간 분량)
  • 대규모 코드베이스 전체를 한 번에 분석
  • Context Caching으로 반복 요청 비용 75% 절감

장점

  • 업계 최대 컨텍스트 윈도우로 장문서 분석에 탁월
  • 책 전체, 긴 비디오, 대형 코드베이스 일괄 처리 가능
  • 높은 수준의 추론 능력
  • 코드 생성 및 분석에서 강점
  • 멀티모달 입력의 자연스러운 통합

단점/한계

  • 2M 컨텍스트 사용 시 비용 급증 (128K 초과 시 2배 가격)
  • 응답 속도가 Flash 모델 대비 느림
  • 이미지 생성 기능 미지원
  • 2023년 11월 기준 지식으로 최신 정보 부족

적합한 사용 사례

  • 장문서 분석 및 요약 (법률 문서, 논문, 책)
  • 전체 코드베이스 분석 및 리팩토링
  • 긴 비디오 콘텐츠 분석 및 요약
  • 복잡한 멀티턴 대화 시스템
  • 연구 및 분석 작업

참고 자료