콘텐츠로 이동

Gemma (1.0/1.1)

개요

  • 출시일: 2024년 2월 (Gemma 1.0), 2024년 4월 (Gemma 1.1)
  • 개발사: Google DeepMind
  • 멀티모달 특징: 텍스트 전용 오픈소스 모델. Google의 첫 번째 오픈 LLM 시리즈

사양

항목 내용
Context Window 8,192 tokens
파라미터 2B, 7B 버전 제공
아키텍처 Transformer (Decoder-only)
라이선스 Gemma Terms of Use (상업적 사용 가능)

모델 변형

모델 파라미터 특징
gemma-2b 2B 초경량, 모바일/엣지용
gemma-7b 7B 일반 용도
gemma-2b-it 2B Instruction-tuned
gemma-7b-it 7B Instruction-tuned

가격

  • 오픈소스: 무료 다운로드 및 배포
  • Google AI Studio: 무료 API 제공 (Rate limit 적용)
  • Vertex AI: 배포 인프라 비용만 발생

자체 호스팅 시

  • 하드웨어 비용만 발생
  • 2B: CPU/저사양 GPU 실행 가능
  • 7B: 8GB+ VRAM GPU 권장

주요 특징

  • Google의 첫 번째 오픈소스 LLM
  • Gemini 모델과 동일한 연구 및 기술 기반
  • 사전 학습 및 Instruction-tuned 버전 제공
  • Responsible AI 도구킷과 함께 출시
  • 다양한 추론 프레임워크 지원

장점

  • 완전 오픈소스로 자유로운 사용
  • 7B 파라미터로 로컬 실행 용이
  • 동급 모델 (Llama 2 7B, Mistral 7B) 대비 경쟁력 있는 성능
  • Google의 안전성 검증 완료
  • 활발한 커뮤니티 생태계

단점/한계

  • Gemma 2 출시 이후 레거시 모델로 분류
  • 8K 토큰의 제한된 컨텍스트
  • 텍스트 전용 (멀티모달 미지원)
  • 복잡한 추론 작업에서 한계
  • 한국어 등 비영어 성능 부족

적합한 사용 사례

  • 오픈소스 LLM 학습 및 연구
  • 리소스 제한 환경에서의 배포
  • 파인튜닝 기반 커스텀 모델 개발
  • 간단한 텍스트 생성 및 분류 작업
  • 프라이버시 중요 로컬 애플리케이션

참고 자료

마이그레이션 권장

신규 프로젝트에서는 Gemma 2로의 마이그레이션을 권장합니다. Gemma 2는 동일한 파라미터 대비 현저히 향상된 성능을 제공합니다.