콘텐츠로 이동

EommyDocs

Gemma (1.0/1.1)

상세

Gemma (1.0/1.1)¶

개요¶

출시일: 2024년 2월 (Gemma 1.0), 2024년 4월 (Gemma 1.1)
개발사: Google DeepMind
멀티모달 특징: 텍스트 전용 오픈소스 모델. Google의 첫 번째 오픈 LLM 시리즈

사양¶

항목	내용
Context Window	8,192 tokens
파라미터	2B, 7B 버전 제공
아키텍처	Transformer (Decoder-only)
라이선스	Gemma Terms of Use (상업적 사용 가능)

모델 변형¶

모델	파라미터	특징
gemma-2b	2B	초경량, 모바일/엣지용
gemma-7b	7B	일반 용도
gemma-2b-it	2B	Instruction-tuned
gemma-7b-it	7B	Instruction-tuned

가격¶

오픈소스: 무료 다운로드 및 배포
Google AI Studio: 무료 API 제공 (Rate limit 적용)
Vertex AI: 배포 인프라 비용만 발생

자체 호스팅 시¶

하드웨어 비용만 발생
2B: CPU/저사양 GPU 실행 가능
7B: 8GB+ VRAM GPU 권장

주요 특징¶

Google의 첫 번째 오픈소스 LLM
Gemini 모델과 동일한 연구 및 기술 기반
사전 학습 및 Instruction-tuned 버전 제공
Responsible AI 도구킷과 함께 출시
다양한 추론 프레임워크 지원

장점¶

완전 오픈소스로 자유로운 사용
7B 파라미터로 로컬 실행 용이
동급 모델 (Llama 2 7B, Mistral 7B) 대비 경쟁력 있는 성능
Google의 안전성 검증 완료
활발한 커뮤니티 생태계

단점/한계¶

Gemma 2 출시 이후 레거시 모델로 분류
8K 토큰의 제한된 컨텍스트
텍스트 전용 (멀티모달 미지원)
복잡한 추론 작업에서 한계
한국어 등 비영어 성능 부족

적합한 사용 사례¶

오픈소스 LLM 학습 및 연구
리소스 제한 환경에서의 배포
파인튜닝 기반 커스텀 모델 개발
간단한 텍스트 생성 및 분류 작업
프라이버시 중요 로컬 애플리케이션

참고 자료¶

마이그레이션 권장¶

신규 프로젝트에서는 Gemma 2로의 마이그레이션을 권장합니다. Gemma 2는 동일한 파라미터 대비 현저히 향상된 성능을 제공합니다.