콘텐츠로 이동

GPT-4o

개요

  • 출시일: 2024년 5월 13일
  • 개발사: OpenAI
  • 모델 특징 요약: GPT-4o("o"는 "omni"를 의미)는 OpenAI의 다목적 고성능 플래그십 모델이다. 텍스트와 이미지 입력을 모두 지원하며, 텍스트 출력(Structured Outputs 포함)을 생성한다. o-series 모델을 제외한 대부분의 작업에서 최고의 성능을 제공하는 모델이다.

사양

항목 내용
파라미터 비공개
Context Window 128,000 tokens
Max Output Tokens 16,384 tokens
학습 데이터 기준일 2023년 10월 1일

가격

타입 가격 (per 1M tokens)
Input $2.50
Cached Input $1.25
Output $10.00

주요 특징

  • 멀티모달 입력 지원 (텍스트 + 이미지)
  • Structured Outputs 지원
  • Function Calling 지원
  • 스트리밍 지원
  • Fine-tuning 지원
  • Distillation 지원
  • Predicted Outputs 지원

장점

  • 빠른 응답 속도와 높은 인텔리전스의 균형
  • 다양한 작업에 범용적으로 활용 가능
  • 이미지 입력을 통한 시각적 이해 능력
  • GPT-4 Turbo 대비 저렴한 가격
  • 다양한 API 엔드포인트 지원

단점/한계

  • 오디오 및 비디오 입력 미지원 (별도 Audio 모델 필요)
  • o-series 모델 대비 복잡한 추론 작업에서 성능 제한
  • 이미지 출력 불가 (입력만 지원)

적합한 사용 사례

  • 일반적인 대화형 AI 애플리케이션
  • 이미지 분석 및 설명
  • 코드 생성 및 리뷰
  • 문서 요약 및 분석
  • 다국어 번역
  • 수학 튜터링
  • 여행 어시스턴트
  • 레시피 생성

API 접근

엔드포인트: POST https://api.openai.com/v1/chat/completions
모델명: gpt-4o (또는 gpt-4o-2024-08-06, gpt-4o-2024-11-20, gpt-4o-2024-05-13)

지원 API:
- Chat Completions: v1/chat/completions
- Responses: v1/responses
- Assistants: v1/assistants
- Batch: v1/batch
- Fine-tuning: v1/fine-tuning

참고 자료

  • OpenAI GPT-4o 모델 문서: https://platform.openai.com/docs/models/gpt-4o
  • OpenAI API 가격: https://openai.com/api/pricing/
  • OpenAI API 레퍼런스: https://platform.openai.com/docs/api-reference