Notice
Recent Posts
Recent Comments
Link
«   2025/06   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
Tags
more
Archives
Today
Total
관리 메뉴

학생

openAI API 시작하기 본문

openAI API

openAI API 시작하기

개발새발개발하기 2025. 3. 12. 14:35

2025년 3월 12일 기준

2025년 3월 12일, 새벽에 OpenAI에서 새로운 API가 출시되어, 이대로 미룰 수 없어 글을 시작합니다.
이 글은 ChatGPT 유료(Plus) 사용자를 비롯해 OpenAI 모델에 대한 이해가 있고, Python 기초 프로그래밍 능력이 있는 분들을 대상으로 합니다.

OpenAI가 제공하는 모델 목록


대표 모델 (4.5 Preview, 4o, 4o Audio)

최신 모델로, 높은 성능과 다양한 기능을 자랑합니다.

  • 4.5 Preview
    • 모델 사이즈가 가장 크며, 다른 모델보다 EQ(Emotion Quotient)가 높아 사람다운 답변을 기대할 수 있는 모델입니다.
  • 4o ("o" for "omni")
    • 가장 기본적인 ChatGPT 모델로, 빠른 응답 속도가 특징입니다.
  • 4o Audio
    • 4o 모델에서 이미지 입력을 제거하고, 오디오 입력 및 오디오 출력 기능까지 추가된 모델입니다.

비용 절감 모델 (4o mini, 4o mini Audio)

빠르고 가벼우며, 특정 작업에 집중하여 비용 절감을 실현한 모델들입니다.

  • GPT-4o Mini
    • 4o 모델을 경량화한 버전으로, 빠른 처리 속도와 낮은 비용이 장점입니다.
  • GPT-4o Mini Audio Preview
    • 4o Audio 모델을 경량화하여 오디오 입출력을 지원하면서도 비용 효율을 높인 모델입니다.

추론 모델 (o1, o1-mini, o3-mini)

'o'로 시작하는 모델들은 답변을 제시하기 전,
Chain of Thought를 사용해 내부 추론 과정을 거치는 특징이 있습니다.

  • o3-mini
    • 가벼우면서도 빠른 추론을 제공하는 모델입니다.
  • o1
    • 복잡한 문제 해결과 추론 능력이 뛰어난 모델입니다.
  • o1-mini
    • o1 모델을 조금 더 경량화해, 빠르고 비용 효율적으로 추론 작업을 수행할 수 있습니다.

Realtime (실시간) 모델

실시간 입력 및 출력을 지원하는 최신 모델로, 즉각적인 반응이 필요한 서비스에 적합합니다.

  • GPT-4o Realtime Preview
    • 텍스트와 오디오를 실시간으로 처리하는 모델입니다.
    • 실시간 음성 대화나 스트리밍 애플리케이션에 활용 가능합니다.
  • GPT-4o Mini Realtime Preview
    • 실시간 처리를 지원하는 소형 모델로, 비용과 속도 두 마리 토끼를 잡을 수 있습니다.

Older GPT (구형 GPT) 모델

이전 세대의 GPT 모델이지만 여전히 안정성과 경제성을 갖춘 모델들입니다.

  • GPT-4 Turbo
    • 구형 GPT-4 모델 중 가장 높은 성능을 제공하며, 안정적인 응답 품질을 보장합니다.
  • GPT-4
    • GPT-4 시리즈의 표준 모델로, 다양한 작업에 활용할 수 있는 범용성 높은 버전입니다.
  • GPT-3.5 Turbo
    • 경제적인 비용으로 이용 가능한 레거시 모델이지만, 여전히 상당한 성능을 보여줍니다.

DALL·E (이미지 생성) 모델

텍스트를 기반으로 이미지를 생성하거나 편집할 수 있는 모델로, 시각적 콘텐츠 제작에 활용됩니다.

  • DALL·E 3
    • 최신 버전으로, 이미지 생성 성능이 대폭 향상되었습니다.
  • DALL·E 2
    • 이전 버전이지만 여전히 활용도가 높아, 다양한 이미지 생성 프로젝트에 사용됩니다.

Text-to-Speech (음성 생성) 모델

텍스트를 자연스러운 음성으로 변환하는 AI 모델로, 오디오 콘텐츠 제작에 활용됩니다.

  • TTS-1
    • 빠른 변환 속도에 특화된 모델로, 실시간 작업이나 대량 변환에 적합합니다.
  • TTS-1 HD
    • 고음질에 초점을 맞춰, 더 풍부하고 자연스러운 음성을 생성할 수 있습니다.

Whisper (음성 인식) 모델

음성을 텍스트로 변환하고, 다국어 번역까지 지원하는 음성 인식 모델입니다.

  • Whisper-1
    • 다양한 언어와 환경에서 안정적인 음성 인식과 번역을 제공하며, 멀티미디어 응용에 적합합니다.

Embeddings (임베딩) 모델

텍스트를 벡터로 변환해 검색, 추천, 분류 등 다양한 NLP 작업에 활용할 수 있는 모델입니다.

  • text-embedding-3-small
    • 가벼우면서 빠른 임베딩을 생성해, 실시간성이 필요한 서비스에 적합합니다.
  • text-embedding-3-large
    • 가장 높은 성능을 내는 임베딩 모델로, 정밀한 텍스트 분석에 유리합니다.
  • text-embedding-ada-002
    • 이전 세대 모델이지만, 비용이 저렴하여 테스트나 간단한 프로젝트에 활용하기 좋습니다.

Moderation (콘텐츠 검열) 모델

유해하거나 민감한 콘텐츠를 감지하고 차단해, 서비스를 안전하게 운영하는 데 활용합니다.

  • omni-moderation-latest
    • 텍스트와 이미지 등 다양한 미디어를 검열해주는 최신 모델입니다.
  • text-moderation-latest
    • 텍스트 전용 검열 모델로, 대화형 서비스에서 자주 사용됩니다.

Tool-Specific (특정 도구용) 모델

특정 기능이나 업무에 최적화된 AI 모델들입니다. 2025년 3월 11일에 발표된 api 입니다.

  • GPT-4o Search Preview
    • 웹 검색에 특화된 모델로, 검색 자동화나 결과 정리에 용이합니다.
  • GPT-4o Mini Search Preview
    • 가벼운 웹 검색 작업에 집중하여, 빠른 속도와 낮은 비용이 특징입니다.
  • computer-use-preview
    • 컴퓨터 조작과 관련된 작업을 자동화하는 데 특화된 모델입니다.

GPT Base (기본 GPT) 모델

오픈AI의 이전 GPT 시리즈를 대체하는 기본 모델들로, 직접적인 명령 처리가 가능합니다.

  • babbage-002
    • GPT-3 ada·babbage 계열을 대체하며, 가볍고 빠른 작업에 적합한 모델입니다.
  • davinci-002
    • GPT-3 curie·davinci를 대체하며, 더 복잡한 작업에도 대응할 수 있습니다.

마무리

지금까지 OpenAI가 제공하는 다양한 모델을 살펴봤습니다.
최신 기술을 필요로 할 때는 GPT-4.5 Preview4o 시리즈를,
비용이나 속도를 우선시할 땐 4o Mini 시리즈 같은 경량 모델을 활용해보세요.
이미지 생성, 음성 인식, 임베딩 등 멀티미디어·분석 분야를 위한 모델들도 계속 발전하고 있습니다.