2024년 9월 12일

OpenAI o1‑preview를 소개합니다

어려운 문제 해결을 위한 새로운 추론 모델 시리즈입니다. 지금 사용해 보세요.

로딩 중...

2024년 9월 17일 업데이트: 요금 한도는 현재 o1‑preview의 경우 주당 쿼리 50개, o1‑mini의 경우 일간 쿼리 50개입니다.

응답하기 전에 생각하는 데 더 많은 시간을 할애하도록 설계된 새로운 시리즈의 AI 모델을 개발했습니다. 이 모델 시리즈는 복잡한 작업에서 추론할 수 있고 과학, 코딩, 수학에서 이전 모델보다 더 어려운 문제를 풀 수 있습니다.

오늘, ChatGPT와 API에 이 시리즈의 첫 번째 모델을 공개합니다. 공개되는 모델은 프리뷰 버전이며, 주기적으로 업데이트와 개선이 있을 예정입니다. 이 출시와 더불어, 현재 개발 중인 다음 업데이트의 평가도 공개합니다.

작동 방식

OpenAI는 응답하기 전에 마치 사람처럼 문제에 대해 더 시간을 들여 생각하도록 이 모델들을 훈련했습니다. 훈련을 통해 모델들은 사고 과정을 개선하고, 여러 전략을 시도하고, 실수를 인지하는 방법을 배웁니다.

테스트 결과, 모델의 다음 업데이트는 물리학, 화학, 생물학 분야의 어려운 벤치마크 테스트에서 PhD 학생과 유사한 능력을 보입니다. 또한 수학과 코딩에서 뛰어난 능력을 보이는 것도 확인했습니다. International Mathematics Olympiad(IMO) 예선에서 GPT‑4o는 문제 중 13%만 올바르게 풀었고 추론 모델은 83%를 기록했습니다. 코딩 능력은 대회에서 평가되었으며 Codeforces 대회에서 89번째 백분위수를 기록했습니다. 자세한 내용은 기술 연구 게시물에서 확인하실 수 있습니다.

초기 모델이기 때문에 아직은 웹에서 정보를 찾고 파일과 이미지를 업로드하는 등의 여러 유용한 ChatGPT 기능을 갖추지는 못했습니다. 다수의 일반적인 사례에서 단기적으로 보면 GPT‑4o가 더 유능할 것입니다.

하지만 복잡한 추론 작업의 경우 이것은 중요한 발전이며 AI 능력의 새로운 차원을 제시합니다. 이런 점을 감안하여 OpenAI는 카운터를 다시 1로 돌리고 이 시리즈의 이름을 OpenAI o1으로 지었습니다.

안전

이 새로운 모델 시리즈를 개발하는 과정에서 OpenAI는 이 모델들의 추론 능력을 활용하여 안전 및 정렬 가이드라인을 따르도록 하는 새로운 안전 훈련 방식을 마련했습니다. 우리의 안전 규칙에 관해 컨텍스트 내에서 이성을 가동할 수 있기 때문에 이 모델 시리즈는 안전 규칙을 더 효과적으로 적용할 수 있습니다.

안전을 측정하는 한 가지 방법은 사용자가 OpenAI의 안전 규칙을 우회(‘탈옥’이라고 함)하려고 시도할 때 모델이 계속해서 안전 규칙을 얼마나 잘 따르는지를 테스트하는 것입니다. 가장 어려운 탈옥 테스트 중 하나에서 GPT‑4o는 0부터 100까지의 척도에서 22점을 기록했지만 o1‑preview 모델은 84점을 기록했습니다. 자세한 내용은 시스템 카드와 연구 게시물에서 확인하실 수 있습니다.

이 모델들의 새로운 능력에 발맞추기 위해 OpenAI는 안전 작업, 내부 거버넌스, 연방 정부와의 협력을 강화했습니다. 그 일환으로 준비성 프레임워크⁠(새 창에서 열기), 업계 최고의 레트팀 테스트, 안전 및 보안 위원회를 포함한 이사회 수준의 검토 프로세스를 사용해 엄격한 테스트와 평가를 거쳤습니다.

AI 안전에 대한 노력을 한층 더 발전시키기 위해 OpenAI는 최근 미국 및 영국의 AI 안전 연구소와 공식적으로 협약을 맺었고, 해당 기관에 이 모델의 리서치 버전에 대한 조기 액세스 권한을 부여하는 등 이러한 협약을 토대로 운용을 시작했습니다. 이것은 이 파트너십에서 중요한 첫걸음으로, 향후 모델들을 대중에 공개하기 전후에 진행되는 연구, 평가, 테스트를 위한 프로세스를 수립하는 데 도움이 됩니다.

대상

이러한 향상된 추론 능력은 과학, 코딩, 수학 및 그와 유사한 분야에서 복잡한 문제를 해결하는 사람들에게 특히 유용할 수 있습니다. 예를 들어, o1은 의료 분야 연구자가 세포 시퀀싱 데이터에 주석을 다는 데 사용할 수 있고, 물리학자가 양자 광학에 필요한 복잡한 수학 공식을 생성하는 데 사용할 수 있으며, 모든 분야의 개발자가 여러 단계로 구성된 워크플로를 수립하고 실행하는 데 사용할 수 있습니다.

OpenAI o1-mini

o1 시리즈는 복잡한 코드를 정확하게 생성하고 디버깅하는 데 뛰어난 능력을 보여줍니다. 개발자에게 더 효율적인 솔루션을 제공하기 위해 더 빠르고 더 저렴한 추론 모델이면서 코딩에 특히 효과적인 OpenAI o1‑mini도 출시합니다. 더 작은 모델인 o1‑mini는 o1‑preview보다 80% 더 저렴하기 때문에, 추론이 필요하지만 세상의 광범위한 지식은 필요하지 않은 사례에서 강력하면서도 비용 효과적인 모델입니다.

OpenAI o1을 사용하는 방법

ChatGPT Plus 및 Team 사용자는 오늘부터 ChatGPT에서 o1 모델에 액세스할 수 있습니다. o1‑preview와 o1‑mini를 모두 모델 선택기에서 수동으로 선택할 수 있으며, 출시 시점에 주간 요금 한도는 o1‑preview의 경우 메시지 30개, o1‑mini의 경우 50개입니다. 이 한도를 늘리고 ChatGPT가 주어진 프롬프트에 적합한 모델을 자동으로 선택할 수 있도록 하기 위해 노력하고 있습니다.

밝은 노란색과 파란색의 추상적인 배경 앞에 새로운 ChatGPT 드롭다운이 있고 새로운 ‘o1-preview’ 모델 옵션이 표시됨.

ChatGPT Enterprise 및 Edu 사용자는 다음 주부터 두 모델을 모두 사용할 수 있습니다.

API 사용 등급 5⁠(새 창에서 열기) 자격이 있는 개발자는 오늘부터 API에서 두 모델의 프로토타이핑을 시작할 수 있으며, 요금 한도는 20RPM입니다. 추가 테스트 후에 이 한도를 늘릴 수 있도록 노력 중입니다. 이 두 모델을 사용할 수 있는 API에는 현재 호출 기능, 스트리밍, 시스템 메시지 지원 및 기타 기능이 포함되어 있지 않습니다. 시작하려면 API 문서⁠(새 창에서 열기)를 확인하세요.

모든 ChatGPT Free 사용자가 o1‑mini에 액세스할 수 있도록 할 예정입니다.

앞으로 공개될 것들

이번에 ChatGPT와 API에 출시되는 버전은 두 추론 모델의 초기 프리뷰입니다. 모두가 두 모델을 더 유용하게 사용할 수 있도록 모델을 업데이트하면서 브라우징, 파일 및 이미지 업로드, 기타 기능을 추가할 계획입니다.

또한 새로운 OpenAI o1 시리즈뿐만 아니라 GPT 시리즈에서도 계속해서 모델을 개발하고 출시할 것입니다.

저자

OpenAI