
OpenAI가 개발한 새로운 AI 모델에 액세스하기 위한 API를 공개합니다. 단을 사용 사례를 위해 설계된 대부분의 AI 시스템과 달리, 현재의 API는 범용 “텍스트 입력-텍스트 출력” 인터페이스를 제공하여 사용자가 가상 환경에서 거의 모든 영어 작업을 처리하도록 돕습니다. 이제 액세스를 요청하여 내 제품에 API를 통합하거나 완전히 새로운 애플리케이션을 개발하거나 OpenAI가 이 기술의 강점과 제한을 파악하는 것을 도울 수 있습니다.
텍스트 프롬프트가 주어지면 API는 사용자가 제공한 패턴과 최대한 일치하는 텍스트 완성을 반환합니다. 원하는 작업에 대한 몇 가지 예시만 보여주면 프로그래밍할 수 있으며, 성공의 정도는 작업의 복잡한 정도에 따라 달라집니다. 또한 이 API는 사용자가 제공한 예시의 데이터세트(소규모 또는 대규모)를 훈련하거나 사용자나 분류자가 제공한 인간 피드백을 학습함으로써 사용자가 특정 작업에 대한 능력을 향상하도록 돕습니다.
누구나 간단하게 사용할 수 있으면서도 머신 러닝 팀의 생산성 향상에 도움이 되도록 유연한 API를 설계했습니다. 실제로 OpenAI의 많은 팀도 현재 분산 시스템 문제보다 머신 러닝 리서치에 집중하기 위해 이 API를 사용하고 있습니다. 오늘날 API는 다양한 속도 및 처리량 개선 사항을 적용하여 GPT‑3(새 창에서 열기) 제품군에서 가중치를 가진 모델을 실행합니다. 빠른 속도로 발전하는 머신 러닝에 맞춰 OpenAI는 기술을 꾸준히 업그레이드하여 사용자에가 최신 경험을 제공합니다.
이 분야의 빠른 발전 속도는 AI의 놀랍고 새로운 응용 분야가 긍정적인 면에서도 부정적인 면에서도 자주 나타난다는 것을 의미합니다. OpenAI는 괴롭힘, 스팸, 급진화, 여론 조작 등과 같은 확실히 유해한 사용 사례의 API 액세스를 종식시킬 것입니다. 하지만 이 기술이 가져올 수 있는 모든 결과를 예측할 수 없다는 점을 인지하고 있으므로 범용이 아닌 비공개 베타 버전으로 공개하며, 우리 API가 반환하는 콘텐츠를 사용자가 더욱 잘 제어할 수 있는 도구를 개발하고, 언어 기술의 안전 관련 측면(유해한 편향 분석, 완화 및 개입)을 연구하고 있습니다. 사용자 및 다양한 커뮤니티가 인류에 긍정적인 AI 시스템을 구축하도록 OpenAI의 지식을 공유하겠습니다.
API는 우리의 사명을 추구하기 위한 비용을 충당하는 수익원일 뿐만 아니라, 범용 AI 기술을 발전시키고, 활용도를 확대하고, 실제 세계에 미치는 영향을 고려하는 등 OpenAI가 집중해야 할 핵심을 명확히 해주었습니다. 이로운 AI 기반 제품과 함께 오늘날 상상하기 어려운 도구 및 서비스를 생산하는 데 있어 이 API가 장벽(새 창에서 열기)을 허물게 되기를 바랍니다.
API를 살펴보고 싶으신가요? Algolia(새 창에서 열기), Quizlet(새 창에서 열기), 및 Reddit(새 창에서 열기)과 같은 회사나 Middlebury Institute(새 창에서 열기)와 같은 기관의 연구원들과 함께 비공개 베타(새 창에서 열기)에 참여해 보세요.
궁극적으로 우리가 가장 중요시하는 부분은 범용 AI로 모두를 이롭게 하는 것입니다. 상업용 제품을 개발하는 것은 이를 성공하기 위한 자금을 모으는 방법 중 하나입니다.
또한 세계에 강력한 AI 시스템을 안전하게 배포하는 것도 쉽지 않은 일임을 알고 있습니다. API를 공개하면서 현실에서 AI 시스템이 사용될 때 발생할 수 있는 문제점을 파트너사와 함께 면밀히 살펴보고 있습니다. 이 과정은 미래의 AI 시스템 배포가 어떤 모습이 될 것인지, 모두에게 안전하고 이로운 시스템을 만들기 위해 필요한 것 무엇인지 파악하고 이를 위해 노력하는 데 도움이 될 것입니다.
여기에는 세 가지 주요 이유가 있습니다. 먼저 기술을 상품화하면 AI 연구, 안전 및 정책 노력에 필요한 자금을 충당하는 데 도움이 됩니다.
둘째, API의 기반이 되는 대부분의 모델은 매우 크기 때문에, 개발 및 배포에 많은 전문 지식이 필요하며 실행 비용도 무척 많이 들어갑니다. 따라서 대기업이 아니면 근본 기술의 이점을 누리기 힘들게 됩니다. OpenAI는 API가 중소기업이나 조직에도 접근성이 뛰어난 강력한 AI 시스템을 만들기를 바랍니다.
셋째, 이 API 모델은 기술의 오사용에 더욱 쉽게 대응할 수 있게 해줍니다. 모델의 후속 사용 사례를 예측하는 일이 어렵기 때문에, 유해한 애플리케이션으로 판명될 경우 액세스를 조정할 수 없는 오픈 소스 모델을 출시하는 것보다 API를 통해 출시하고 시간이 지남에 따라 접근을 확대하는 것이 본질적으로 더 안전한 것으로 보입니다.
GPT‑2의 경우 특히 우려했던 부분은 모델이 오픈 소스로 공개된 경우 예방하기 힘든 모델의 악의적인 사용(예: 역정보를 위한 사용)이었습니다. 이 API는 승인된 고객 및 사용 사례로 액세스를 제한함으로써 오용을 더 쉽게 예방할 수 있습니다. OpenAI에는 제안된 애플리케이션이 출시되기 전에 거치는 의무적인 생산 검토 과정이 있습니다. 생산 검토에서 다음과 같은 질문을 통해 몇 가지 기준을 두고 애플리케이션을 평가합니다. 현재 지원되는 사용 사례인가?, 애플리케이션이 어느 정도 개방형인가?, 이 애플리케이션은 얼마나 위험한가?, 잠재적 오용을 어떻게 처리할 계획인가?, 애플리케이션의 최종 사용자는 누구인가?
괴롭힘, 의도적인 속임수, 급진화, 여론 조작, 또는 스팸뿐 아니라 최종 사용자의 오용을 제한하는 보조 장치가 부족한 애플리케이션을 포함하지만 이에 국한하지 않고 사람들에게 신체적, 정서적, 정신적 해를 초래하는(또한 초래할 의도가 있는) 것으로 보이는 사용 사례에 대한 API 액세스를 차단합니다. 실제에서 API를 운영하는 경험이 쌓임에 따라 지원 가능한 애플리케이션의 범위를 넓히고 오용 우려가 있는 애플리케이션에 대해 더 세분화된 카테고리를 만들기 위해 지원 가능한 사용 카테고리를 지속적으로 개선할 것입니다.
API 사용 승인에서 고려하는 주요 요소 중 하나는 시스템의 근본적인 생성 능력과 관련하여 애플리케이션이 어느 정도 개방적이거나 제한적인 행동을 보이는지입니다. API의 개방형 애플리케이션(즉, 임의의 프롬프트를 통해 대량의 사용자 지정 텍스트를 마찰 없이 생성할 수 있게 하는 애플리케이션)은 오용에 특히 취약합니다. 생성형 사용 사례를 더 안전하게 만들 수 있는 제약 조건에는 인간이 개입하는 시스템 설계, 최종 사용자 접근 제한, 출력물 후처리, 콘텐츠 필터링, 입력/출력 길이 제한, 적극적인 모니터링, 주제 제한 등이 포함됩니다.
또한 우리의 학술적 액세스 프로그램(새 창에서 열기)을 통해 서드파티 연구원과 함께 API가 서비스를 제공하는 모델의 잠재적 오용에 대한 리서치를 계속 진행할 것입니다. 현재 소수의 연구자와 리서치가 진행되었고 Middlebury Institute(새 창에서 열기), 워싱턴대학교 및 Allen Institute for AI(새 창에서 열기)의 학술적 파트너에게서 나온 결과가 있습니다. 이미 이 프로그램의 지원자가 수천 명 이상이며, 현재 공정성과 표현 연구에 중점을 둔 애플리케이션을 우선적으로 검토하고 있습니다.
유해한 편견 등의 부정적인 영향을 완화하는 것은 쉽지 않으며 업계에서도 매우 중요하게 생각하는 문제입니다. GPT‑3 논문(새 창에서 열기)과 모델 카드(새 창에서 열기)에서 논의한대로, 우리 API 모델은 생성된 텍스트에 반영될 편견을 나타냅니다. 이러한 문제를 다루는 단계는 다음과 같습니다.
- OpenAI는 개발자가 잠재적인 안전 문제를 이해하고 처리하도록 사용 가이드라인을 개발했습니다.
- 사용자와 긴밀히 협력하여 사용 사례를 파악하고 유해한 편견을 드려내고 완화하기 위한 도구를 개발하고 있습니다.
- 유해한 편견의 발현과 공정성 및 표현의 광범위한 문제에 대한 자체 연구를 수행하고 있으며, 이는 기존 모델의 개선된 문서화뿐만 아니라 향후 모델의 다양한 개선을 통해 우리 작업에 정보를 제공하는 데 도움이 될 것입니다.
- OpenAI는 편견이 시스템과 배포된 맥락의 교차점에서 나타나는 문제임을 인식하고 있습니다. 우리 기술로 구축된 애플리케이션은 사회기술적 시스템이므로, 개발자들과 협력하여 부작용을 모니터링하기 위한 적절한 프로세스와 휴먼인더루프(human-in-the-loop) 시스템을 적용하도록 보장합니다.
우리 목표는 각 사용 컨텍스트에서 API의 잠재적인 유해성에 대한 이해를 꾸준히 발전시키고 유해성을 최소화하는 데 도움이 되는 도구와 프로세스를 계속해서 개선하는 것입니다.
2020년 9월 18일 업데이트됨


