메인 콘텐츠로 건너뛰기
OpenAI

2026년 4월 16일

리서치릴리스

생명과학 연구를 위한 GPT‑Rosalind 소개

과학 연구와 신약 개발을 가속화하기 위해 설계된 새로운 전용 모델입니다.

오늘 OpenAI는 생물학, 신약 개발, 중개 의학 전반의 연구를 지원하도록 설계된 최첨단 추론 모델 GPT‑Rosalind를 소개합니다. 생명과학 모델 시리즈는 과학적 워크플로에 최적화되어 있으며, 향상된 툴 활용 능력과 화학, 단백질 공학, 유전체학 전반에 대한 깊은 이해를 결합합니다.

미국에서는 신약이 타깃 발견부터 규제 승인에 이르기까지 평균적으로 약 10년에서 15년이 소요됩니다. 발견의 초기 단계에서 이루어진 성과는 이후 단계에서 더 나은 타깃 선택, 더 탄탄한 생물학적 가설, 더 높은 품질의 실험으로 이어집니다. 생명과학의 발전은 기초 과학의 난이도뿐 아니라 연구 워크플로 자체의 복잡성에도 제약을 받습니다. 과학자들은 새로운 아이디어를 생성하고 평가하기 위해 방대한 문헌, 전문 데이터베이스, 실험 데이터, 그리고 계속 발전하는 가설을 넘나들며 작업해야 합니다. 이러한 워크플로는 시간 소모가 크고 단절되어 있으며 확장하기 어렵습니다.

우리는 고급 AI 시스템은 기존 작업의 효율성을 높이는 데 그치지 않고, 더 많은 가능성을 탐색하고 놓치기 쉬운 연결을 발견하며 더 나은 가설에 더 빠르게 도달하도록 도와 연구자가 이러한 워크플로를 더 빠르게 진행할 수 있게 한다고 믿습니다. 이 모델은 근거 통합, 가설 생성, 실험 계획 수립 등 다단계 연구 작업을 지원하여 발견의 초기 단계를 가속화하도록 설계되었습니다. 시간이 지남에 따라 이러한 시스템은 생명과학 조직이 기존에는 불가능했던 돌파구를 더 높은 성공률로 발견하도록 도울 수 있습니다. 

GPT‑Rosalind는 현재 신뢰 기반 액세스 프로그램을 통해 자격을 갖춘 고객에게 ChatGPT, Codex, API에서 리서치 프리뷰 형태로 제공되고 있습니다. 또한 Codex용으로 무료로 사용할 수 있는 생명과학 연구 플러그인을 도입하여, 과학자들이 모델을 50개 이상의 과학 툴과 데이터 소스에 연결할 수 있도록 지원합니다. Amgen, Moderna, Allen Institute, Thermo Fisher Scientific 등과 협력하여 연구와 발견을 가속화하는 다양한 워크플로에 GPT‑Rosalind를 적용하고 있습니다.

이 모델은 DNA 구조를 밝혀내고 현대 분자생물학의 기초를 마련하는 데 기여한 Rosalind Franklin의 이름을 따서 명명되었습니다.

원시 데이터에서 근거 기반의 발견 의사결정에 이르기까지, 전용으로 설계된 모델이 연구 워크플로를 어떻게 가속화하는지 확인하세요.

과학 워크플로를 위한 설계

GPT‑Rosalind 생명과학 모델 시리즈는 출판된 연구 결과, 데이터, 툴, 실험 전반에 걸친 현대 과학 작업을 위해 설계되었습니다. 당사의 평가에서 이 모델은 분자, 단백질, 유전자, 생물학적 경로, 질병 관련 생물학에 대한 추론이 필요한 작업에서 최고 수준의 성능을 보였으며, 문헌 검토, 서열-기능 해석, 실험 계획, 데이터 분석과 같은 다단계 워크플로에서 과학 툴과 데이터베이스를 더욱 효과적으로 활용합니다.

이는 GPT‑Rosalind 생명과학 모델 시리즈의 첫 번째 출시이며, 앞으로도 장기적이고 다양한 툴을 활용하는 과학 워크플로 전반에서 모델의 생화학적 추론 역량을 지속적으로 확장해 나갈 예정입니다. OpenAI의 컴퓨팅 인프라는 실제 과학 작업을 기반으로 점점 더 고도화되는 도메인 모델을 지속적으로 학습, 평가, 개선할 수 있게 하며, 워크플로가 복잡해질수록 이러한 시스템이 더욱 유용해지도록 지원합니다.

근거 기반 발견 인사이트에서 높은 영향력의 실험에 이르기까지, OpenAI의 솔루션이 연구 워크플로에서 측정 가능한 개선으로 어떻게 이어지는지 확인하세요.

고객 및 에코시스템

OpenAI는 선도적인 제약, 바이오테크, 연구 고객 및 생명과학 기술 조직과 협력하여 발견을 촉진하는 다양한 워크플로에 GPT‑Rosalind를 적용하고 있습니다.

“생명과학 분야는 모든 단계에서 정밀성을 요구합니다. 질문은 매우 복잡하고, 데이터는 매우 독특하며, 결과의 중요성은 매우 큽니다. OpenAI와의 독자적인 협력을 통해 가장 첨단의 기능과 툴을 새로운 방식으로 적용할 수 있게 되었으며, 이를 통해 환자에게 의약품을 제공하는 과정을 가속화할 수 있는 잠재력을 갖추고 있습니다.”
—Sean Bruich, Amgen 인공지능 및 데이터 부문 수석 부사장

성능 및 평가

OpenAI는 과학적 발견과 산업 연구에 핵심적인 다양한 역량을 기준으로 GPT‑Rosalind를 평가했습니다. 이 평가는 화학 반응 메커니즘, 단백질 구조, 돌연변이 효과 및 상호작용, DNA 서열의 계통학적 해석 등 과학 하위 분야 전반의 핵심 추론 능력을 측정합니다. 또한 실험 결과 해석, 전문가 수준의 패턴 식별, 외부 정보 통합을 통한 후속 실험 설계 지원 여부를 평가하여 모델이 실제 연구 워크플로를 지원할 수 있는지 확인합니다. 마지막으로 모델이 추론을 보완하기 위해 적절한 계산 툴, 데이터베이스, 도메인별 기능을 선택하고 활용할 수 있는지를 평가합니다. 이러한 평가 결과를 종합하면 과학 연구의 전체 과정 전반에서 진전이 나타났으며, 어려운 발견 과제를 해결하는 데 있어 연구자를 더욱 효과적으로 지원할 수 있는 역량이 향상되었음을 보여줍니다.

프롬프트

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

산업 평가

GPT‑Rosalind를 여러 공개 벤치마크를 통해 평가했습니다. 실제 생물정보학 및 데이터 분석을 기반으로 설계된 벤치마크인 BixBench에서 GPT‑Rosalind는 점수가 공개된 모델 중 최고 수준의 성능을 달성했습니다.

문헌 검색, 데이터베이스 접근, 서열 조작, 프로토콜 설계 등 다양한 연구 작업의 성능을 측정하는 벤치마크인 LABBench2에서는 GPT‑Rosalind가 11개 과제 중 6개에서 GPT‑5.4보다 높은 성능을 보였습니다. 가장 두드러진 개선은 분자 클로닝 프로토콜을 위해 DNA와 효소 시약을 처음부터 끝까지 설계해야 하는 CloningQA에서 나타났습니다.

또한 AI 기반 유전자 치료를 선도하는 Dyno Therapeutics와 협력하여, 공개되지 않고 오염되지 않은 서열을 활용한 RNA 서열-기능 예측 및 생성 작업에서 모델을 평가했습니다. 성능은 AI-생명과학 분야 인간 전문가의 과거 57개 평가 점수와 비교되었습니다. Codex 앱에서 직접 평가했을 때, 10회 시도 중 최고 성과 기준으로 예측 작업에서는 인간 전문가 상위 95번째 백분위수 이상, 서열 생성 작업에서는 약 상위 84번째 백분위수 수준의 성과를 기록했습니다.

이러한 평가는 과학자들이 증거를 만들고 복잡한 데이터를 분석하며 신뢰할 수 있는 생물학적 결론에 도달하기 위해 일상적으로 사용하는 워크플로에서의 성능을 보여주는 의미 있는 지표입니다.


과학자가 사용하는 툴과의 연계

과학자는 현재 GitHub에서 제공되는 Codex용 생명과학 연구 플러그인(새 창에서 열기)을 사용할 수 있습니다. 이 패키지는 대부분의 일반적인 연구 워크플로를 위한 다양한 모듈형 기능을 포함하고 있으며, 인간 유전학, 기능 유전체학, 단백질 구조, 생화학, 임상 근거, 공개 연구 탐색 전반에서 작업할 수 있도록 지원합니다.

생명과학 플러그인 데모 정적 이미지

이러한 기능은 오케스트레이션 계층으로 작동하여, 과학자가 광범위하고 모호하며 다단계로 이루어진 질문을 보다 효과적으로 해결할 수 있도록 돕습니다. 또한 50개 이상의 공개 멀티오믹스 데이터베이스, 문헌 소스, 생물학 툴에 대한 접근을 제공하며, 단백질 구조 조회, 서열 검색, 문헌 검토, 공개 데이터 세트 탐색과 같은 반복 가능한 워크플로를 위한 유연한 시작점을 제공합니다.

자격을 갖춘 기업 사용자는 GPT‑Rosalind와 함께 이 플러그인을 활용해 더 깊은 생물학적 추론을 수행할 수 있으며, 모든 사용자는 주요 모델과 함께 해당 플러그인 패키지를 사용할 수 있습니다.

신뢰 기반 액세스

OpenAI는 생물학적 오용을 방지하기 위한 강력한 보호 장치를 유지하면서, 인류 건강 증진에 가장 크게 기여할 수 있는 과학자와 연구 기관에 이러한 기능을 제공하고자 합니다. 생명과학 모델은 초기에는 미국의 자격을 갖춘 기업 고객을 대상으로, 자격 요건, 액세스 관리, 조직 거버넌스에 대한 통제를 포함한 신뢰 기반 액세스 배포 구조를 통해 출시됩니다. 동시에 연구자들이 생명과학 연구 작업에서 주요 모델을 보다 효과적으로 활용할 수 있도록 다양한 커넥터와 생명과학 연구 플러그인을 더 폭넓게 제공합니다. 

생명과학 모델은 강화된 기업 수준의 보안 통제와 액세스 관리 기능을 바탕으로 개발되어, 통제된 연구 환경에서 전문적인 과학적 활용이 가능하도록 설계되었습니다. OpenAI는 유익한 사용, 강력한 거버넌스 및 안전 감독, 기업 수준 보안을 갖춘 통제된 액세스라는 세 가지 핵심 원칙에 따라 액세스를 평가합니다. 실제로 이는 참여 기관이 명확한 공익적 이익이 있는 정당한 과학 연구를 수행하고 있어야 하며 적절한 거버넌스, 규정 준수 및 오용 방지 통제를 유지하고, 안전하고 체계적으로 관리된 환경에서 승인된 사용자에게만 액세스를 제한해야 함을 의미합니다. 또한 조직은 생명과학 연구 프리뷰 약관에 동의하고 OpenAI의 사용 정책을 준수해야 하며, 온보딩 또는 지속적인 참여 과정에서 추가 정보를 요청받을 수 있습니다.

시작하기

조직은 자격 심사 및 안전 검토 절차를 통해 액세스를 요청할 수 있습니다.

리서치 프리뷰 기간 동안 이 모델의 사용은 오용 방지 기준이 적용되는 범위 내에서 기존 크레딧이나 토큰을 소모하지 않습니다. 프로그램이 확대됨에 따라 가격 및 이용 가능성에 대한 추가 정보를 제공할 예정입니다.

생명과학 모델은 기술적 역량과 운영 통제가 모두 요구되는 환경에서 과학 조직이 더 높은 품질의 작업을 더 빠르게 수행할 수 있도록 설계되었습니다. 전담 생명과학 팀과 McKinsey & Company, Boston Consulting Group(BCG), Bain & Company 등의 자문 파트너는 조직이 높은 영향력의 활용 사례를 발굴하고, 모델을 기업 환경에 통합하며, 측정 가능한 성과를 창출할 수 있도록 지원합니다. OpenAI Life Sciences가 업무를 어떻게 지원할 수 있는지 알아보고 싶다면 생명과학 팀에 문의할 수 있습니다.

향후 계획

이는 생명과학 모델 시리즈의 첫 번째 출시이며, 인류 건강부터 광범위한 생물학 연구에 이르기까지 사회적으로 중요한 분야에서 과학적 발견을 가속화할 수 있는 AI를 구축하기 위한 장기적인 노력의 시작이라고 생각합니다. 앞으로 모델의 생물학적 추론 능력을 지속적으로 개선하고, 다양한 툴을 활용하는 장기 연구 워크플로에 대한 지원을 확대하며, 실제 영향 평가를 위해 주요 과학 기관과 긴밀히 협력할 예정입니다. 여기에는 로스앨러모스 국립 연구소와 같은 국립 연구소와의 지속적인 협력도 포함되며, 핵심 기능적 특성을 유지하거나 개선하면서 생물학적 구조를 수정하는 AI 시스템의 역량을 포함한 AI 기반 단백질 및 촉매 설계를 탐색하고 있습니다. 

시간이 지남에 따라 이러한 시스템은 발견 과정에서 점점 더 강력한 파트너로 발전하여, 과학자가 질문에서 증거로, 증거에서 인사이트로, 인사이트에서 환자를 위한 새로운 치료로 더 빠르게 나아갈 수 있도록 도울 것으로 기대합니다.