2026年4月16日

ライフサイエンス研究向け GPT‑Rosalind

科学研究と創薬を加速するために設計された新しいモデル

本日、OpenAI は、生物学、創薬、トランスレーショナルメディシンにわたる研究を支援するために設計されたフロンティアのリーズニングモデル GPT‑Rosalind を発表しました。ライフサイエンス向けモデルシリーズは、科学研究のワークフローに最適化されており、化学、タンパク質工学、ゲノミクスにおいて、ツール活用の向上と理解の深化を両立しています。

米国では、新薬が標的の発見から規制当局の承認に至るまで、平均で約10年から15年を要します。創薬の初期段階で得られた成果は、その後の工程に積み重なり、より適切な標的の選定、より確かな生物学的仮説、そしてより質の高い実験につながります。ライフサイエンスの進展は、基礎科学の難しさだけでなく、研究ワークフロー自体の複雑さにも制約されています。科学者は、新たなアイデアを生み出し評価するために、膨大な文献、専門データベース、実験データ、変化し続ける仮説を横断して扱う必要があります。こうしたワークフローは、多くの場合、時間がかかり、分断されがちで、拡張しにくいという課題があります。

私たちは、高度な AI システムによって、研究者がこれらのワークフローをより迅速に進められるようになると考えています。単なる効率化にとどまらず、より多くの可能性を探り、見逃されがちな関連性を捉え、より適切な仮説に早く到達できるよう支援します。本モデルは、エビデンスの統合、仮説生成、実験計画などの複数ステップにわたる研究タスクを支援し、発見の初期段階を加速することを目的に設計されています。こうしたシステムは、将来的に、これまで実現が難しかったブレークスルーの創出を可能にし、成功率の向上にも寄与すると期待されます。

GPT‑Rosalind は現在、trusted access program（審査制アクセスプログラム）を通じて対象のお客様に提供されており、ChatGPT、Codex、API で研究プレビューとして利用できます。また、Codex 向けに、50以上の科学ツールやデータソースと接続できるライフサイエンス研究プラグインを無償で提供します。Amgen、Moderna、Allen Institute、Thermo Fisher Scientific などの企業・研究機関と連携し、研究や発見を加速するさまざまなワークフローで、GPT‑Rosalind の活用を進めています。

本モデルは、DNA 構造の解明に貢献し、現代分子生物学の基盤を築いたロザリンド・フランクリンにちなんで命名されています。

生データから根拠に基づく意思決定まで、専用設計のモデルが研究ワークフローをどのように加速するかをご覧ください。

科学研究のワークフローに最適化されたモデル

GPT‑Rosalind のライフサイエンス向けモデルシリーズは、公開されたエビデンスやデータ、ツール、実験を横断する現代の研究業務に対応するよう設計されています。当社の評価では、分子、タンパク質、遺伝子、経路、疾患関連の生物学に関する推論を伴うタスクで高い性能を示しています。また、文献レビュー、配列から機能への解釈、実験計画、データ解析といった複数ステップのワークフローにおいて、科学ツールやデータベースをより効果的に活用できます。

本リリースは GPT‑Rosalind ライフサイエンスモデルシリーズの第1弾です。今後も、長期的かつツール活用の多い科学ワークフローに対応しながら、生化学的推論能力のさらなる向上を目指します。OpenAI の計算インフラにより、実際の科学タスクに基づいてドメインモデルの学習、評価、改善を継続的に行うことが可能です。ワークフローの複雑化に伴い、こうしたシステムの有用性も高まっていきます。

エビデンスに基づく洞察からインパクトの高い実験まで、当社のソリューションが研究ワークフローの改善にどのような成果として表れるかをご覧ください。

顧客とエコシステム

製薬、バイオテクノロジー、研究分野をリードする企業や、ライフサイエンス関連のテクノロジー企業と連携し、発見を加速するさまざまなワークフローで GPT‑Rosalind の活用を進めています。

「ライフサイエンス分野では、あらゆる段階で精度が求められます。問いは非常に複雑で、データも極めて特殊、そして求められる精度も非常に高い領域です。OpenAI との独自の協業により、同社の最先端の能力やツールを新しい形で活用し、患者さんに医薬品を届けるスピードをさらに高められる可能性があります。」

—Amgen AI・データ担当シニアバイスプレジデント、Sean Bruich 氏

パフォーマンスと評価

科学的発見や産業研究に不可欠なさまざまな能力について、GPT‑Rosalind を評価しました。これらの評価では、化学反応機構、タンパク質の構造・変異の影響・相互作用、DNA 配列の系統学的解釈など、各分野における中核的な推論能力を測定しています。また、実験結果の解釈、専門的に重要なパターンの特定、外部情報の統合による追加実験の設計を通じて、実際の研究ワークフローを支援できるかどうかも評価しています。さらに、推論を補強するために、適切な計算ツールやデータベース、分野固有の機能を選択・活用できるかも検証しています。これらの結果から、科学研究の一連のプロセス全体にわたる進展が確認されており、研究者が難易度の高い発見タスクに取り組むうえでの支援能力が向上していることが示されています。

プロンプト

I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well.

業界ベンチマーク評価

GPT‑Rosalind を複数の公開ベンチマークで評価しました。実務に近いバイオインフォマティクスおよびデータ分析を基に設計された BixBench では、スコアが公開されているモデルの中でトップクラスの性能を示しました。

文献検索、データベースアクセス、配列操作、プロトコル設計などの研究タスクを評価する LABBench2 では、11項目中6項目で GPT‑5.4 を上回る結果を示しました。特に顕著な改善が見られたのは CloningQA で、分子クローニングプロトコルに必要な DNA や酵素試薬の設計を一貫して行うタスクです。

また、AI による遺伝子治療の開発を先導する Dyno Therapeutics と連携し、未公開かつ汚染のない配列を用いた RNA 配列の機能予測および生成タスクでモデルを評価しました。本モデルの性能を、AI-bio 分野の専門家による過去57件のスコアと比較しました。Codex アプリで直接評価した場合、10回の試行のうち最良の結果は、予測タスクで人間の専門家の上位95パーセンタイルを上回り、配列生成タスクでは約84パーセンタイルに達しました。

これらの評価は、科学者が日常的に行う、エビデンスの生成、複雑なデータの解析、妥当性の高い生物学的結論の導出といったワークフローにおける性能を示す指標となります。

科学者が使うツールと連携

科学者は、GitHub で本日より利用可能な Codex 向けのライフサイエンス研究プラグイン⁠（新しいウィンドウで開く）を利用できます。このパッケージには、一般的な研究ワークフローの大半に対応するモジュール型のスキル群が含まれており、ヒト遺伝学、機能ゲノミクス、タンパク質構造、生化学、臨床エビデンス、公開研究の探索など、幅広い領域にまたがる作業を支援します。

これらのスキルは、科学者が幅広い領域にまたがる複雑で曖昧な問いにも、より効率的に取り組めるよう支援します。50以上の公開マルチオミクスデータベース、文献ソース、生物学ツールへのアクセスを提供し、タンパク質構造の参照、配列検索、文献レビュー、公開データセットの探索といった一般的な反復ワークフローの出発点として活用できます。

対象となる Enterprise ユーザーは、GPT‑Rosalind を用いた研究ワークフローで本プラグインを活用し、より高度な生物学的推論を行えます。一方、すべてのユーザーは、当社の主力モデルと組み合わせてプラグインパッケージを利用できます。

Trusted Access（審査制アクセス）

私たちは、生物学的悪用に対する強固なセーフガードを維持しつつ、人の健康向上に貢献できる科学者や研究機関に、これらの機能を提供したいと考えています。ライフサイエンスモデルは、まずは米国の適格な Enterprise 顧客を対象に、適格性、アクセス管理、組織ガバナンスに関する適切な管理体制を整えた trusted access（審査制アクセス）の枠組みで提供を開始します。同時に、一連のコネクタとライフサイエンス研究プラグインの提供範囲を拡大し、研究者がライフサイエンス研究のタスクで当社の主力モデルをより効果的に活用できるようにしています。

ライフサイエンスモデルは、強化されたエンタープライズグレードのセキュリティ制御とアクセス管理のもとで開発されており、ガバナンスが整備された研究環境で、専門的な用途に利用できます。アクセスは、有益な利用、強固なガバナンスと安全性の監督、エンタープライズグレードのセキュリティを備えた制御されたアクセスという3つの原則に基づいて評価されます。具体的には、参加組織は、明確な公益性を伴う正当な科学研究を実施していること、適切なガバナンス、コンプライアンス、不正利用防止の体制を維持していること、そして安全かつ適切に管理された環境内で承認されたユーザーのみにアクセスを限定することが求められます。また、組織はライフサイエンス研究プレビュー利用規約に同意し、OpenAI の利用ポリシーを遵守する必要があります。さらに、オンボーディングや継続利用の過程で追加情報の提出をお願いする場合があります。

ペアレンタルコントロールを設定する

組織は、当社の審査プロセス（適格性および安全性）を通じてアクセスを申請⁠できます。

研究プレビュー期間中、このモデルの利用では既存のクレジットやトークンは消費されません（不正利用防止のための制限が適用されます）。プログラムの拡大に伴い、価格や提供状況については、今後さらに詳しくお知らせします。

ライフサイエンスモデルは、技術力と運用管理の両方が求められる環境で、科学分野の組織が、より高品質な成果をより迅速に生み出せるよう設計されています。当社のライフサイエンス専門チームは、McKinsey & Company、Boston Consulting Group（BCG）、Bain & Company などのアドバイザリーパートナーとともに、組織が効果の高いユースケースを見極め、モデルをエンタープライズ環境に組み込み、成果につなげられるよう支援します。ライフサイエンス分野での活用をご検討の方は、ライフサイエンスチームまでお問い合わせ⁠ください。

今後の展開

これはライフサイエンスモデルシリーズの最初のリリースであり、人の健康から幅広い生物学研究まで、社会にとって重要な分野で科学的発見を加速する AI に向けた、長期的な取り組みの第一歩です。今後も、モデルの生物学的推論の改善を進めるとともに、ツールを多用する長期的な研究ワークフローへの対応を拡大し、主要な科学研究機関と連携して実社会での影響を評価していきます。これには、ロスアラモス国立研究所をはじめとする研究機関との継続的な連携も含まれます。こうした連携のもと、重要な機能特性を保ちながら生体構造を改変する AI の可能性も含め、タンパク質や触媒の設計に取り組んでいます。

今後、これらのシステムは発見を支えるパートナーとしてさらに進化し、科学者が問いからエビデンスへ、エビデンスから洞察へ、そして洞察から新たな治療法へと、より迅速に進められるようになることを期待しています。