2026年6月3日

GPT‑Rosalind の新機能

ライフサイエンス業界に、実際の科学ワークフローに基づくより高度な知能を提供。

エンタープライズ規模のライフサイエンス研究向けに特化した GPT‑Rosalind シリーズの新しいモデルアップデートを発表します。GPT‑5.5 のエージェント型コーディングとツール利用能力に、創薬化学やゲノミクスなど中核的な創薬領域でのより強いモデル知能を組み合わせ、ライフサイエンス全般の分析、設計、実験ワークフローでも性能を高めています。

ライフサイエンスの進展は、分子、遺伝子、経路、生体システムというスケールとモダリティをまたいでデータとエビデンスを統合することに依存しています。私たちの評価では、更新された GPT‑Rosalind は、生物学の専門家による研究タスク、複雑な創薬化学の問い、定量生物学、ウェットラボのトラブルシューティングで幅広い性能向上を示しています。

GPT‑Rosalind は現在、信頼できる組織に限定して提供する導入モデルを通じ、世界中の対象組織に研究プレビューとして提供されています。

科学的価値の高いタスクでの性能向上

GPT‑Rosalind の実世界での影響を測定し継続的に改善するため、私たちはライフサイエンス研究の基礎的側面に焦点を当て、外部専門家が評価するベンチマーク LifeSciBench を設計しました。モデル性能の単一要素や生物学領域を個別に評価する既存ベンチマークとは異なり、LifeSciBench は、エビデンス処理、分析、設計と最適化、科学的推論、検証と運用、翻訳とコミュニケーションという、ライフサイエンス研究の中核となる 6 つのワークフロー領域からタスクを抽出し、科学的に価値のある作業をエンドツーエンドで捉えます。私たちはこのベンチマークを用いて、進歩をライフサイエンス研究のニーズと現実に合わせています。

GPT‑Rosalind は、業界および学術界の専門家が特定した科学的価値の高いタスク全体で性能をリードしています。

論文、図、表、実験記録から科学的エビデンスを抽出、照合、監査すること。

評価例

We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.

Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:

Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.

Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.

回答の候補

結論：提示された内容では、このパッケージは臨床的ベネフィットを予測する可能性が合理的に高い代替エンドポイントとして、マイクロジストロフィン発現に基づく迅速承認を支持するほど強くありません。懐疑的な FDA 審査官は、バイオマーカー、機能、持続性、安全性、一般化可能性のエビデンスが実質的に不十分だと見る可能性が高いです。

パッケージ項目	主な失敗モード	必要となるもの
ウェスタンブロット定量	MANEX1A は内因性の全長ジストロフィンとマイクロジストロフィン導入遺伝子が共有する N 末端エピトープに結合するため、このアッセイは導入遺伝子と残存/リバーティントジストロフィンを明確に区別できません。138 kDa のマイクロジストロフィンを健常な全長ジストロフィン標準に対して定量することも無効です。	組換えマイクロジストロフィン標準と、標的質量分析や導入遺伝子特異的/エピトープ特異的アッセイなど、導入遺伝子を内因性ジストロフィンから区別する直交的手法を使用します。
免疫蛍光	138 kDa コンストラクトは C 末端ドメインを欠くため、C 末端ポリクローナル抗体は適していません。多くの DMD 患者にはリバーティント線維があり、リバーティントジストロフィンは C 末端エピトープを保持し得ます。リバーティント線維は加齢とともにクローン性に拡大し、特に年長男児で IF シグナルにバイアスを生じさせる可能性があります。	導入遺伝子には存在し、リバーティントジストロフィンには存在しないエピトープに対する抗体で IF を再実施します。導入遺伝子陽性線維をリバーティント線維とは別に定量します。
代替エンドポイントの妥当性	このパッケージはタンパク質量と臨床機能を混同しています。「健常対照タンパク質量の 38%」は、マイクロジストロフィンが構造的に短縮されているため、正常ジストロフィン機能の 38% を意味しません。	発現を代替エンドポイントとして扱う前に、マイクロジストロフィン量の割合、筋鞘局在、下流機能回復、臨床的ベネフィットの関係を実証的に検証します。
生検設計	治療前後の対側外側広筋生検は、左右差と筋内の空間的ばらつきを導入します。疾患進行と線維脂肪置換も、総タンパク質正規化シグナルを変化させる可能性があります。	一貫した解剖学的ランドマークで生検部位を標準化し、筋特異的タンパク質で正規化し、線維脂肪組成を並行して測定します。
NSAA 比較対象/統計	外部の自然歴コホートは、ランダム化された同時対照ではありません。試験適格性、支持療法、参加効果、ベースライン NSAA、ステロイドレジメン、年齢、エクソンクラスはいずれも比較にバイアスを与え得ます。対応のない t 検定では不十分です。また、+1.4 の NSAA 変化はこの年齢群のテスト再テスト変動内です。	ランダム化された同時プラセボ対照試験を実施するか、少なくともベースライン NSAA、年齢、ステロイドレジメン、エクソンクラス、その他の交絡因子を考慮した調整解析を使用します。
年齢ウィンドウの交絡	4〜7 歳の男児は、未治療の歩行可能 DMD 患者で低下が支配的になる前に運動機能が向上し得る発達段階にあります。48 週間の NSAA 変化は、発達による向上、疾患進行、治療効果の可能性を混在させます。	年齢層別化を伴う同時ランダム化対照を用いて、発達軌跡を治療効果から分離します。
先行する臨床的前例	オープンラベルのマイクロジストロフィン機能シグナルは、確認的なベネフィットを一貫して予測していません。公表された前例には、マイクロジストロフィン遺伝子治療の確認試験がオープンラベルの NSAA 改善を再現できなかった例が含まれます。	オープンラベルの NSAA 変化を決定的な支持として依拠しないでください。対照付きの機能エビデンスを求めます。
コンストラクトの構造的限界	138 kDa コンストラクトは、nNOS 結合部位を含むスペクトリンリピート R16/17 を欠失しています。nNOS リクルートメントの喪失は、運動中の機能的交感神経溶解と虚血保護を損ない、発現レベルとは独立に救済効果の機序的上限を作る可能性があります。	この特定のコンストラクトが関連するジストロフィン関連複合体機能、nNOS 局在、運動生理、筋保護を回復するかを示す機序研究を追加します。
AAV 持続性	12 週時点のベクターゲノムは、持続的発現を確立しません。AAV9 ゲノムは主に非組込み型エピソームであり、時間とともに減少する可能性があります。ベクターゲノムの持続は、タンパク質発現の持続と同じではありません。	12 週を超えて、導入遺伝子タンパク質発現と機能バイオマーカーの持続性を縦断的に測定します。
免疫/安全性プロファイル	12 例中 8 例のトランスアミナーゼ上昇は、AAV 導入細胞への免疫応答と整合しますが、機序は確立されていません。AAV9 の心臓指向性を考えると、心筋炎 1 例は懸念されます。	より深い免疫モニタリング、肝/心臓安全性の特性評価、強化された心臓フォローアップを提供します。
患者選択/一般化可能性	抗 AAV9 中和抗体陽性患者を除外すると、一般化可能性が制限されます。エクソン 44 欠失を除外すると、その DMD サブグループへの適用可能性が制限されます。n=12 は、より広い DMD 集団で安全性と有効性を特徴付けるには小さすぎます。	結果を広範な承認の支持に使う前に、可能な場合は適格性を広げるか、抗体状態、遺伝子型/エクソンクラス、年齢、ベースライン機能による層別解析を事前規定します。

規制上の結論：このパッケージは生物学的活性を示す可能性はありますが、測定されたマイクロジストロフィン発現が臨床的ベネフィットを予測する可能性が合理的に高い信頼できる代替指標であることは、まだ確立していません。主なギャップは、アッセイ特異性、無効な定量標準、リバーティント線維による交絡の可能性、ランダム化対照の欠如、年齢関連 NSAA 交絡、不確実な持続性、未解決の安全性/一般化可能性の問題です。

ギャップを埋めるには、導入遺伝子特異的発現アッセイ、直交的タンパク質定量、組織組成コントロール、縦断的持続性データ、短縮コンストラクトの機序的機能アッセイ、特に肝臓と心臓のより強力な安全性モニタリングを備えた、対照付き・年齢層別化された臨床設計が必要です。

ルーブリックの条件とグレード

条件

得点

Identifies assay/measurement problems in micro-dystrophin quantification, including MANEX1A epitope sharing, invalid full-length dystrophin standards, and need for recombinant or orthogonal transgene-specific measurement.

+24

Explains why micro-dystrophin expression level is not automatically a valid surrogate for functional clinical benefit.

+22

Flags biopsy-site, tissue-composition, and age-window confounding that weaken expression and NSAA interpretation.

+19

Critiques the NSAA comparator/statistics, especially reliance on external natural-history controls.

+12

Addresses AAV durability, immune response, transaminitis, myocarditis, and need for longer-term expression/safety follow-up.

+15

Notes patient-selection/generalizability gaps, including anti-AAV9 exclusion, exon-44 exclusion, and small sample size.

より強力な科学的推論

創薬化学

GPT‑Rosalind は、分子を有用な医薬品へ変えることに焦点を当てる創薬化学で、業界をリードする性能を達成しています。私たちは MedChemBench を、現実的な創薬化学ワークフローを反映するよう設計しました。マルチモーダルな化学構造理解、構造活性相関（SAR）、薬効、毒性、吸収・分布・代謝・排泄（ADME）の予測、多パラメータのリード最適化意思決定、逆合成を評価します。GPT‑Rosalind は MedChemBench で GPT‑5.5 の 25.1% に対して 27.5% と上回り、使用トークンは 7.2% 少なくなっています。

GPT‑Rosalind は創薬化学において、より優れたマルチモーダル統合と機序的推論を示しています。

ゲノミクスと定量生物学

ゲノミクスと定量生物学の長期的なエンドツーエンド分析に関する私たちのエージェント型評価 GeneBench では、GPT‑Rosalind は GPT‑5.5 より 31% 少ないトークンで、21.6% 対 20.4% と高い精度を達成しています。GeneBench は、長期的な定量タスクでのエージェント型性能を評価します。現実的な科学データに基づき、エージェントが有効な分析、QC、モデリング、補正を計画し、意思決定に関連する答えに到達できるかを測ります。含まれる問題は、機能ゲノミクス、空間トランスクリプトミクス、プロテオミクス、エピゲノミクス、応用遺伝学など、さまざまな領域に及びます。

GPT‑Rosalind は GPT‑5.5 より 31% 少ないトークンで精度を向上させています。

実世界のラボ作業の支援

実世界でラボ作業を行う科学者を GPT‑Rosalind が支援する能力をテストする新しい評価を導入します。LabWorkBench は、科学者が使用する実際のウェットラボプロトコルにおいて、トラブルシューティングから最適化までの目的で、摂動を実験結果に結び付けるモデルの能力をテストします。LabWorkBench で使用されるデータは専有データであるため、汚染されていません。GPT‑Rosalind は GPT‑5.5 の 55.8% に対して 63.2% を記録し、使用トークンは 5.3% 少なくなっています。

実際のウェットラボプロトコル支援において、GPT‑Rosalind は GPT‑5.5 を大きく上回り、トークン効率も向上しています。

推論から実行済みワークフローへ

私たちは Life Sciences Research⁠（新しいウィンドウで開く）と Life Sciences NGS Analysis⁠（新しいウィンドウで開く）プラグインを構築し、GPT‑Rosalind の高まった知能を、反復可能な科学ワークフローの実践的な実行レイヤーで拡張しました。これらのプラグインは、出典付きエビデンス検索、生物学的解釈、バイオインフォマティクス実行を同じワークスペースに統合し、アーティファクトと来歴を保持しながら、研究者が外部エビデンスと内部オミクス分析を結び付けられるよう支援します。すべてのユーザーが、Codex を通じて両方のプラグインにアクセスできるようになりました。対象となる GPT‑Rosalind エンタープライズユーザーは、さらに GPT‑Rosalind を使ってこれらのプラグインを動かすことができます。

科学者のための動的なワークベンチとして Codex をより活用できるよう、生物学でネイティブに使われるファイルタイプ向けのインタラクティブビューアを追加しました。最初の配列、アラインメント、構造ビューアは、GPT‑Rosalind がワークフロー全体で推論する中で科学者がエビデンスに近い場所にいられるよう設計されており、アクティブなビューアをコンテキスト内で使ってフォローアップ質問に直接答えられます。

上のデモでは、GPT‑Rosalind によってオーケストレーションされたこれらの機能の実際の動作を示しています。リキッドバイオプシーを調べ、治療に役立つ可能性のある変異やその他の分子変化を特定する科学者を追います。Life Sciences NGS Analysis プラグインは、処理済み ctDNA 記録のレビューをインタラクティブなノートブックに変換し、繰り返し見られる変異、低頻度コール、サンプルの推移を浮かび上がらせ、調査を KRAS G12C に集中させます。そこから Life Sciences Research プラグインが、出典付きの標的、阻害剤、耐性に関するコンテキストを追加し、ネイティブの配列、アラインメント、構造ビューアにより、科学者は変異残基 12、RAS ファミリー全体での保存性、阻害剤結合ポケットを直接確認できます。ワークフローは、そのエビデンスを具体的なフォローアップ選択肢に変換して完了し、各ステップとアーティファクトは専門家レビューに利用できます。

コンピューター画面に、ctDNA 変異データを探索するために NGS Analysis プラグインの使用を指示するワークスペースが表示されています。画面には「Top detailed histologies」と「Top altered genes by mutated cfDNA samples」とラベル付けされた複数の棒グラフがあり、がん種と遺伝子変化に関するデータを表示しています。テキストはデータセット、主要な所見、分析パラメータを説明しています。 — Life Sciences NGS Analysis プラグイン

scRNA-seq QC & アノテーション

分割画面のバイオインフォマティクスワークフローのスクリーンショット。左側のパネルには、AI アシスタントが完了した単一細胞 RNA シーケンシング（scRNA-seq）品質管理分析を要約しており、生成ファイル、QC 指標、UMAP 可視化、細胞型アノテーションが含まれます。右側のパネルには「scRNA QC Review」レポートが表示され、総カウント、検出遺伝子、ミトコンドリア割合のヒストグラムと、QC 合否数およびフィルター済み細胞集団を示す棒グラフがあります。インターフェースは青と緑のグラデーション背景上に表示されています。 — 10x 形式のマトリクスバンドルを、Codex で検査して修正できる QC フィルター済み単一細胞アーティファクト、アノテーション、UMAP に変換します。Life Sciences NGS Analysis プラグインはリクエストを scrna-seq-qc にルーティングし、データから QC 閾値を選択し、フィルタリングとアノテーションの来歴を保持し、ダブレット検出依存関係の欠如などのブロッカーを表示します。

バルク RNA-seq FASTQ QC

RNA-seq ワークフローの分割画面ビュー。左側では AI アシスタントが完了したバルク RNA-seq 品質管理結果を要約し、右側にはシーケンシング統計と Salmon 指標を含むインタラクティブな MultiQC レポートが表示されています。 — バルク RNA-seq のサンプルシート、FASTQ バンドル、参照ファイルを、Codex で検査して再利用できる QC レビュー済みカウントバンドルに変換します。Life Sciences NGS Analysis プラグインはリクエストをルーティングし、入力を検証し、MultiQC、Salmon マトリクス、来歴、明示的な注意点を含む監査可能な実行エンベロープを返します。

信頼できる組織へのアクセス拡大

GPT‑Rosalind シリーズへのアクセスを、世界中の対象組織に拡大しています。GPT‑Rosalind は、明確な公益性を持つ正当な科学研究を実施し、強力なガバナンスと安全監督を備え、エンタープライズ級のセキュリティでアクセスを管理している組織向けに、信頼できる組織に限定して提供する導入モデルを通じて研究プレビューとして提供されます。

このグローバル展開の一環として、GPT‑Rosalind によって Novo Nordisk の医学研究の拡張を支援し、革新的な治療選択肢をより早く患者に届けるという同社のミッションを支援できることをうれしく思います。Novo Nordisk はフロンティア AI の能力を活用し、研究者が複雑なデータセットを分析し、有用なパターンを発見し、仮説をより迅速に検証できるよう支援しています。GPT‑Rosalind のより強い生物学的理解は、文献、ゲノミクス、トランスクリプトミクス、配列、構造、実験結果をまたいでチームがエビデンスを結び付けるのを助け、データからより明確な研究判断へ進みやすくします。

「ライフサイエンス研究は複雑で、データが豊富で、学際的です。研究者に意味ある価値を提供するには、高度な AI モデルが信頼できる科学データに基づき、検証済みツールとつながり、研究者が日々使う実世界のワークフローに統合されている必要があります。OpenAI とのパートナーシップと、GPT‑Rosalind が創薬へのより厳密で実践的なアプローチをどのように支援できるかを探る機会をうれしく思います」

Mishal Patel、グループ・バイスプレジデント、AI & Digital Innovation、R&D - Novo Nordisk

Enterprise アカウントを持たない対象組織向けに、OpenAI 管理のワークスペースの提供も開始しています。

アクセスをリクエスト

今後について

更新された GPT‑Rosalind は、高度な生物学的能力が適切な安全策とともに展開されることを確保しながら、科学的発見の加速を支援できる AI システムを構築するという私たちのより広い取り組みの次の一歩です。私たちは、モデルの生物学的推論を改善し続け、ツールを多用する長期的な研究ワークフローへの対応を拡大し、地域をまたいで対象組織と協力して実世界での影響を評価していきます。

これは、創薬やトランスレーショナル医療から公衆衛生、公衆衛生上の備え、バイオディフェンスまで、ライフサイエンス AI を影響の大きい公益的な取り組みに適用することも意味します。Rosalind Biodefense と信頼できる組織に限定して提供する導入モデルを通じて、人間の健康を改善し社会のレジリエンスを強化するために取り組む研究者、機関、防衛担当者の手に、フロンティアの生物学的能力を届けることを目指しています。

私たちは、GPT‑Rosalind を科学研究の全ライフサイクルでより有能なパートナーへと引き続き構築し、科学者が適切な問いから、より明確なエビデンス、より良い実験、そして最終的には患者のための新しい治療へ、より迅速に進めるよう支援します。

さらに読む

すべてを表示

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6、Microsoft 365 Copilot の新たな優先モデルに

製品2026年7月9日

GPT-5.6：目標に合わせて拡張するフロンティアインテリジェンス

製品2026年7月9日

ChatGPT は、あなたの最も意欲的な取り組みのパートナーに

製品2026年7月9日