2026年6月17日

準自律型 AI 化学者による医薬品化学の難反応の改善

Molecule.one の Maria と GPT‑5.4 が、試験基質の 80% 超で Chan-Lam カップリング収率を高める意外な添加剤を発見

OpenAI の科学分野での取り組みは、シンプルな信念に基づいています。高度な AI は科学者にとって強力なパートナーとなり、より多くのアイデアの探索、離れた概念の結び付け、より良い実験の設計、人類に役立つ発見の加速を支援できます。私たちはすでに、モデルが数学の新しい成果に貢献した初期の例を共有しています。これには、単位距離問題⁠に関する研究、理論物理学でのグルーオン振幅⁠に関する新成果、そして生物学で GPT‑5 が自動化ラボにおける無細胞タンパク質合成のコスト削減⁠を支援した例が含まれます。また、ライフサイエンス研究と創薬ワークフローを支援するために専用設計されたモデル、GPT‑Rosalind⁠ も導入しました。

このプロジェクトは、その流れを医薬化学へと広げるものであり、進歩は単なる推論だけで測ることはできません。仮説は、実際の分子や装置、実験ノイズを伴うラボ環境で通用しなければなりません。私たちは Molecule.one⁠（新しいウィンドウで開く）と連携し、GPT‑5.4 を、自律的な研究のために高スループット検査機関と統合されたエージェント型化学AIである「Maria」に接続し、いくつかの重要な反応クラスのうちの一つを改善するという、オープンエンドの目標を与えました。システムは研究提案を生成し、実験を設計・実施し、実験データを分析し、フォローアップ実験を提案しました。人間は誘導および評価用のプロンプトを設計し、テストする提案を選ぶことで、引き続き関与していました。また、実験計画に限定的な修正を加え、基本的なラボ作業を支援し、最終結果を独立して検証しました。

最も有望な提案である OAI-M1-03 は、化学者が炭素–窒素結合を形成するために用いる Chan–Lam カップリングのうち、難易度は高いものの有用な反応形式に焦点を当てていました。プロセス化学における Chan–Lam カップリングを改善するという自由度の高い目標から出発し、GPT‑5.4 は、第一級スルホンアミドを難度が高く価値の大きい基質クラスとして独自に特定し、TEMPO などの穏和な酸化剤によって反応を改善できる可能性があると提案しました。

Maria Lab での2サイクルの実験を通じて、そのアイデアは大幅な改善につながりました。最適化された条件下では、試験したボロン酸の88％、スルホンアミドの83％で収率が向上しました。平均収率は 16.6％から 25.2％に上昇し、収率が 30％を超える反応の割合は 15.6％から 37.5％に増加しました。その後、人間の化学者が代表的な反応をベンチスケールで再現しました。これらの実験によってマイクロリットル規模での結果が確認され、14組の基質ペアのうち11組で収率が向上し、その多くでは2倍を超える増加が見られました。これは、医薬化学者には、マイクロリットル規模のスクリーニング実験だけでなく、創薬で用いられる実際のラボワークフローでも機能する反応が必要だからです。

医薬化学のこの領域における改善は、特に期待の持てるものです。創薬では合成が大きなボトルネックとなることが多く、科学者が試験できるのは、自分たちで合成できるか、ほかの方法で入手できる分子に限られるためです。スルホンアミド基は、抗がん剤、抗菌薬、利尿薬など、幅広い治療領域の医薬品に見られます。しかし、第一級スルホンアミドとボロン酸の Chan–Lam カップリングは、従来、収率が低いという課題がありました。この反応形式の信頼性を高めることができれば、医薬化学者は、有用である可能性のある分子を合成し、探索するための、より幅広く実用的な方法を得られます。

これはまだ初期の結果ですが、私たちが目指すより大きな方向性、すなわち研究ループの多くの部分で科学者にとって価値あるパートナーになり得る AI システムの、もう 1 つの具体例を示しています。モデルは文献をレビューし、予想外のアイデアを提案し、実験の設計と分析を支援し、人間の化学者が評価できる科学的知見に到達しました。

Maria Lab：Molecule.oneのOAI-M1-03 で 10,080 件の反応を処理した、高スループットに特化した検査機関

化学の問題が重要な理由

有機化学は、すべての低分子医薬品に加え、農業、エレクトロニクス、材料科学の製品を支えています。多くの異なる出発物質に対して、同じ種類の化学結合を信頼性高く作れる反応は特に有用です。反応の収率が低かったり、望ましくない副生成物が多すぎたりすると、化学者は本来有望な分子を断念するか、別の経路の開発に多くの時間を費やさなければならない場合があります。このため合成は創薬における大きなボトルネックになります。科学者は一般に、自分たちが作れる、または別の方法で入手できる分子しか試験できません。

Chan–Lam カップリングは、医薬品に広く見られる炭素–窒素結合を形成できるため、医薬化学において有用です。しかし、この反応があらゆる分子クラスで同じようにうまく機能するわけではありません。特に、第一級スルホンアミドとボロン酸のカップリングは、従来、収率が低いという課題がありました。スルホンアミドは、がんや感染症の治療に用いられる医薬品に見られる重要な分子群です。この反応の信頼性を高めることができれば、医薬化学者は、有用である可能性のある分子を合成して探索するための、より幅広く実用的な方法を得られます。

GPT‑5.4 と Maria AI および Lab の接続

この統合システムは、相互に補完し合う能力を組み合わせたものです。Maria AIと協働する科学者が作成したプロンプトを専用の実行環境で GPT‑5.4 に与え、数千件の研究提案を生成して順位付けさせました。人間の化学者は、システムによる評価が最も高かった提案のうち少数をレビューし、ラボで検証する4件を選びました。次にMaria AIが、選ばれた大まかな計画を詳細な実験手順に変換し、数千件のハイスループット実験を実施して生データを解析し、構造化した結果をGPT‑5.4に返しました。

選定された4件の提案の一つである OAI-M1-03 は、スルホンアミド合成における Chan–Lam 反応の性能を向上させるため、TEMPO などの温和な酸化剤を使用することを提案しました。化学者たちは、この提案を意外で興味深いものだと受け止めました。このブログ記事および論文⁠（新しいウィンドウで開く）では、OAI-M1-03 の詳細な知見を紹介しています。また、OAI-M1-03 について、モデルの思考の連鎖を書き直した版⁠（新しいウィンドウで開く）も共有しています。

最終的な研究提案は、その後 Maria によって実験グリッドの生成に使われ、人間が軽微な修正を加えました。人間による最大の修正は、ジメチルスルホキシド、すなわち DMSO を溶媒として避けることでした。化学者たちは、比較に使うより強い酸化剤と反応する可能性を懸念したためです。

全プロセスには、3 月 4 日の最初のプロンプトから、6 月 4 日に OAI-M1-03 の結果を独立した専門家と共有するまで、3 か月を要しました。

私たちはこのワークフローを完全自律ではなく準自律と表現しています。プロセス全体を通じて、人間の化学者が依然として重要な判断を下したためです。モデルが主要な研究アイデアを提案する一方で、人間の化学者は高レベルの方向付けと判断を行い、実験の詳細を修正し、ラボ消耗品や試薬の準備を支援し、重要な実験を手作業で繰り返しました。

得られた知見

OAI-M1-03 は、ここで研究した第一級スルホンアミドの Chan–Lam カップリングに有用な添加剤として TEMPO を特定しました。最適化された条件下で、反応は2つの面で改善しました。平均収率が向上し、実用的な収率に達する基質の組み合わせも増えました。

2 サイクル全体で、Maria は合計 10,080 件の反応を実行しました。これは、化学者が毎日 3 件の反応を行っても 10 年で実行する数を上回ります。化学の結果は、少数の例だけで試験すると誤解を招くことがあるため、この規模は重要でした。ある出発物質のペアでは有望に見える反応が、より広い分子群では失敗することがあります。数千件の反応により、試験した 10 種の酸化剤の中から TEMPO を特定し、多様な組み合わせで効果が再現されることを確認し、その限界を見いだすことができました。

最初のラウンドのデータを分析した後、システムはフォローアップ仮説を検証するため、より焦点を絞った第 2 ラウンドの実験を提案しました。有用なフォローアップの知見の1つは、性能をほとんど落とさずに、TEMPO をはるかに安価な類似体である 4-hydroxy-TEMPO に置き換えられることでした。

TEMPO、4-hydroxy-TEMPO、4-oxo-TEMPO、PMP の性能を化学構造とともに比較するグラフ。

この結果は、Maria Lab のマイクロリットルスケールのスクリーニング形式を超えても維持されました。人間の化学者は代表的な反応をベンチスケールで手作業により再現し、14 組の基質ペアのうち 11 組で収率の増加を観察しました。8 組では増加が 2 倍を超えました。非常に小規模な実験では、より大きなスケールでは消えるアーティファクトが生じることがあるため、この再現は重要です。ベンチスケールでの検証は、科学誌に研究を発表する前の慣例でもあります。

Molecule.one のベンチスケール検証実験で使われた、ラベル付きのガラス製反応バイアル。

手作業によるベンチスケール検証の反応バイアル。

TEMPO はベンチスケールでも生成物の形成を改善

4人の外部の化学専門家が、OAI-M1-03 について説明したプレプリントをレビューしました。専門家による評価は、この結果に新規性があり、科学コミュニティと共有する価値があるという私たちの見解を裏付けるものでした。今後は、さらに厳しい検証が待っています。独立したラボで結果を再現できるか、また、より幅広い分子に対して化学者が有用性を認めるかが問われます。

“ハイスループット実験と最新のAIの融合は、科学的発見の新たなフロンティアを示しています。今回の新たな反応は、その可能性を力強く実証するものです。極めて穏和な条件と実用的な酸化剤により、医薬品合成で広く用いられている反応の一つに、幅広い基質適用範囲を実現しています。”

—Tim Cernak 氏、ミシガン大学医薬品化学准教授

3か月間に GPT‑5.4 が生成し、Maria が試験した残り3件の提案のうち、OAI-M1-02とOAI-M1-04は Maria Lab での実験によって裏付けられ、OAI-M1-01 は反証されました。これらの結果については、現在も分析が進められています。

限界

この研究は、モデルが有機化学で有用な貢献を行えることを示しています。単に文献を要約したり、単発の実験を提案したりする以上のことを行いました。具体的で意外性のある仮説を提案して人間のレビューに提示し、実験を設計し、実験データを解釈し、フォローアップ実験を設計しました。

これは、AI が化学研究プログラムを最初から最後まで独立して実行できることを示すものではありません。人間の判断は引き続き不可欠であり、ワークフローは専門的なハイスループット基盤に依存していました。また、この方法が他のカップリング反応、他の基質クラス、または製造条件に一般化できることを確立するものでもありません。

収率の推定値はハイスループットプラットフォームから得られたものであり、ベンチスケールでの検証は14組の代表的な基質ペアを対象としました。反応機構を解明し、基質の適用範囲を明確にし、異なるラボ条件下での性能を測定し、結果を独立して再現するには、さらなる研究が必要です。

安全への備え

化学分野の能力は、慎重に扱う必要があります。医学や材料科学を支援できる同じツールが、悪用される可能性もあるためです。私たちはこの研究の範囲を、正当な医薬化学上の課題、すなわち医薬品候補となり得る分子の合成に用いられる既知のカップリング反応の改善に意図的に限定しました。実験には、毒素や化学兵器、有害な化合物の設計依頼は含まれていません。これらの結果は、システムがそのような有害な用途を支援できることを示す証拠として解釈すべきではありません。このプロジェクトでは、そのような能力を試験したり、実証したりしていません。

当社は、化学・生物学分野に関連するリスクを含め、高度なモデル能力から生じる新たなリスクを、当社の Preparedness Framework⁠ を通じて評価し、軽減しています。本研究で使用されたモデルは、英国 AI セキュリティ研究所による関連評価をすでに受けており、システムは有害な用途を目的としたリクエストを拒否するように設計されていました。実験ワークフローにはさらなる管理層が設けられており、人間の化学者がどの提案を実験室に進めるかを選定し、実験計画をレビューし、物理的なインフラの制御を維持しました。

私たちは、これが実験化学における AI の可能性を研究する責任ある方法だと考えています。明確な科学的価値のある課題を選び、モデルレベルの安全対策と専門家による監督を組み合わせ、範囲を限定した実際の実験を通じてシステムを評価するという方法です。こうした能力が向上するにつれて、私たちは引き続き、新たなリスクを評価し、安全対策を強化するとともに、結果から何が言え、何が言えないのかを明確に示していきます。

今後の展望

次のステップは、科学的な検証を進めることです。より幅広い出発物質を試験し、添加剤によって反応が改善する理由を調べ、どのような条件で効果が得られ、どのような条件では得られないのかを明らかにするとともに、独立した再現実験を支援します。これらの研究を通じて、この方法をどの程度幅広く適用できるのか、また、実際の医薬化学のワークフローでどの程度有用なのかを明らかにします。

私たちの長期的な目標は、専門家の判断、信頼性の高い測定、強固な安全対策に根ざしながら、研究者による仮説の生成、実験の設計、結果の解釈、次に検証すべき内容の判断を支援する、科学者にとって信頼できるパートナーとなる AI システムを構築することです。有機化学は、特に大きな効果が期待できる領域です。低分子の発見と製造を進歩させるには、分子を安定して合成できることが欠かせないためです。科学者が試験できるのは、自ら合成できる分子に限られます。合成技術が向上すれば、医学、農業、エレクトロニクス、エネルギー、材料科学にわたって、探索できるアイデアの幅が広がります。今回の成果は、そうしたより大きな方向性を示す初期の一例です。フロンティアモデル、特化型エージェント、自動化ラボ、人間の化学者が協力することで、研究サイクルをより迅速に進め、科学コミュニティが評価、再現し、さらに発展させられる知見を生み出しました。

Molecule.one チームと、この研究をレビューしてくださった独立した化学者の皆様に感謝します。

2026年

著者

OpenAI