メインコンテンツにスキップ
OpenAI

2026年6月18日

応用 AI

小児の希少遺伝性疾患の診断を支援する AI

NEJM AI の研究で、専門家は OpenAI のリーズニングモデルを使い、未解決の 376 症例を再解析して 18 件の診断につながる手がかりを提示しました。

読み込んでいます...

ゲノムシーケンシングを行っても、希少疾患を持つ多くの人は明確な遺伝学的診断を受けられないままです。大規模な検査と専門家によるレビューを経ても、およそ半数は未診断のままです。医療データに手がかりが含まれていることはありますが、それを見つけるには、数千から数百万に及ぶ可能性のある遺伝的バリアント、分断された診療記録、急速に変化する科学文献を精査する必要があります。

新しい遺伝子と疾患の関係、症例報告、分類根拠が蓄積するにつれ、未解決の症例が新たに解釈可能になることがあります。

Boston Children’s Hospital の Manton Center for Orphan Disease Research、Harvard University、OpenAI の研究者は、OpenAI o3 Deep Research リーズニングモデルを使い、過去に解析されながら未解決だった 376 症例の匿名化された臨床情報とゲノム情報を分析しました。モデルは、研究者と臨床医がレビューできる、根拠に結びついた候補説明を提示しました。専門家レビュー、追加検査、臨床的確認を経て、医師は 18 症例で診断を確定しました。これは、専門家による従来の解析後に 4.8% の診断率が上乗せされたことを意味します。この研究は 2026 年 6 月 18 日に NEJM AI に掲載され、AI 支援の研究ワークフローが、最も難しい症例の一部を再検討する際に専門家の手がかり創出を支援できることを示しています。

これらの症例の多くは、長年にわたる専門家の解析でも解決に至っていませんでした。本研究では、OpenAI o3 Deep Research が研究者による手がかりの特定を支援し、その後、確立された臨床プロセスで評価されました。知識が進展するにつれ、専門家主導の定期的な再解析をより拡張可能にできる可能性が示唆されます。モデルは患者を診断したり、臨床判断を下したりしていません。モデルは、専門家がレビューし、適切な場合には追加検査で調査し、臨床検査室で確認できる、根拠に結びついた仮説を生成しました。

古い症例に新しい答えが含まれ得る理由

結論が出なかった遺伝子検査の結果は、必ずしも恒久的なものではありません。患者の表現型の記述、検査結果、家族歴は、異なる識別子、形式、語彙を使う複数のデータベースに分散していることがあります。そうした記録を結びつけるのは難しく、専門家であっても診断を見落とすことがあります。また、関連する遺伝子やそのバリアントと疾患との関連が明らかになる前に、専門家が子どものゲノムをシーケンシングしている場合もあります。科学的知識が進むと、同じデータから、以前は見つけることが不可能だった答えが明らかになることがあります。

希少疾患の再解析は、科学の課題であると同時に、継続的な維持管理の課題でもあります。患者のゲノムは同じでも、それを取り巻く根拠は変わり続けます。研究者は新しい遺伝子やバリアントを疾患に結びつけ、検査機関は古いバリアントを再分類し、症例データベースや論文には新たな観察結果が蓄積されます。更新のたびに、過去に結論が出なかった症例を再検討する価値が生まれます。そのため多くの機関は、変化し続ける知識基盤と同期させるべきゲノムのバックログを抱えることになります。

本研究では、研究者は既存のゲノム解析パイプラインの上に、説明を第一にする推論レイヤーとしてモデルが機能するようワークフローを設計しました。順位付けされた遺伝子だけを返すのではなく、臨床的特徴、遺伝形式、バリアントの根拠、科学文献を、人間のレビュアーが検証できる根拠づけとして結びつけるよう求めました。 

再解析の進め方

各症例について、チームは匿名化された資料一式を作成しました。そこには、患者の臨床像を記述する標準化された Human Phenotype Ontology 用語、場合により臨床医のメモや記述的な臨床診断、年齢や性別などのメタデータ、フィルタリング済みのバリアント表が含まれました。この表には、各バリアントの希少性、コードされるタンパク質への予測される影響、ClinVar 分類、利用可能な家族メンバーにおけるシグナル品質が記録されました。ほとんどの症例には、子ども本人と両方の生物学的親のデータが含まれていました。

チームはモデルに、最も妥当な分子レベルの説明を提案し、その根拠を示すよう求めました。その後、研究者は、臨床検査機関が遺伝的バリアントの分類に用いるものと同じ ACMG/AMP フレームワークで出力をレビューしました。各候補は少なくとも 2 人のチームメンバーがレビューし、意見の不一致は合意によって解決され、モデル出力が診断として扱われることはありませんでした。所見が診断として数えられたのは、資格を持つ専門家が根拠をレビューし、バリアントが病原性または病原性の可能性が高いと分類され、CLIA 認定検査室で確認され、臨床チームがその結果を家族に返した後に限られました。

未解決症例を分析する前に、チームは確定診断のある症例でワークフローを改良しました。さまざまな希少疾患を含む 51 症例のうち 48 症例で、重複実行により正しい遺伝子とバリアントを再現しました。57 例の神経筋症例セットでは、45 症例について重複実行で正しい診断を返しました。15 症例のロングリードゲノムセットでは、すべての症例で正しい遺伝子を挙げ、12 症例で疾患原因となる両方のアレルを特定しました。これらの評価はプロンプト開発に役立ち、専門家レビューが依然として不可欠な領域を示しました。

これらの既に解決済みの症例では、モデルが自己申告した信頼度スコアは正しい診断と連動していました。一貫して正しいコールの平均最小スコアは 85.6、不正確または不明なコールでは 42.1 でした。これらのスコアは較正済みの確率ではなく、チームは根拠や臨床的判断の代替としては使用しませんでした。一方で、専門レビュアーが最も有望な候補診断に集中するための手がかりとして有用でした。 

「希少疾患ゲノム再解析のための人間主導 AI ワークフロー」と題されたワークフロー図。匿名化された患者データが、人間の判断、LLM による根拠統合、専門家レビュー、検査、臨床的確認、家族への結果返却へと流れる様子を示しています。

研究者が見つけたこと

その後、チームはこのワークフローを、過去に未解決だった 4 つのグループに適用しました。神経発達症のある子ども、希少な神経筋疾患を持つ人、早期精神病のある小児と青年、小児の予期しない突然死の症例です。これらは、初回レビューを待つ新規症例ではありませんでした。多くは既に、複数の商用または機関内パイプラインで調べられ、多分野チームで議論されていました。

コホート別の結果

コホート

症例数

示された診断

診断率

神経発達

100

10

10.0%

神経筋疾患

61

4

6.6%

小児の予期しない突然死

200

2

1.0%

早期精神病

15

2

13.3%

合計

376

18

4.8%

早期精神病コホートは小規模だったため、その割合の信頼区間は広くなっています。診断率には、各コホートで単一遺伝子による説明がどの程度見込まれるかも反映されています。

モデルが候補を提示し、専門家によるレビューと臨床的確認が完了した後、医師は症例の 4.8% で診断を確定しました。この割合は控えめですが、過去の専門家レビューで解決できなかった集団であるため、意味のある結果です。同様の再解析研究では、十分にレビューされた症例で 1 桁台の改善が報告されています。より高い診断率は通常、新規症例や遺伝学的確認待ちのよく知られた疾患を含む研究で得られます。

18 件の診断のうち 7 件は再発見でした。現地の研究ワークフロー外で確定されていたものの、チームがレビューした記録には含まれていなかった診断です。複数の症例で、バリアントは既に公開データベースで病原性または病原性の可能性が高いと記載されており、データソースを横断して情報を統合する運用上の難しさが浮き彫りになりました。

バリアント特定における柔軟性の実証

早期精神病のある 1 例で、モデルは入力データに記載されていなかったゲノム内の構造的事象を推定しました。モデルは、22 番染色体上の低品質コールの連続と、その子どもの心臓、免疫、神経発達、精神医学的特徴を結びつけ、DiGeorge 症候群に関連する 22q11.2 欠失という仮説を立てました。この仮説上のバリアントは、追跡のゲノムシーケンシングで確認されました。

プロンプトでは単一遺伝子性の原因を 1 つ求めていましたが、モデルは複雑な症状をよりよく説明する 2 つの遺伝子を示すことがありました。ある症例では、LAMA2FOXP1 のバリアントが、筋肉と神経発達の特徴を合わせて説明する助けとなりました。別の症例では、これまで認識されていなかった TTNSRPK3 による二遺伝子性の説明がありました。

検証可能で生物学的に一貫した仮説の生成

診断に加えて、モデルは尋常性白斑と呼ばれる疾患について、新たな機序に関する説明の可能性も特定しました。ある神経発達症例で、モデルは尋常性白斑のある人に見られた S1PR1 の 11 アミノ酸欠失に注目しました。S1PR1 は、シグナル伝達、免疫細胞の移動、組織生物学に関与する細胞表面受容体をコードします。モデルは、この欠失が受容体の構造とシグナル伝達を変化させ、色素産生を減らす一方で、免疫細胞が皮膚に残り続ける助けにもなり得ることを示す根拠を統合しました。

提案された S1PR1 と尋常性白斑の関係には追加の実験的検証が必要ですが、構造生物学、免疫学、臨床遺伝学に散在する知見を、具体的で検証可能な仮説へ変換するうえで AI が果たし得る強力な役割を示しています。

チームは、神経筋コホートでも表現型拡大の可能性を確認しました。HSPB8CDK13 の有害なバリアントは、各遺伝子で最もよく知られる疾患とは完全には一致しておらず、より広い臨床スペクトラムが存在する可能性を示しました。これには、より多くの症例と実験室での検証が必要です。

症例研究:Kyra さんの約 20 年越しの診断

始まりは空手の稽古でした。Kyra さんの母親は、9 歳の娘が以前ほど低く構えられなくなっていることに気づきました。Kyra さんはサッカーの練習中にも動きが遅くなり、歩いたり走ったりするときにつま先立ちのままでいるようになりました。小児科医は筋力低下の原因を特定できず、専門医を紹介しました。そこから、診断のないまま検査、治療、診察を重ねる、約 20 年に及ぶ道のりが始まりました。

Kyra さんの症例は、神経筋コホートで示された 4 件の診断の 1 つでした。チームは彼女の状態を HSPB8 のフレームシフトバリアントに結びつけ、筋原線維性ミオパチーの一種と診断しました。この疾患では、異常なタンパク質構造が筋線維内に蓄積し、筋力低下に関与します。Manton Center の遺伝カウンセラーが Kyra さんに電話をしたのは、28 歳の誕生日の約 1 週間前でした。

その時点で、Kyra さんは人生の多くをこの病気に適応しながら過ごしていました。13 歳になる頃には人工呼吸器と車いすが必要になっていましたが、その後、状態は横ばいになっています。Kyra さんの筋原線維性ミオパチーは極めてまれで、長期的な経過についてはほとんど分かっていません。それでも、診断は一定の区切りをもたらしました。

限界

本研究は、汎用リーズニングモデルが、表現型、遺伝形式、バリアント注釈、データ品質のパターン、科学文献を組み合わせてレビュー可能な仮説を作ることで、後ろ向きゲノム再解析に貢献できることを示しています。また、定期的な再解析が重要である理由も示しています。知識が進展した後、または分断された記録が統合された後に初めて見えてくる答えがあるためです。

この研究は、患者、臨床医、または顧客が OpenAI のモデルを疾患の診断や医療判断に使用すべきであることを示す根拠ではありません。診断を目的とした OpenAI o3 Deep Research、ChatGPT、またはその他の OpenAI 製品の顧客利用を説明したり推奨したりするものでもありません。モデルは参加者を診断していません。すべての診断は、医師やその他の資格を持つ臨床専門家が、確立されたレビュー、検査、臨床的確認のプロセスを通じて行いました。

本研究は後ろ向き研究であり、コホートは不均一で、レビュアーはモデルの信頼度を知らされない状態ではありませんでした。研究者は、短縮された時間、費用、臨床医の負担、偽陽性への対応量、ケアの変化を測定していません。また、構造バリアント、反復配列伸長、深部イントロン変化、モザイクなど、他の形態の遺伝的変異も体系的には評価していません。

大規模言語モデルは文脈を読み違えたり、詳しく調べると成り立たないもっともらしい説明を生成したりすることがあります。そのため、すべての結果は人間による判定と臨床的確認を経ました。モデルは探索範囲を広げ、その後の人間主導の分析の焦点を絞りましたが、どの情報や診断を家族に返すべきかを決定したわけではありません。

本研究では匿名化された情報を使用し、保護対象の健康情報は承認済み環境の外で利用または送信されませんでした。より広い臨床導入には、すべての医療に適用されるプライバシー、セキュリティ、監査可能性、地域規制への同じ配慮が必要です。モデルへのアクセスは、シーケンシング基盤、遺伝カウンセリング、確認検査、専門家の判断に取って代わるものではありません。

淡い青、シアン、濃い青の色調が柔らかく移り変わり、滑らかでぼかした効果を生み出している抽象的な青のグラデーション背景。

「ボトルネックは時間です。専門家が 1 人の患者に割ける 1 日の時間には限りがあります」

Catherine Brownstein 博士、Boston Children’s Hospital の Manton Center for Orphan Disease Research

淡い青、シアン、濃い青の色調が柔らかく移り変わり、滑らかでぼかした効果を生み出している抽象的な青のグラデーション背景。

「Catherine と私のような研究者が、8,000 種類もの疾患をすべて頭に入れておくことは到底できません。そこに AI の力があります」

Alan Beggs 氏、Manton Center for Orphan Disease Research ディレクター

今後の展望

今後は、LLM 支援による再解析と標準的な実務を比較する前向き多施設研究を行い、診断率、候補に到達するまでの時間、臨床医の負担、偽陽性の負担、コスト、診療への影響を評価すべきです。再現性と安全性のために、バージョン管理されたプロンプト、参照の確認、監査ログ、不確実性の適切な校正が重要になります。こうした研究でも、根拠を評価し、適切な検査を指示し、診断や治療の判断を行うには、有資格の臨床医が必要です。

本研究では OpenAI o3 Deep Research を使用しました。新しい汎用モデルは、より多くの科学文献を検索して統合できます。一方で、GPT‑Rosalind のような目的特化型システムは、タンパク質の構造と機能に対するバリアントの影響など、ライフサイエンス領域のより深い作業を想定して設計されています。これらの機能は本研究では検証しておらず、別途の評価とアクセス制御が必要になります。

OpenAI はこの初期研究を支援しましたが、次の段階は OpenAI Foundation からの助成金を通じて Manton Center が主導します。この助成金は、臨床チームが希少疾患の症例をより迅速かつ一貫して分析できるようにする、プラットフォーム非依存で低コストの遺伝学 AI コパイロットの開発という、同センターのより広い取り組みを支援します。

長期的な研究機会は、専門家主導の AI 支援再解析が、科学的理解を発見のスピードに追いつかせる助けになるかを探ることです。目指すのは AI が医師の診断に取って代わることではなく、慎重に評価された研究ツールが、専門家にとって調べる価値のある根拠を見つける助けになることです。何千もの家族にとって、今日の未解決の問いが、永遠に未解決のままである必要はありません。

  • 2026年

著者

OpenAI