健康は、人々が ChatGPT を利用するうえで最も意義のある用途のひとつです。毎週 2 億 3,000 万人以上が、健康情報の理解、検査結果の読み解き、受診準備、保険の手続き、より健康的な習慣づくり、次に何を質問すべきかの整理など、健康とウェルネスに関する疑問について ChatGPT に助けを求めています。
GPT‑5.5 Instant では、緊急受診が必要な可能性を認識すること、関連する背景情報を尋ねること、不確実性を説明すること、複雑な情報をわかりやすくすることなど、モデルが健康に関する質問を扱う方法に大きな前進が見られます。最も難度の高い健康評価において、GPT‑5.5 Instant は現在、当社のフロンティア Thinking モデルに匹敵する水準の性能を示しています。これは ChatGPT の無料ユーザーにも利用できるため、より多くの人がこうした改善の恩恵を受けられます。つまり、より理解しやすい健康情報、よりよい質問、そして明確な次の行動につながります。
この進歩は、モデル能力の向上と、医師主導で健康評価に取り組んできた成果の両方を反映しています。一連の取り組みにおいて、世界中の医師ネットワークが、モデル回答の例をレビューし、理想的なふるまいを説明し、問題が生じやすいパターンを特定することで、実際の健康に関する場面で「良い」とは何かを定義する支援をしています。医師と協力することで、健康分野での進歩を測定し、ChatGPT の応答を継続的に改善する方法が得られます。
健康分野での進歩とは、正確で理解しやすく、的確な判断に基づいた回答を提供することを意味します。具体的には、追加の背景情報が必要な場合を認識し、自信を過度に示さずに不確実性を説明し、受診すべきタイミングを理解できるよう支援することです。
その進歩を測定するため、HealthBench や HealthBench Professional など、健康分野に特化した評価を使用しています。これらの評価では、現実的な健康相談の会話と医師が作成したルーブリックを用いて、正確性、安全性、コミュニケーション、文脈理解、網羅性、適切な受診の促しなどの特性を評価します。
GPT‑5.5 Instant は、HealthBench Professional を含む健康評価の集計において、当社の最新フロンティアモデルに近い健康性能に達し、GPT‑5.3 Instant から大幅に改善しました。5.5 Instant(2026 年 5 月リリース)と 5.3 Instant(2026 年 3 月リリース)は、ChatGPT のすべての無料ユーザーが利用可能(制限あり)であり、5.4 Thinking と 5.5 Thinking のコスト計算には API 価格を使用しています。
別の比較として、代表的な健康相談の会話に対して、時間を無制限とし、インターネットにはアクセス可能(ただし AI は不可)という条件で、医師にも回答を作成してもらいました。その後、別の医師パネルが、これらの医師による回答と各時点の Instant モデルを比較し、正確性、コミュニケーション、網羅性、指示への準拠、健康に関する判断への有用性など、実際のやり取りで重要となる特性を、3,500 件のレビュー済み回答にわたって確認しました。
この評価では、GPT‑5.5 Instant の回答が、医師が作成した回答や以前のモデルの回答よりも、各項目で高く評価されました。
医師は、GPT‑5.5 Instant の回答について、以前のモデルや医師による回答よりも問題のある回答パターンが少ないと評価しました。たとえば GPT 5.5 Instant は、以前のモデルおよび医師の回答と比べて、地域の医療事情に合わせられていない例、危険な兆候や受診の必要性を見落とす例、必要なときにユーザーから追加の背景情報を得ようとしない例が少なくなっていました。
当社モデルが健康分野で利用されている規模を踏まえると、最近のモデル改善を理解するもうひとつの方法は、本番トラフィックを測定することです。当社は、プライバシーを保護するモニターを本番トラフィックに用いて、健康に関する回答で起こり得る事実関係の誤りを追跡しています。健康分野における最近の本番トラフィック(週あたり数十億件のメッセージ)の比較に基づくと、少なくとも 1 件の事実関係の問題が検出された回答の割合は、過去 2 か月で 71% 低下しました。
現実の健康に関する質問について、異なる時点のモデル回答を比較すると、ChatGPT が健康分野で重要な点で改善してきたことがわかります。状況に緊急の対応が必要な可能性を認識すること、不確実性によりよい判断で対処すること、次に何をすべきかについて、より明確で役立つ案内を提供することです。
GPT-5.2 Instant
モデル名をクリックすると、追加のモデル回答を表示できます。
この進歩は、ChatGPT における健康関連の回答を定義、測定、改善するうえで協力している医師によって形づくられています。
OpenAI は、60 か国、49 言語、26 の診療科にわたる 260 人以上の医師からなるグローバルネットワークと協力しています。こうしたフィードバックは、日常的なウェルネスの質問から、より複雑な臨床状況まで、幅広いシナリオで ChatGPT が健康に関する質問にどう応答するかに反映されます。
医師はモデル回答の例をレビューし、それらが正確で、明確で、網羅的で、適切に慎重で、有用かどうかを評価します。医師は、回答が重要な文脈を見落としている可能性がある箇所、自信過剰に聞こえる箇所、次の手順をより明確にすべき箇所、または医療機関の受診をより直接的に促すべき箇所を特定する支援をします。
これまでに医師は、臨床医や患者が実際の場面で ChatGPT をどのように使う可能性があるかを反映した、70 万件以上のモデル回答例をレビューしてきました。数分に 1 回、医師が新しい回答をレビューしています。そのフィードバックは、研究者が実際の健康に関する状況で回答が正確で、安全で、明確で、網羅的で、適切に慎重で、有用かどうかを測定するためのルーブリックや評価基準になります。これにより、モデルがどこで改善しているのか、どこにまだ取り組みが必要なのかを、より明確に把握できます。
この取り組みは、健康情報をよりよく理解し活用できるよう支援するツールから、医療従事者向け ChatGPT や OpenAI for Healthcare のように、文書作成、研究、ケアに関する相談などのタスクで医療専門職を支援する臨床医向けツールまで、OpenAI の健康分野におけるより広範な取り組みも支えています。
人々の健康を向上させることは、AGI がもたらす最も個人的で、実感しやすい影響のひとつになるでしょう。当社のモデルが進歩を続けるなかで、私たちの目標は、そうした場面で ChatGPT をより正確で、より慎重で、より有用なものにし、その進歩をより多くの人に届け続けることです。


