Paradigm

Paradigmは臨床試験への患者のアクセスを改善するためにOpenAIのAPIを活用しています。

読み込んでいます...

臨床試験は、新たな治療法を見つけ出す方法で、命を救う治療形態になり得ます。Paradigm⁠（新しいウィンドウで開く）は、医療従事者の燃え尽き症候群に対処するため、医師や看護士の事務作業を減らしつつ、ガン患者などより多くの人々が臨床試験を受けられるようにする技術を駆使し、医療業界の障壁を取り除いています。

臨床試験の登録は崩壊している

患者の診療録の評価は、最善の治療の選択肢を提供する可能性のある臨床試験に患者を登録する主要なボトルネックとなっています。医療提供者には、臨床試験を念入りに調べ、実施される臨床試験の詳細について理解を深め、条件を満たす患者を一致させる時間がほとんどありません。その結果、ほぼすべての臨床試験が、臨床試験が実施される場所の近くに住む患者で定員一杯となり、選定プロセスに偏りが生じ、多くの患者が、自分の命を救う可能性のある画期的な治療にアクセスすることを妨げられています。

この問題を解決するためParadigmは、診療データを抽出、解釈することを目的に、従来のベストプラクティスと医療分野に特化したMLおよびNLPモデルを展開、最適化しました。これらのモデルは、専門の医師によって厳選されたゴールデンデータセットでトレーニング、評価されました。しかしながら、このアプローチには時間と手間がかかりました。

「微調整された最先端の医療向けモデルを展開し、その後さらに最適化を行いました。膨大な時間を費やし、ユースケースごとにあらゆることを行う必要があります。情報の断片ごとに、個別のモデルを構築、トレーニング、検証する必要があります」

Paradigm最高戦略責任者Jonathan Hirsch氏

従来のモデルがあまりにも優れた機能を発揮していたため、医師はその品質基準が満たされているかを確認するため、モデルの出力を手作業で確認する必要があります。

臨床試験のデータセットを評価するためGPT-4を使用

Paradigmは、構造化されていないテキストを要約する能力を備えたLLMであれば、同社のユースケースと相性が良く、一回限りのMLモデルを構築するアプローチの代わりに活用できる可能性があるのではないかと考えました。同社は考えられる2つの方向性、すなわち、医療業界のユースケースでトレーニングしたカスタムLLMとの統合、あるいは、OpenAIのAPI経由でのGPT‑4の統合を模索しました。

Paradigmは、納得のいく結果を得るには、医療専用のモデルが必要だと考えていました。複雑なデータ評価作業について高度なトレーニングを受けた人間の専門家で較正されるチームを上回るパフォーマンスをGPT‑4が発揮したことに同社は“衝撃”を受けました。

最終的に同社はOpenAIを選択しました。その理由は次の通りです。

精度：Paradigmは、専門家が厳選したゴールデンデータセットについて厳しい評価を実行しました。精度/再現率混同指標でGPT‑4の精度は、最先端のMLモデルの精度を最低でも10%上回りました。一部のケースでは、“信じ難い”改善が認められました。Hirsch氏は次のように話します。「OpenAIの精度は、当社が当時使用していた専門家がトレーニングした業界ベストプラクティスのモデルの展開と最適化よりも優れており、訓練を受けた当社の医師を上回ることもありました。情報が複雑であるほど、情報が様々な場所に点在し、GPT‑4のパフォーマンスが高くなりました」
使いやすい：「製品の観点から言えば、とにかくすべてが簡単でした。APIは使いやすく、当社のスタックへの組み込みも簡単でした」また、同社のチームは質の高いAPIドキュメンテーションなどOpenAIのサポートも高く評価しています。「他社と連携するよりも、OpenAIを使う方が自分たちだけで対応でき自立できます」
マルチモーダルエントリー＆ロングコンテキストウィンドウ：いずれの機能も診療データにとって重要なものでした。
セキュリティ＆規制遵守：「OpenAIを導入する価値について何より当社を納得させたのは、HIPAA（医療保険の携行性と責任に関する法律）を遵守することが義務付けられた当社のニーズに対するサポートなど、規制遵守をサポートするための本格的なアプローチでした。当社は医療提供者と患者にサービスを提供しているため、規制遵守はどうしても譲れない用件でした」

GPT-4は、製品のスピード、データの質、運用コストを改善

数ヶ月ではなく数日で新たなデータ要素を抽出：GPT‑4は、自社の基幹インフラストラクチャについてのParadigmの考え方を覆し、個別のデータコンポーネントに対してひとつひとつMLモデルを構築するプロセスを完全に置き換えました。これにより、Paradigmのロードマップが大幅に加速し、新たな医療提供者のパートナーや臨床試験の種類向けに速やかに拡大できるようになりました。
モデルの検証に必要な専門医の時間を90%削減：Paradigmは、GPT‑4の出力を評価するために必要なデータは、以前の特化型MLモデルに必要であったデータの10分の1であると推定しています。
精度が10%向上：以前よりもさらに精度の高いデータを駆使し、多くの場合、人間の専門家を上回るパフォーマンスを発揮するGPT‑4は人間の専門家がモデルの結果に介入する必要性を減らしています。Paradigmの医師と看護士だけでなく、同社の医療提供者のパートナーは、資料に目を通す作業ではなく、患者の治療により多くの時間を費やすことができます。
より公平な臨床試験へのアクセス：この点についてはまだ実証中ではあるものの、GPT‑4は十分な治療を受けていない患者をより正確に被験者候補として選別できます。これらの患者の診療録のデータは構造化されておらず、メモなど非構造化データである傾向があります。GPT‑4は、そういったデータの抽出と解釈に長けています。

1分間で何百人もの患者を評価

これからの展望として、ParadigmはGPT‑4の自然言語の理解力を活用し、さらに医師の負担を軽減することに大きな期待を持っています。臨床チームは、データを分析するためにコードを書く代わりに、臨床試験の参加資格を満たしているかを確認するため、あるいは不足している情報や次のステップについて理解するため、ChatGPTと患者のデータについて会話できます。

Paradigmは、患者のスクリーニング検査受診率（screening rate）を引き続き上げることができることに期待を持っています。GPT‑4を活用することで、同社のプラットフォームは、1分間に何百人もの患者を評価できる可能性があります。看護士が務める臨床試験コーディネーターが1日に手作業で確認できる患者の数は50人程度です。GPT‑4を活用した場合とこれを比べて見てください。この大幅な効率の向上は、患者が今よりもはるかに臨床試験にアクセスしやすく、医師と看護士がドキュメンテーションに費やす時間を減らし、患者の治療により多くの時間を費やすことができ、命を救う治療がさらに速やかに市場に投入される世界へとつながります。