Harvey

HarveyはOpenAIと提携し、法務業務向けにトレーニングされたカスタムモデルを構築。

読み込んでいます...

Harveyはこの1年で、法律、税務、金融分野に特化した安全な生成AIプラットフォームとしての地位を確立しています。100人以上のチームへと成長を遂げ、2023年には収益を10倍以上に拡大し、シリーズBラウンドで7億1500万ドル評価額、8,000万ドルを調達しています。

先頃、HarveyはOpenAIと提携し、カスタムトレーニングされた判例法モデルを構築。これにより、 Harveyは複雑な法的推論プロセスや広範な専門知識、単一のモデル呼び出しを超える能力を必要とするタスク、例えば、文書の作成、複雑な訴訟シナリオに関する質問への回答、数百の契約間の重大な矛盾の特定などを支援するAIシステムを提供できるようになりました。

リーガルテックにおけるLLMの可能性を再定義する

Harveyは、独占禁止法と証券訴訟の経歴を持つ弁護士であるWinston Weinberg氏と、Google BrainやMetaにて大規模言語モデル（LLM）の開発に携わっていたAI研究員のGabe Pereyra氏によって設立されました。Weinberg氏らは、LLMを用いて情報を統合し、それを弁護士に提示してレビューを得る必要性を感じていました。

「トランザクション業務も訴訟もますます複雑になっています。国際的な合併では何十万もの契約書に目を通し、訴訟では何百万通ものEメールをレビューする必要があります。」とWeinberg氏は述べています。AIが文書の統合を支援することで、弁護士は法律文書の選別や文章作成に費やす時間を削減し、意思決定やクライアント支援により多くの時間を割くことが可能になります。

2人の考えの正しさが証明されたのは、Redditのr/legaladviceから大家や借家人に関する質問を抜き出し、GPT‑3を使って回答を生成し、それを弁護士と共有したときのことでした。「100の質問のうち86件について、弁護士は編集せずにそのままクライアントに回答を送ったと答えました。」とWeinberg氏は当時を振り返ります。「その時、これだ！とひらめいたのです」

OpenAIで初のカスタムトレーニングされた判例法モデルを構築

判例法のリサーチのため、Harveyのチームが当初思い描いていたのは、クライアントからの質問を判例法モデルにコピーペーストすれば、その質問に丁寧に回答し、すべての出典を引用してくれるような体験でした。そして、まず公開APIを介した基礎モデルのファインチューニングや、検索拡張生成（RAG）システムの構築といった、簡単に思いつく方法を試みることに。しかし、このように独自性が高く、複雑で制約のないユースケースには限界がありました。

「データを検索するだけの場合、自分の専門分野ではない法律関係のシンプルな質問に答えることはできても、それは実際ほとんどの弁護士にとって大して役に立ちません。」とWeinberg氏は説明しています。「判例法のリサーチでは、主張を裏付けるための情報を探す必要がありますが、それはもっと困難なことなのです。」

基礎モデルは法的推論に強いものの、法律業務に必要な知識が不足しています。そこでHarveyはOpenAIと提携し、新たな知識やその知識に対する推論方法のベースモデルへの組み込みが可能な、カスタムトレーニングモデルの構築に着手しました。

「これらの問題に明確な解決策はありません」とPereyra氏は語っています。「多くの場合、私たちは頭を突き合わせ、判例法のリサーチがどのように行われるかを弁護士が説明し、私たちの取り組みを研究員が示し、OpenAI社から問題に取り組むための手段や方法について学びました。」

HarveyとOpenAIは必要とされるコンテキストに深みを加えるため、まずデラウェア州の判例法から始め、後に米国の判例法すべてに拡大しました。また、100億トークンに相当するデータを追加し、特別にトレーニングされた判例法モデルの強化を図りました。

出典の引用により、関連性が高い正確な結果を実現

Harveyは判例法モデルをテストするため、大手法律事務所10社と協働。同じ質問に対して、判例法のカスタムトレーニングモデルからのアウトプットと、GPT‑4からのアウトプットを並べて弁護士に提示したところ、その圧倒的な反応に驚かされました。

A comparison of GPT-4 and a GPT-4 custom model. The resulting model achieved an 83% increase in factual responses and attorneys preferred the customized model’s outputs 97% of the time over GPT-4.

「97%の確率で、弁護士たちは判例法モデルからのアウトプットを好みました。より長文かつ完全な回答だったことがそのほとんどの理由です。質問の微妙な違いにまで踏み込み、より関連性の高い判例法を網羅していました。」とWeinberg氏は述べています。

ハルシネーションの削減もまた、Harveyがカスタムモデルの構築を図る理由の一つでしたが、その投資は成果を上げました。Weinberg氏は、「判例法モデルが判例を捏造することはなく、実際にすべての文章が引用された判例によって裏付けられた」としています。

より多くのユーザーにこのモデルを展開するにあたり、Harveyは準備書面や申し立て書の作成、または管轄区域によって異なる判例法に対する弁護士の理解の支援など、その他の用途にもこの判例法モデルを活用することに期待しています。

次世代のLLMに向けた構築

AIを活用する他の創設者らに向け、Pereyra氏は次のように語っています。「現在のモデルの能力に合わせて構築するのではなく、将来のモデルの進化を見据えて構築しなければなりません。より複雑な問題に取り組むことで、改良されたモデルが登場した際、それらが単なる副産物として解決されることがないようにします。」

Harveyは今後の取り組みの一つとして、「エージェント」、つまり複数のモデルの呼び出しを単一のアウトプットにまとめる方法に注目しています。これにより、ユーザーエクスペリエンスが簡素化され、ユーザーに求められるプロンプトエンジニアリングやタイピングの負担の削減が可能となります。

Harveyのビジョンはチームのサポート役として機能することです。Weinberg氏は次のように述べています。「法務業務は増加の一途をたどっており、アソシエイトは複雑でありながら日常的な作業に多くの時間を費やしています。法務に限らず、すべてのプロフェッショナルサービスにおいて、専門家がクライアントとのやり取りに時間を割けるよう日常業務を処理することが私たちにとってオポチュニティなのです。」

Pereya氏は次のように語っています。「これは先導的な研究でした。新しいことに挑戦するためにリソースを投入してくれるパートナーが必要でした。あらゆる選択肢を検討した結果、OpenAIと連携してカスタムトレーニングモデルを構築すること以外は考えられませんでした。」

「これは先導的な研究でした。新しいことに挑戦するためにリソースを投入してくれるパートナーが必要でした。あらゆる選択肢を検討した結果、OpenAIと連携してカスタムトレーニングモデルを構築すること以外は考えられませんでした。」

AI研究員兼共同創業者、Gabe Pereyra氏

ビジネス向け ChatGPT について詳しく知りたい方は、チームにご相談ください

チームに相談する