Harvey

Harvey သည် ဥပဒေပညာရှင်များအတွက် စိတ်ကြိုက်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု တည်ဆောက်ရန် OpenAI နှင့် ပူးပေါင်းသည်။

ဖွင့်နေသည်…

လွန်ခဲ့သော တစ်နှစ်အတွင်း Harvey သည် ဥပဒေ၊ အခွန်နှင့် ငွေကြေးကဏ္ဍရှိ ပရော်ဖက်ရှင်နယ်များအတွက် လုံခြုံသော generative AI ပလက်ဖောင်းတစ်ခုအဖြစ် မိမိကိုယ်ကို တည်ထောင်နိုင်ခဲ့သည်။ ၎င်းတို့သည် လူ 100 ကျော်ရှိသော အဖွဲ့တစ်ဖွဲ့အဖြစ် ကြီးထွားလာခဲ့ပြီး၊ 2023 ခုနှစ်တွင် ဝင်ငွေ 10 ဆကျော် တိုးမြှင့်ခဲ့ကာ valuation $715M ဖြင့် Series B ရင်းနှီးမြှုပ်နှံမှု $80M ရရှိခဲ့သည်။

မကြာသေးမီက Harvey သည် စိတ်ကြိုက်လေ့ကျင့်ထားသော case law မော်ဒယ်တစ်ခု ဖန်တီးရန် OpenAI နှင့် ပူးပေါင်းခဲ့သည်။ ၎င်းကြောင့် Harvey သည် ရှုပ်ထွေးသော ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသောမှု၊ နယ်ပယ်အလိုက် အသိပညာကျယ်ပြန့်မှုနှင့် မော်ဒယ်တစ်ခုတည်းကို ခေါ်ယူရုံထက် ကျော်လွန်သော စွမ်းရည်များ လိုအပ်သည့် အလုပ်များတွင် ကူညီပေးနိုင်သော AI စနစ်များကို ပေးစွမ်းနိုင်လာသည်—ဥပမာ စာရွက်စာတမ်း မူကြမ်းရေးဆွဲခြင်း၊ ရှုပ်ထွေးသော တရားစွဲဆိုမှု အခြေအနေများအကြောင်း မေးခွန်းများကို ဖြေကြားခြင်းနှင့် စာချုပ်ရာပေါင်းများစွာအကြား အရေးပါသော မကိုက်ညီမှုများကို ဖော်ထုတ်ခြင်းတို့ ဖြစ်သည်။

ဥပဒေနည်းပညာတွင် LLMs အတွက် ဖြစ်နိုင်ခြေကို ပြန်လည်သတ်မှတ်ခြင်း

Harvey ကို antitrust နှင့် securities litigation နောက်ခံရှိသော ရှေ့နေ Winston Weinberg နှင့် ယခင်က Google Brain နှင့် Meta အတွက် large language models (LLMs) ပေါ်တွင် လုပ်ကိုင်ခဲ့ဖူးသော AI သုတေသီ Gabe Pereyra တို့က တည်ထောင်ခဲ့သည်။ ၎င်းတို့သည် LLMs ကို အသုံးပြုပြီး အချက်အလက်များကို စုစည်းကာ ရှေ့နေများ ပြန်လည်သုံးသပ်ရန် တင်ပြပေးနိုင်မည့် အခွင့်အလမ်းတစ်ခုကို မြင်တွေ့ခဲ့ကြသည်။

“စာချုပ်ဆိုင်ရာ အလုပ်ရော litigation ရော ပိုမိုရှုပ်ထွေးလာနေပါတယ်—နိုင်ငံတကာ ပေါင်းစည်းမှုတစ်ခုအတွက် စစ်ဆေးရမည့် စာချုပ် သိန်းပေါင်းများစွာ ရှိနိုင်သလို၊ litigation အတွက် ပြန်လည်သုံးသပ်ရမည့် email သန်းပေါင်းများစွာလည်း ရှိနိုင်ပါတယ်” ဟု Weinberg က ရှင်းပြသည်။ AI က စာရွက်စာတမ်းများကို စုစည်းပေးခြင်းဖြင့် ရှေ့နေများသည် ဥပဒေရေးရာ စာသားများကို စစ်ဆေးဖတ်ရှုခြင်းနှင့် မူကြမ်းရေးဆွဲခြင်းတွင် အချိန်နည်းနည်းသာ အသုံးချရမည်ဖြစ်ပြီး၊ ဆုံးဖြတ်ချက်ချခြင်းနှင့် client များကို ကူညီခြင်းတွင် အချိန်ပိုမိုပေးနိုင်မည်ဖြစ်သည်။

အစောပိုင်း သက်သေပြချက်တစ်ခုမှာ Weinberg နှင့် Pereyra တို့က Reddit ၏ r/legaladvice မှ landlord/tenant မေးခွန်းများကို စုယူပြီး GPT‑3 ကို အသုံးပြုကာ အဖြေများ ထုတ်ပေးစေကာ ရှေ့နေများနှင့် မျှဝေခဲ့သည့်အခါ ဖြစ်သည်။ “မေးခွန်း 100 ထဲက 86 ခုအတွက် ရှေ့နေတွေက ပြင်ဆင်ခြင်းမရှိဘဲ ဒီအဖြေကို client ဆီ တိုက်ရိုက်ပို့လိုက်မယ်လို့ ပြောကြတယ်” ဟု Weinberg က ဆိုသည်။ “ဒါဟာ aha moment ပါပဲ။”

OpenAI နှင့်အတူ ပထမဆုံး စိတ်ကြိုက်လေ့ကျင့်ထားသော case law model ကို တည်ဆောက်ခြင်း

case law သုတေသနအတွက် Harvey အဖွဲ့သည် သင်က client ၏ မေးခွန်းကို case law model ထဲသို့ copy/paste လုပ်ထည့်လိုက်ရုံဖြင့် ၎င်းက ထိုမေးခွန်းကို အသေးစိတ်ပြည့်စုံစွာ ဖြေဆိုပြီး ၎င်း၏ အရင်းအမြစ်အားလုံးကို citation အဖြစ် ထည့်ပေးမည့် အတွေ့အကြုံတစ်ခုကို မျှော်မှန်းထားခဲ့သည်။ ၎င်းတို့သည် ပထမဦးစွာ အထင်ရှားဆုံး နည်းလမ်းများကို စမ်းသပ်ခဲ့သည်—public APIs များမှတစ်ဆင့် foundation models များကို fine-tuning လုပ်ခြင်းနှင့် retrieval-augmented generation (RAG) စနစ်များ တည်ဆောက်ခြင်း။ သို့သော် ထိုမျိုး အလွန်ရှုပ်ထွေးပြီး အဆုံးသတ်မသတ်မှတ်ရသေးသော use case အတွက် ကန့်သတ်ချက်များနှင့် ကြုံတွေ့ခဲ့ကြသည်။

“retrieval ပဲ လုပ်မယ်ဆိုရင် သင်က တကယ်မကျွမ်းကျင်တဲ့ ဥပဒေကဏ္ဍတွေထဲက အလွန်ရိုးရှင်းတဲ့ မေးခွန်းတွေကို ဖြေနိုင်ပါတယ်၊ ဒါပေမယ့် ရှေ့နေအများစုအတွက်တော့ အဲဒါက တကယ် အသုံးမဝင်ပါဘူး” ဟု Weinberg က ရှင်းပြသည်။ “case law သုတေသနမှာတော့ သင့်အငြင်းပွားချက်အတွက် အထောက်အပံ့ကို ရှာနေတာဖြစ်ပြီး၊ အဲဒါက လုပ်ဖို့ ပိုမိုခက်ခဲပါတယ်။”

Foundation models များသည် ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသောမှုတွင် ကောင်းမွန်သော်လည်း ဥပဒေရေးရာအလုပ်အတွက် လိုအပ်သော အသိပညာ မလုံလောက်ခဲ့ပါ။ ထို့ကြောင့် Harvey သည် OpenAI နှင့် ပူးပေါင်းပြီး စိတ်ကြိုက်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု တည်ဆောက်ရန် ဆုံးဖြတ်ခဲ့သည်။ ထိုမော်ဒယ်က ၎င်းတို့အား အခြေခံမော်ဒယ်များထဲသို့ အသိပညာအသစ်နှင့် ထိုအသိပညာကို ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသော နည်းလမ်းများကို ထည့်သွင်းနိုင်စေမည်ဖြစ်သည်။

“ဒီပြဿနာတွေထဲမှာ ဘာတစ်ခုမှ အတိအကျရှင်းလင်းတဲ့ ဖြေရှင်းချက် မရှိပါဘူး” ဟု Pereyra က ဆိုသည်။ “အများစုကတော့ အတူထိုင်ဆွေးနွေးရင်း ကျွန်တော်တို့ရဲ့ ရှေ့နေတွေက case law သုတေသန ဘယ်လိုလုပ်သလဲဆိုတာ ရှင်းပြပြီး၊ ကျွန်တော်တို့ရဲ့ သုတေသီတွေက ကျွန်တော်တို့ လုပ်ထားသမျှကို ပြသကာ၊ OpenAI ဆီကနေ ဒီပြဿနာကို ကိုင်တွယ်ဖို့ ဘယ်လို levers တွေ ရှိသလဲဆိုတာ သင်ယူခြင်းပါပဲ။”

Harvey နှင့် OpenAI သည် လိုအပ်သော context အနက်ကို ထည့်သွင်းပေးရန် အတူတကွ လုပ်ဆောင်ခဲ့ကြပြီး၊ ပထမဆုံး Delaware မှ case law များဖြင့် စတင်ကာ နောက်ပိုင်းတွင် U.S. case law အားလုံးအထိ ချဲ့ထွင်ခဲ့သည်။ ၎င်းတို့သည် စိတ်ကြိုက်လေ့ကျင့်ထားသော case law model ကို မောင်းနှင်ရန် ဒေတာ 10 billion တိုကင် နှင့်ညီမျှသော ပမာဏကို ထည့်သွင်းခဲ့သည်။

အရင်းအမြစ် citation များနှင့်အတူ အလွန်သက်ဆိုင်ပြီး တိကျသော ရလဒ်များ ရရှိစေခြင်း

case law model ကို စမ်းသပ်ရန် Harvey သည် အကြီးဆုံး ဥပဒေရေးရာ ကုမ္ပဏီ 10 ခုနှင့် လက်တွဲလုပ်ဆောင်ခဲ့သည်။ ၎င်းတို့က တူညီသော မေးခွန်းတစ်ခုအတွက် စိတ်ကြိုက် case law model မှ ထွက်လာသော output နှင့် GPT‑4 မှ ထွက်လာသော output ကို ယှဉ်တွဲပြသပြီး ရှေ့နေများအား ပေးခဲ့သည်။ ၎င်းတို့သည် တုံ့ပြန်မှု အားကောင်းလှသည်ကို အံ့အားသင့်ခဲ့ကြသည်။

GPT-4 နှင့် GPT-4 စိတ်ကြိုက်မော်ဒယ်တစ်ခု၏ နှိုင်းယှဉ်ချက်။ ရလာဒ်မော်ဒယ်သည် အချက်အလက်မှန်ကန်သော ဖြေကြားမှု 83% တိုးလာခဲ့ပြီး ရှေ့နေများက စိတ်ကြိုက်ပြင်ဆင်ထားသော မော်ဒယ်၏ output များကို GPT-4 ထက် အချိန်၏ 97% တွင် ပိုနှစ်သက်ခဲ့သည်။

“အချိန်၏ 97% မှာ ရှေ့နေတွေက case law model ကထွက်တဲ့ output ကို ပိုနှစ်သက်ကြတယ်” ဟု Weinberg က ဆိုသည်။ “များသောအားဖြင့်တော့ ပိုရှည်ပြီး ပိုပြည့်စုံတဲ့ အဖြေဖြစ်လို့ပါ။ မေးခွန်းက ဘာကိုတောင်းဆိုနေလဲဆိုတဲ့ အသေးစိတ်နက်ရှိုင်းချက်တွေထိ ဝင်ပြီး ပိုသက်ဆိုင်တဲ့ case law တွေကိုလည်း ပိုမိုဖုံးလွှမ်းပေးပါတယ်။”

Hallucination လျှော့ချခြင်းသည် Harvey က စိတ်ကြိုက်မော်ဒယ်တစ်ခု တည်ဆောက်ရန် အကြောင်းရင်းများထဲမှ တစ်ခုဖြစ်ပြီး၊ ထိုရင်းနှီးမြှုပ်နှံမှုက အကျိုးရခဲ့သည်။ “case law model က case တွေကို မတီထွင်ဖန်တီးသလို၊ စာကြောင်းတိုင်းကလည်း ၎င်းညွှန်းထားတဲ့ case နဲ့ တကယ်ပဲ အထောက်အထားပြုထားပါတယ်” ဟု Weinberg က ဆိုသည်။

၎င်းကို အသုံးပြုသူ ပိုများလာသည့်အခါ Harvey သည် briefs နှင့် motions မူကြမ်းရေးဆွဲခြင်း၊ သို့မဟုတ် တရားစီရင်ပိုင်ခွင့်ဒေသ မတူညီမှုများအလိုက် case law ဘယ်လိုကွာခြားသည်ကို ရှေ့နေများ နားလည်စေရန် ကူညီခြင်းကဲ့သို့ case law model ၏ အခြားအသုံးချမှုများကို စူးစမ်းလေ့လာရန် စိတ်အားထက်သန်နေသည်။

မျိုးဆက်သစ် LLMs အတွက် တည်ဆောက်ခြင်း

Pereyra က AI နယ်ပယ်တွင် အလုပ်လုပ်နေသော အခြား founder များအတွက် ဒီလို အကြံပေးခဲ့သည်။ “ယနေ့ မော်ဒယ်များ၏ လက်ရှိစွမ်းရည်အတွက် မတည်ဆောက်ပါနဲ့—မော်ဒယ်တွေ ဘယ်ကို ရောက်သွားမလဲဆိုတာအတွက် တည်ဆောက်ပါ။ မော်ဒယ်အကောင်းဆုံး ဗားရှင်းတွေ ထွက်လာတဲ့အခါ ဘေးထွက်အကျိုးဆက်အဖြစ် မဖြေရှင်းသွားနိုင်အောင် ပြဿနာတွေရဲ့ ပိုရှုပ်ထွေးတဲ့ ဗားရှင်းတွေကို ကိုင်တွယ်ပါ။”

Harvey က နောက်တစ်ခုအနေနဲ့ ဘာကို ကိုင်တွယ်နေသလဲ။ ၎င်းတို့၏ အဓိကအာရုံစိုက်မှုတစ်ခုမှာ အေးဂျင့် များ၊ သို့မဟုတ် မော်ဒယ်ခေါ်ယူမှုများစွာကို အလုပ်လုပ်နိုင်သော output တစ်ခုတည်းအဖြစ် ဘယ်လိုပေါင်းစည်းမလဲဆိုတာ ဖြစ်သည်။ ၎င်းက အသုံးပြုသူအတွေ့အကြုံကို ရိုးရှင်းစေပြီး အသုံးပြုသူများ လုပ်ရမည့် တုံ့ပြန်ညွှန်ကြားချက် တည်ဆောက်ခြင်း နှင့် စာရိုက်ရသည့် ပမာဏကို လျှော့ချပေးမည်ဖြစ်သည်။

ရည်မှန်းချက်မှာ Harvey သည် အဖွဲ့၏ အထောက်အကူပြု အဖွဲ့ဝင်တစ်ဦးအဖြစ် ဆောင်ရွက်ရန် ဖြစ်သည်။ “ဥပဒေရေးရာ အလုပ်ပမာဏက တိုးလာနေပြီး associate များက ရှုပ်ထွေးပေမယ့် ပုံမှန်ဖြစ်နေသော အလုပ်များအတွက် မရေမတွက်နိုင်သော နာရီများစွာ အသုံးချနေကြပါတယ်” ဟု Weinberg က ဆိုသည်။ “ကျွန်တော်တို့ရဲ့ အခွင့်အလမ်းက ဥပဒေရေးရာနဲ့သာ မဟုတ်ဘဲ ပရော်ဖက်ရှင်နယ် ဝန်ဆောင်မှုအားလုံးမှာ ပုံမှန်အလုပ်တွေကို တာဝန်ယူပေးဖို့ဖြစ်ပြီး၊ အဲဒီလိုနဲ့ ပရော်ဖက်ရှင်နယ်တွေက မိမိတို့ရဲ့ အချိန်ကို client interaction များအပေါ် ပိုမိုအာရုံစိုက်နိုင်ပါမယ်။”

“ဒါဟာ နောက်ဆုံးပေါ် သုတေသနပါ” ဟု Pereya က ဆိုသည်။ “အသစ်တစ်ခု စမ်းကြည့်ဖို့ အရင်းအမြစ်တွေ ရင်းနှီးပေးလိုတဲ့ မိတ်ဖက်တစ်ဦး လိုအပ်ခဲ့ပါတယ်။ ရွေးချယ်စရာအားလုံးကို ကျွန်တော်တို့ ကြည့်ခဲ့ပေမယ့် OpenAI နဲ့ပဲ စိတ်ကြိုက်လေ့ကျင့်ထားတဲ့ မော်ဒယ်တစ်ခု တည်ဆောက်ဖို့ ယုံကြည်ခဲ့ပါတယ်။”

“ဒါဟာ နောက်ဆုံးပေါ် သုတေသနပါ။ အသစ်တစ်ခု စမ်းကြည့်ဖို့ အရင်းအမြစ်တွေ ရင်းနှီးပေးလိုတဲ့ မိတ်ဖက်တစ်ဦး လိုအပ်ခဲ့ပါတယ်။ ရွေးချယ်စရာအားလုံးကို ကျွန်တော်တို့ ကြည့်ခဲ့ပေမယ့် OpenAI နဲ့ပဲ စိတ်ကြိုက်လေ့ကျင့်ထားတဲ့ မော်ဒယ်တစ်ခု တည်ဆောက်ဖို့ ယုံကြည်ခဲ့ပါတယ်။”

Gabe Pereyra၊ AI သုတေသီနှင့် ပူးတွဲတည်ထောင်သူ

စီးပွားရေးအတွက် ChatGPT အကြောင်း ပိုမိုလေ့လာလိုပါသလား။

ကျွန်ုပ်တို့၏ အဖွဲ့နှင့် ဆွေးနွေးပါ