გადადით მთავარ შინაარსზე
OpenAI

Harvey

Harvey OpenAI-სთან პარტნიორობს, რათა იურიდიული სფეროს პროფესიონალებისთვის ინდივიდუალურად გაწვრთნილი მოდელი შექმნას.

თეთრი Harvey-ის ლოგო ნაცრისფერ ფონზე.
იტვირთება…

გასული წლის განმავლობაში Harvey-მ თავი დაიმკვიდრა, როგორც უსაფრთხო გენერაციული AI პლატფორმამ იურიდიული, საგადასახადო და ფინანსური სფეროს პროფესიონალებისთვის. მათი გუნდი 100-ზე მეტ ადამიანამდე გაიზარდა, 2023 წელს შემოსავალი 10-ჯერ მეტად გაზარდეს და Series B რაუნდში $715M შეფასებით $80M მოიზიდეს.

ცოტა ხნის წინ Harvey OpenAI-სთან პარტნიორობით შექმნა ინდივიდუალურად გაწვრთნილი პრეცედენტული სამართლის მოდელი. ამან Harvey-ს საშუალება მისცა მიეწოდებინა AI სისტემები, რომლებიც ეხმარება ამოცანებში, რომლებსაც სჭირდება კომპლექსური მსჯელობა, ფართო დომენური ცოდნა და შესაძლებლობები, რომლებიც ერთი მოდელის გამოძახებას სცდება — მაგალითად, დოკუმენტების შედგენა, კითხვებზე პასუხის გაცემა რთული სასამართლო დავების სცენარებზე და ასობით კონტრაქტს შორის არსებითი შეუსაბამობების აღმოჩენა.

harvey

იურიდიულ ტექნოლოგიაში LLM-ებისთვის შესაძლებლის ხელახლა განსაზღვრა

Harvey დააარსეს Winston Weinberg-მა, იურისტმა, რომელსაც ანტიმონოპოლიური და ფასიანი ქაღალდების დავების სფეროში გამოცდილება ჰქონდა, და Gabe Pereyra-მ, AI მკვლევარმა, რომელიც ადრე Google Brain-სა და Meta-ში დიდ ენობრივ მოდელებზე (LLMs) მუშაობდა. მათ დაინახეს შესაძლებლობა, LLM-ები გამოეყენებინათ ინფორმაციის სინთეზისთვის და შემდეგ ის იურისტებისთვის გადასახედად წარედგინათ.

„როგორც ტრანზაქციული საქმეები, ისე დავები სულ უფრო რთული ხდება — საერთაშორისო შერწყმისთვის შეიძლება ასობით ათასი კონტრაქტი იყოს გადასახედი და დავებისთვის მილიონობით ელფოსტა შესასწავლი,“ განმარტა ვაინბერგმა. AI-ის დახმარებით დოკუმენტების სინთეზირებისას იურისტებს შეუძლიათ ნაკლები დრო დახარჯონ სამართლებრივი ტექსტების გადარჩევასა და შედგენაზე და მეტი დრო — გადაწყვეტილებების მიღებასა და კლიენტების დახმარებაზე.

ადრეული მტკიცებულება მაშინ გამოჩნდა, როცა ვაინბერგმა და პერეირამ Reddit-ის r/legaladvice-დან მეიჯარე/მოქირავნის საკითხებზე კითხვები აიღეს და GPT‑3 გამოიყენეს პასუხების შესაქმნელად, რომლებიც შემდეგ ადვოკატებს გაუზიარეს. „100 კითხვიდან 86-ზე ადვოკატებმა თქვეს, რომ პასუხს კლიენტს ჩასწორების გარეშე გაუგზავნიდნენ,“ თქვა ვაინბერგმა. „ეს ერთგვარი aha მომენტი იყო.“

OpenAI-სთან ერთად პირველი ინდივიდუალურად გაწვრთნილი პრეცედენტული სამართლის მოდელის შექმნა

პრეცედენტული სამართლის კვლევისთვის Harvey-ის გუნდს წარმოედგინა ისეთი გამოცდილება, სადაც კლიენტის კითხვას პრეცედენტული სამართლის მოდელში დააკოპირებდით/ჩასვამდით, ის კი ამ კითხვას ამომწურავად უპასუხებდა და ყველა წყაროს მოიყვანდა. თავდაპირველად მათ აშკარა ტექნიკები სცადეს: საბაზისო მოდელების fine-tuning საჯარო API-ების მეშვეობით და retrieval-augmented generation (RAG) სისტემების აგება. მაგრამ მათ შეეჯახნენ შეზღუდვებს ასეთი უნიკალურად რთული, ღია ტიპის გამოყენების შემთხვევაში.

„თუ მხოლოდ retrieval-ს იყენებ, შეგიძლია საკმაოდ მარტივ კითხვებს უპასუხო სამართლის ისეთ სფეროებზე, რომლებშიც რეალურად ექსპერტი არ ხარ, მაგრამ ეს უმეტეს ადვოკატისთვის მაინც დიდად სასარგებლო არ არის,“ განმარტა ვაინბერგმა. „პრეცედენტული სამართლის კვლევისას შენ შენი არგუმენტისთვის მასალას ეძებ, და ამის გაკეთება ბევრად უფრო რთულია.“

საბაზისო მოდელები ძლიერი იყო მსჯელობაში, მაგრამ იურიდიული სამუშაოსთვის საჭირო ცოდნა აკლდათ. ამიტომ Harvey-მ გადაწყვიტა OpenAI-სთან პარტნიორობა, რათა აეშენებინათ ინდივიდუალურად გაწვრთნილი მოდელი, რომელიც მათ საშუალებას მისცემდა საბაზისო მოდელებში ახალი ცოდნა და ამ ცოდნაზე მსჯელობის ახალი გზები შეეტანათ.

„ამ პრობლემებიდან არცერთს არ აქვს აშკარა გადაწყვეტა,“ თქვა პერეირამ. „ამის დიდი ნაწილი იყო ერთად დაჯდომა, ჩვენი იურისტებისგან ახსნის მოსმენა, როგორ მუშაობს პრეცედენტული სამართლის კვლევა, ჩვენი მკვლევრებისგან იმის ჩვენება, რაც უკვე გავაკეთეთ, და OpenAI-სგან სწავლა, რა ბერკეტები გვქონდა პრობლემასთან მისადგომად.“

Harvey-მ და OpenAI-მ ერთად იმუშავეს საჭირო კონტექსტის სიღრმის დასამატებლად, ჯერ Delaware-ის პრეცედენტული სამართლით დაიწყეს, შემდეგ კი მასშტაბირება გააკეთეს ისე, რომ აშშ-ის მთელი პრეცედენტული სამართალი მოეცვათ. მათ ინდივიდუალურად გაწვრთნილი პრეცედენტული სამართლის მოდელის გასაძლიერებლად 10 მილიარდი token-ის ეკვივალენტური მონაცემები დაამატეს.

წყაროს ციტირებით მაღალი შესაბამისობისა და სიზუსტის შედეგების მიღწევა

პრეცედენტული სამართლის მოდელის შესამოწმებლად Harvey თანამშრომლობდა 10 უმსხვილეს იურიდიულ ფირმასთან. მათ ადვოკატებს აჩვენეს ერთსა და იმავე კითხვაზე ინდივიდუალური პრეცედენტული სამართლის მოდელის შედეგი GPT‑4‑ის შედეგთან გვერდიგვერდ. მათთვის მოულოდნელი იყო, რამდენად ძლიერი იყო რეაქცია.

GPT-4-ისა და GPT-4-ის ინდივიდუალური მოდელის შედარება. შედეგად მიღებულმა მოდელმა ფაქტობრივ პასუხებში 83%-იანი ზრდა აჩვენა, ხოლო ადვოკატებმა დროის 97%-ში უპირატესობა მიანიჭეს ინდივიდუალურად მორგებული მოდელის შედეგებს GPT-4-თან შედარებით.

„დროის 97%-ში იურისტებმა უპირატესობა პრეცედენტული სამართლის მოდელის შედეგს მიანიჭეს,“ თქვა ვაინბერგმა. „როგორც წესი, მიზეზი ის იყო, რომ ეს უფრო გრძელი და სრულყოფილი პასუხი იყო. ის კითხვის ნიუანსებში უფრო ღრმად შედიოდა და უფრო შესაბამის პრეცედენტულ სამართალს ფარავდა.“

ჰალუცინაციების შემცირება Harvey-სთვის ინდივიდუალური მოდელის შექმნის ერთ-ერთი მოტივაცია იყო და ამ ინვესტიციამ გაამართლა. „პრეცედენტული სამართლის მოდელი არა მხოლოდ არ იგონებს საქმეებს, არამედ თითოეული წინადადება რეალურად გამყარებულია იმ საქმით, რომელსაც ციტირებს,“ თქვა ვაინბერგმა.

რადგან ამ გადაწყვეტას უფრო მეტ მომხმარებელზე ავრცელებენ, Harvey-ს სურს შეისწავლოს პრეცედენტული სამართლის მოდელის სხვა გამოყენებებიც, მაგალითად, სამართლებრივი ბრიფებისა და შუამდგომლობების შედგენა, ან იურისტებისთვის დახმარება იმის გაგებაში, როგორ განსხვავდება პრეცედენტული სამართალი სხვადასხვა იურისდიქციაში.

შემდეგი თაობის LLM-ებისთვის შექმნა

პერეირამ AI სფეროში მომუშავე სხვა დამფუძნებლებს ასეთი რჩევა მისცა: „არ ააშენოთ დღეს არსებული მოდელების მიმდინარე შესაძლებლობებისთვის — ააშენეთ იმისთვის, სადაც მოდელები მიდიან. შეეჭიდეთ პრობლემების უფრო რთულ ვერსიებს, რათა როცა მოდელების უკეთესი ვერსიები გამოვა, ისინი გვერდითი ეფექტით უკვე გადაწყვეტილი არ იყოს.“

რას უმიზნებს Harvey შემდეგ? მათი ერთ-ერთი ფოკუსია აგენტები, ანუ როგორ გააერთიანონ მოდელის რამდენიმე გამოძახება ერთ სამუშაო შედეგში. ეს გაამარტივებდა მომხმარებლის გამოცდილებას და შეამცირებდა მოთხოვნების შექმნისა და ბეჭდვის იმ რაოდენობას, რომელიც მომხმარებლებს სჭირდებათ.

ხედვა ისაა, რომ Harvey გუნდის მხარდამჭერ წევრად იქცეს. „იურიდიული სამუშაოს მოცულობა იზრდება და ასოცირებულები უთვალავ საათს ხარჯავენ რთულ, მაგრამ რუტინულ ამოცანებზე,“ თქვა ვაინბერგმა. „შესაძლებლობა, რომელიც გვაქვს, არა მხოლოდ იურიდიულ სფეროში, არამედ ყველა პროფესიულ სერვისში, არის ის, რომ ვიზრუნოთ რუტინულ ამოცანებზე, რათა პროფესიონალებმა თავიანთი დრო კლიენტებთან ურთიერთობაზე გაამახვილონ.“

„ეს მოწინავე კვლევა იყო,“ თქვა პერეიამ. „გვჭირდებოდა პარტნიორი, რომელიც მზად იქნებოდა რესურსები დაებანდებინა რაღაც ახლის საცდელად. ყველა ვარიანტი განვიხილეთ, მაგრამ ინდივიდუალურად გაწვრთნილი მოდელის შექმნას მხოლოდ OpenAI-ს ვანდობდით.“

„ეს მოწინავე კვლევა იყო. გვჭირდებოდა პარტნიორი, რომელიც მზად იქნებოდა რესურსები დაებანდებინა რაღაც ახლის საცდელად. ყველა ვარიანტი განვიხილეთ, მაგრამ ინდივიდუალურად გაწვრთნილი მოდელის შექმნას მხოლოდ OpenAI-ს ვანდობდით.“
Gabe Pereyra, AI მკვლევარი და თანადამფუძნებელი

გაინტერესებთ მეტი გაიგოთ ბიზნესისთვის განკუთვნილი ChatGPT‑ის შესახებ?