Harvey
Harvey құқық мамандарына арналған арнайы үйретілген модель жасау үшін OpenAI-пен серіктеседі.

Өткен жылы Harvey құқық, салық және қаржы салаларындағы мамандарға арналған қауіпсіз генеративті AI платформасы ретінде орнықты. Компания командасын 100-ден астам адамға дейін өсіріп, 2023 жылы кірісін 10 еседен астам арттырды және $715M бағалаумен Series B кезеңінде $80M инвестиция тартты.
Жақында Harvey OpenAI-пен серіктесіп, сот практикасына арналған арнайы үйретілген модель жасады. Соның арқасында Harvey күрделі ой қорытуды, кең ауқымды салалық білімді және бір модель шақыруынан тыс мүмкіндіктерді қажет ететін тапсырмаларға көмектесетін AI жүйелерін ұсына алды—мысалы, құжаттар дайындау, күрделі сот дауы сценарийлері туралы сұрақтарға жауап беру және жүздеген келісімшарт арасындағы елеулі сәйкессіздіктерді анықтау.

Құқықтық технологияда LLM үшін мүмкіндікті қайта анықтау
Harvey негізін антимонополиялық және бағалы қағаздар бойынша сот даулары саласында тәжірибесі бар адвокат Winston Weinberg пен бұрын Google Brain және Meta компанияларында large language models (LLMs) бағытында жұмыс істеген AI зерттеушісі Gabe Pereyra қалады. Олар LLM (үлкен тілдік модель) көмегімен ақпаратты синтездеп, оны заңгерлерге қарауға ұсыну мүмкіндігін көрді.
«Мәмілелік жұмыс та, сот даулары да барған сайын күрделеніп келеді—халықаралық бірігу үшін қаралуы тиіс жүздеген мың келісімшарт және сот дауы үшін тексерілуі тиіс миллиондаған электрондық хат болуы мүмкін», — деп түсіндірді Вайнберг. AI құжаттарды синтездеуге көмектескенде, заңгерлер құқықтық мәтіндерді саралау мен дайындауға азырақ уақыт жұмсап, шешім қабылдау мен клиенттерге көмектесуге көбірек уақыт бөле алады.
Ерте дәлелдердің бірі Weinberg пен Pereyra Reddit-тегі r/legaladvice арнасынан жалға беруші/жалға алушы сұрақтарын алып, GPT‑3 арқылы жауаптар жасап, оларды адвокаттармен бөліскенде пайда болды. «100 сұрақтың 86-сы бойынша адвокаттар жауапты өңдемей-ақ клиентке жіберер едік деді», — деді Вайнберг. «Бұл нағыз aha сәті болды.»
OpenAI-пен бірге сот практикасына арналған алғашқы арнайы үйретілген модельді жасау
Сот практикасын зерттеу үшін Harvey командасы клиент сұрағын сот практикасы моделіне көшіріп қойып, ол сұраққа жан-жақты жауап беріп, барлық дереккөздеріне сілтеме жасайтын тәжірибені елестетті. Алдымен олар айқын тәсілдерді қолданып көрді: қоғамдық API арқылы базалық модельдерді fine-tuning жасау және retrieval-augmented generation (RAG) жүйелерін құру. Бірақ осындай бірегей күрделі, ашық қолдану сценарийінде шектеулерге тап болды.
«Егер тек retrieval жасасаңыз, өзіңіз шын мәнінде сарапшы емес құқық салалары бойынша өте қарапайым сұрақтарға жауап бере аласыз, бірақ бұл көп адвокат үшін аса пайдалы емес», — деп түсіндірді Вайнберг. «Сот практикасын зерттеуде сіз өз уәжіңізге дәлел іздейсіз, ал оны істеу әлдеқайда қиын.»
Базалық модельдер ой қорытуда мықты болды, бірақ құқықтық жұмысқа қажет білім жетіспеді. Сондықтан Harvey OpenAI-пен серіктесіп, жаңа білімді және сол білім туралы ой қорыту тәсілдерін базалық модельдерге енгізуге мүмкіндік беретін арнайы үйретілген модель жасауды шешті.
«Бұл мәселелердің ешқайсысында нақты дайын шешім жоқ», — деді Pereyra. «Көп жағдайда бірге отырып, заңгерлеріміз сот практикасын зерттеу қалай жұмыс істейтінін түсіндірді, зерттеушілеріміз не істегенімізді көрсетті, әрі OpenAI-ден мәселені шешуге қолдана алатын тетіктерді үйрендік.»
Harvey мен OpenAI қажетті контекст тереңдігін қосу үшін алдымен Delaware сот практикасынан бастап, кейін оны АҚШ-тың бүкіл сот практикасын қамтитындай етіп кеңейтті. Олар арнайы үйретілген сот практикасы моделін іске қосу үшін 10 миллиард токенге тең дерек қосты.
Дереккөз сілтемелерімен өте өзекті, дәл нәтижелерге қол жеткізу
Сот практикасы моделін сынау үшін Harvey ең ірі 10 заң фирмасымен жұмыс істеді. Олар адвокаттарға бір сұраққа арналған арнайы сот практикасы моделінің нәтижесін GPT‑4 нәтижесімен қатар көрсетіп берді. Реакцияның қаншалықты күшті болғанына олар таң қалды.

«Уақыттың 97%-ында заңгерлер сот практикасы моделінің нәтижесін таңдады», — деді Вайнберг. «Көбіне себебі жауап ұзағырақ әрі толығырақ болды. Ол сұрақтың нақты нені сұрап тұрғанының қыр-сырын ашып, анағұрлым өзекті сот практикасын қамтыды.»
Галлюцинацияларды азайту Harvey-дің арнайы модель жасаудағы себептерінің бірі болды, және бұл инвестиция өзін ақтады. «Сот практикасы моделі істерді ойдан шығармайды ғана емес, әр сөйлемі сілтеме жасап отырған ісімен нақты расталады», — деді Вайнберг.
Оны көбірек пайдаланушыға ұсына бастаған сайын, Harvey сот практикасы моделінің басқа да қолданылуын зерттеуге ынталы, мысалы, қысқаша құқықтық құжаттар мен өтініштер дайындау немесе адвокаттарға сот практикасының әртүрлі юрисдикцияларда қалай өзгеретінін түсінуге көмектесу.
LLM-дің келесі буыны үшін құру
Pereyra AI саласында жұмыс істейтін өзге құрылтайшыларға мынадай кеңес берді: «Бүгінгі модельдердің қазіргі мүмкіндіктеріне арнап құрмаңыз—модельдер қай бағытқа бара жатса, соған арнап құрыңыз. Мәселелердің күрделірек нұсқаларын шешіңіз, сонда модельдердің жақсырақ нұсқалары шыққанда, олар жанама әсер ретінде өздігінен шешіліп қалмайды.»
Harvey келесіде немен айналысып жатыр? Негізгі бағыттарының бірі — агенттер, яғни бірнеше модель шақыруын бір жұмыс нәтижесіне қалай біріктіру. Бұл пайдаланушы тәжірибесін жеңілдетіп, пайдаланушыларға қажет көмексөз инженериясы мен теру көлемін азайтады.
Мақсат — Harvey командаға қолдау көрсететін мүше ретінде қызмет етуі. «Құқықтық жұмыс көлемі өсіп жатыр, ал кіші заңгерлер күрделі, бірақ күнделікті тапсырмаларға сансыз сағат жұмсайды», — деді Вайнберг. «Бізде құқық саласында ғана емес, барлық кәсіби қызметтерде де күнделікті тапсырмаларды өз мойнымызға алып, мамандар өз уақытын клиенттермен өзара әрекетке жұмсай алатындай мүмкіндік бар.»
«Бұл озық зерттеу болды», — деді Pereya. «Бізге жаңа нәрсені сынау үшін ресурстар салуға дайын серіктес керек болды. Біз барлық нұсқаны қарастырдық, бірақ арнайы үйретілген модельді тек OpenAI-пен бірге жасауға сендік.»
«Бұл озық зерттеу болды. Бізге жаңа нәрсені сынау үшін ресурстар салуға дайын серіктес керек болды. Біз барлық нұсқаны қарастырдық, бірақ арнайы үйретілген модельді тек OpenAI-пен бірге жасауға сендік.»


