Salta al contingut principal
OpenAI

Harvey

Harvey s’associa amb OpenAI per construir un model entrenat a mida per a professionals del dret.

Logotip blanc de Harvey sobre un fons gris.
S'està carregant…

Durant l’últim any, Harvey s’ha consolidat com una plataforma segura d’IA generativa per a professionals del dret, la fiscalitat i les finances. Han crescut fins a superar les 100 persones, han augmentat els ingressos més de 10 vegades el 2023 i han captat 80 milions de dòlars en una ronda Sèrie B amb una valoració de 715 milions de dòlars.

Recentment, Harvey es va associar amb OpenAI per crear un model de jurisprudència entrenat a mida. Això ha permès a Harvey oferir sistemes d’IA que ajuden amb tasques que requereixen raonament complex, un ampli coneixement del domini i capacitats que van més enllà d’una sola crida al model, com ara redactar documents, respondre preguntes sobre escenaris complexos de litigi i identificar discrepàncies materials entre centenars de contractes.

harvey

Redefinint el que és possible per als LLM en tecnologia jurídica

Harvey va ser fundada per Winston Weinberg, un advocat amb experiència en litigis antimonopoli i de valors, i Gabe Pereyra, un investigador d’IA que abans havia treballat en LLM per a Google Brain i Meta. Van veure una oportunitat d’utilitzar LLM per sintetitzar informació i presentar-la als advocats perquè la revisessin.

«Tant el treball transaccional com el litigi s’han anat fent cada cop més complexos: pot haver-hi centenars de milers de contractes per revisar en una fusió internacional i milions de correus electrònics per revisar en un litigi», va explicar Weinberg. Amb la IA ajudant a sintetitzar documents, els advocats poden dedicar menys temps a examinar i redactar textos jurídics, i més temps a prendre decisions i ajudar els clients.

Una primera prova va arribar quan Weinberg i Pereyra van extreure preguntes sobre arrendador/arrendatari de r/legaladvice de Reddit i van utilitzar GPT‑3 per generar respostes, que després van compartir amb advocats. «Per a 86 de cada 100 preguntes, els advocats van dir que haurien enviat la resposta al client sense editar-la», va dir Weinberg. «Va ser un moment revelador.»

Construint el primer model de jurisprudència entrenat a mida amb OpenAI

Per a la recerca de jurisprudència, l’equip de Harvey imaginava una experiència en què es pogués copiar i enganxar una pregunta d’un client en un model de jurisprudència, i aquest respongués la pregunta de manera exhaustiva i cités totes les seves fonts. Primer van provar les tècniques òbvies: ajustar models fundacionals mitjançant API públiques i construir sistemes de generació augmentada per recuperació (RAG). Però es van trobar amb limitacions en un cas d’ús tan singularment complex i obert.

«Si només fas recuperació, pots respondre preguntes molt senzilles sobre àrees del dret en què no ets realment expert, però això en realitat no és gaire útil per a la majoria d’advocats», va explicar Weinberg. «Amb la recerca de jurisprudència, busques munició per al teu argument, i això és molt més difícil de fer.»

Els models fundacionals eren sòlids en raonament, però no tenien el coneixement necessari per al treball jurídic. Per això, Harvey va decidir associar-se amb OpenAI per construir un model entrenat a mida que els permetés injectar coneixement nou, i maneres de raonar sobre aquest coneixement, als models base.

«Cap d’aquests problemes no té una solució clara», va dir Pereyra. «Gran part consistia a asseure’ns junts, fer que els nostres advocats expliquessin com funciona la recerca de jurisprudència, que els nostres investigadors mostressin què havíem fet i aprendre d’OpenAI quines palanques teníem per abordar el problema.»

Harvey i OpenAI van treballar plegats per afegir la profunditat de context necessària, començant primer per la jurisprudència de Delaware i després ampliant-la per incloure tota la jurisprudència dels Estats Units. Van afegir l’equivalent a 10.000 milions de segments de dades per impulsar el model de jurisprudència entrenat a mida.

Aconseguir resultats molt rellevants i precisos amb citacions de fonts

Per provar el model de jurisprudència, Harvey va treballar amb 10 dels despatxos d’advocats més grans. Van proporcionar als advocats comparatives en paral·lel entre el resultat del model personalitzat de jurisprudència i el resultat de GPT‑4 per a la mateixa pregunta. Els va sorprendre la intensitat de la reacció.

Una comparació entre GPT-4 i un model personalitzat de GPT-4. El model resultant va aconseguir un augment del 83% en respostes factuals i els advocats van preferir els resultats del model personalitzat el 97% del temps respecte a GPT-4.

«El 97% del temps, els advocats van preferir el resultat del model de jurisprudència», va dir Weinberg. «Normalment, era perquè era una resposta més llarga i més completa. Entrava en el matís del que demanava la pregunta i cobria més jurisprudència rellevant.»

La reducció de les al·lucinacions era una de les motivacions de Harvey per crear un model personalitzat, i la inversió va donar resultat. «El model de jurisprudència no només no s’inventa casos, sinó que cada frase està realment sustentada pel cas que cita», va dir Weinberg.

A mesura que ho despleguen per a més usuaris, Harvey té ganes d’explorar altres aplicacions del model de jurisprudència, com ara redactar escrits i mocions, o ajudar els advocats a entendre com varia la jurisprudència entre diferents jurisdiccions.

Construint per a la pròxima generació de LLM

Pereyra va oferir aquest consell a altres fundadors que treballen en IA: «No construïu per a les capacitats actuals dels models d’avui; construïu pensant cap on aniran els models. Afronteu versions més complexes dels problemes perquè, quan surtin versions millors dels models, no quedin resolts com a efecte secundari.»

Què afronta Harvey a continuació? Un dels seus focus són els agents, és a dir, com combinar múltiples crides al model en un únic resultat funcional. Això simplificaria l’experiència d’usuari i reduiria la quantitat d’enginyeria d'indicacions i de tecleig que han de fer els usuaris.

La visió és que Harvey actuï com un membre de suport de l’equip. «El volum de feina jurídica està creixent i els associats dediquen innombrables hores a tasques complexes, però rutinàries», va dir Weinberg. «L’oportunitat que tenim, no només en l’àmbit jurídic sinó en tots els serveis professionals, és encarregar-nos de les tasques rutinàries perquè els professionals puguin centrar el seu temps en les interaccions amb els clients.»

«Això era recerca capdavantera», va dir Pereya. «Necessitàvem un soci disposat a invertir recursos per provar una cosa nova. Vam valorar totes les opcions, però només confiàvem a construir un model entrenat a mida amb OpenAI.»

«Això era recerca capdavantera. Necessitàvem un soci disposat a invertir recursos per provar una cosa nova. Vam valorar totes les opcions, però només confiàvem a construir un model entrenat a mida amb OpenAI.»
Gabe Pereyra, investigador d’IA i cofundador

T’interessa saber més sobre ChatGPT per a empreses?