Harvey
Harvey colabora con OpenAI para desarrollar un modelo entrenado a medida para los profesionales jurídicos.

En el último año, Harvey se ha establecido como una plataforma de IA generativa segura para profesionales en derecho, impuestos y finanzas. Han crecido hasta tener un equipo de más de 100 personas, incrementaron sus ingresos más de diez veces en 2023 y recaudaron 80 millones de dólares en la financiación de la serie B a una valoración de 715 millones.
Recientemente, Harvey colaboró con OpenAI para crear un modelo entrenado a la medida para casos legales. Esto ha permitido a Harvey ofrecer sistemas de IA que ayudan con tareas que requieren de razonamiento complejo, conocimiento extenso del dominio y capacidades más allá de una única llamada al modelo. Un ejemplo claro es poder redactar documentos, responder preguntas sobre escenarios de litigios complejos e identificar discrepancias importantes entre cientos de contratos.

Redefinir lo que es posible para los LLM en la tecnología jurídica
Harvey fue fundada por Winston Weinberg, un abogado con antecedentes en litigios antimonopolio y de valores, y Gabe Pereyra, un investigador de IA que trabajó previamente en modelos de lenguaje de gran tamaño (LLM) para Google Brain y Meta. Vieron una oportunidad para usar los LLM para sintetizar información y presentársela a los abogados para su revisión.
“Tanto el trabajo transaccional como los litigios se han vuelto cada vez más complejos, podría haber cientos de miles de contratos que revisar para una fusión internacional y millones de correos electrónicos que inspeccionar para un litigio”, explicó Weinberg. Con la ayuda de la IA para sintetizar documentos, los abogados pueden dedicar menos tiempo revisando y redactando textos legales y más tiempo tomando decisiones y ayudando clientes.
Una de las primeras pruebas surgió cuando Weinberg y Pereyra tomaron preguntas sobre arrendatarios/inquilinos de la sección de consejos legales (r/legaladvice) de Reddit y utilizaron GPT‑3 para generar respuestas, las cuales compartieron con abogados. “Para 86 de 100 preguntas, los abogados dijeron que hubieran enviado la misma respuesta al cliente sin editar ―afirmó Weinberg―. Fue un momento revelador.”
El desarrollo del primer modelo de jurisprudencia entrenado a la medida con OpenAI
Para la investigación de jurisprudencia, el equipo en Harvey imaginó una experiencia en la que podrías copiar y pegar la pregunta de un cliente en un modelo de jurisprudencia y respondería dicha pregunta minuciosamente y citando todas sus fuentes. Primero intentaron con las técnicas obvias: hicieron un ajuste fino de los modelos base mediante API públicas y desarrollaron sistemas de generación aumentada por recuperación (RAG). Pero se encontraron con limitaciones con un caso de uso tan único, complejo y abierto.
“Si solo llevas a cabo la recuperación, puedes responder preguntas muy sencillas sobre áreas jurídicas en las que realmente no eres experto, pero eso en realidad no es tan útil para la mayoría de los abogados ―explicó Weinberg―. Con la investigación de jurisprudencia, encuentras municiones para tu argumento y eso es mucho más difícil de hacer”.
Los modelos base fueron sólidos en el razonamiento, pero les hacía falta el conocimiento requerido para el trabajo jurídico. Entonces, Harvey decidió colaborar con OpenAI para desarrollar un modelo entrenado a la medida que les permitiría inyectar nuevo conocimiento y formas de razonamiento sobre dicho conocimiento, en los modelos base.
“Ninguno de estos problemas tiene una solución clara y definitiva ―declaró Pereyra―. Mucho consistió en sentarnos juntos, que nuestros abogados nos explicaran cómo funciona la investigación de jurisprudencia, que nuestros investigadores les mostraran lo que habíamos hecho y aprender de OpenAI sobre los mecanismos que teníamos para abordar el problema”.
Harvey y OpenAI trabajaron juntos para agregar la profundidad del contexto necesaria. Empezaron con la jurisprudencia de Delaware y posteriormente la ampliaron para que incluyera toda la jurisprudencia de Estados Unidos. Agregaron el equivalente a 10 mil millones de tokens de datos para alimentar el modelo de jurisprudencia entrenado a la medida.
Lograr resultados altamente relevantes y precisos con citas de las fuentes
Para probar el modelo de jurisprudencia, Harvey trabajó con 10 de los bufetes jurídicos más importantes. Presentaron a los abogados comparaciones directas de los datos de salida del modelo de jurisprudencia personalizado contra los datos de salida generados por GPT‑4 para la misma pregunta. Se sorprendieron por lo fuerte que fue la reacción.

“97 % de las veces, los abogados prefirieron el resultado generado por el modelo de jurisprudencia ―comentó Weinberg―. En general, fue porque era una respuesta más larga y completa. Entraba en los detalles de lo que buscaba la pregunta y abarcaba una jurisprudencia más relevante”.
La reducción de alucinaciones fue una de las motivaciones de Harvey para desarrollar un modelo personalizado, y la inversión rindió frutos. “El modelo de jurisprudencia no solo no inventa casos, sino que cada enunciado está respaldado con el caso que está citando”, afirmó Weinberg.
Conforme lo implementan con más usuarios, en Harvey están entusiasmados por explorar otras aplicaciones del modelo de jurisprudencia, como redactar alegatos y mociones, o ayudar a los abogados a comprender cómo varía la jurisprudencia en diferentes jurisdicciones.
Desarrollo para la próxima generación de LLM
Pereyra ofreció este consejo para otros emprendedores que trabajan con la IA: “No desarrollen para las capacidades actuales de los modelos, desarrollen para el futuro al que van a llegar los modelos. Enfrenten versiones más complejas de los problemas para que cuando mejores versiones de los modelos estén disponibles, no se resuelvan como un efecto secundario”.
¿Qué abordará Harvey a continuación? Uno de sus enfoques está en los agentes o cómo combinar múltiples llamadas al modelo en un solo conjunto funcional de datos de salida. Esto simplificaría la experiencia del usuario y reduciría la cantidad de ingeniería de prompts y redacción que los usuarios tienen que hacer.
La visión es que Harvey funcione como un miembro de soporte del equipo. “El volumen de trabajo jurídico está en aumento y los colaboradores dedican un sinnúmero de horas en tareas complejas, pero de rutina ―afirmó Weinberg―. La oportunidad que tenemos, no solo con el servicio jurídico sino con todos los servicios profesionales, es encargarnos de las tareas de rutina para que los especialistas puedan enfocarse en las interacciones con los clientes”.
“Esto fue una investigación vanguardista ―señaló Pereyra―. Necesitábamos un socio que estuviera dispuesto a invertir recursos para probar algo nuevo. Revisamos todas las opciones, pero solo confiamos en desarrollar un modelo entrenado a la medida con OpenAI”.
“Esto fue una investigación vanguardista. Necesitábamos un socio que estuviera dispuesto a invertir recursos para probar algo nuevo. Revisamos todas las opciones, pero solo confiamos en desarrollar un modelo entrenado a la medida con OpenAI”.


