Paradigm
Paradigm usa la API de OpenAI para mejorar el acceso de los pacientes a los ensayos clínicos.

Los ensayos clínicos son nuestra forma de descubrir nuevos tratamientos, algunos de los cuales pueden llegar a salvar vidas. Paradigm(se abre en una ventana nueva) proporciona tecnología al sector sanitario con el fin de acercar los ensayos clínicos a más personas, como los pacientes de cáncer, así como para reducir la carga de trabajo del personal médico y de enfermería y evitar el desgaste profesional.

Evaluar las historias clínicas es uno de los principales obstáculos que impiden incluir a más pacientes en estudios clínicos que puedan ofrecerles mejores opciones de tratamiento. Los profesionales sanitarios apenas tienen tiempo de buscar ensayos clínicos, leerlos con detenimiento y luego buscar pacientes que cumplan los requisitos. Como consecuencia, en la mayoría de estudios clínicos participan pacientes que viven cerca de dónde se desarrollan, lo cual genera un sesgo en el proceso de selección e impide que muchos pacientes tengan acceso al tratamiento revolucionario que podría salvarles la vida.
Para paliar esta situación, Paradigm implementó y optimizó los modelos de procesamiento del lenguaje natural (PNL) y de aprendizaje automático (ML) más exitosos del sector para extraer e interpretar la información de las historias clínicas. Dichos modelos se entrenaron y evaluaron a partir de conjuntos de datos de excepcional calidad, cuidadosamente seleccionados por profesionales clínicos. A pesar de todo, este era un método lento y oneroso.
«Implementamos modelos sanitarios perfeccionados y muy avanzados, y además los optimizamos. Esto requiere mucho tiempo, porque te obliga a ir aplicación por aplicación. Hay que diseñar, entrenar y validar cada modelo por separado teniendo en cuenta cada tipo de información».
Dadas las limitaciones de los modelos tradicionales, los médicos se veían obligados a revisar manualmente el resultado del modelo para comprobar que cumpliera los estándares de calidad.
Paradigm consideró que los LLM, y su capacidad para resumir texto desestructurado, podían ser unos candidatos fantásticos para sus aplicaciones y evitar así el diseño de modelos de ML de un solo uso. Así pues, valoraron dos vías distintas: integrar un LLM personalizado que estuviera entrenado con casos de uso médicos o bien integrar un GPT‑4 a través de la API de OpenAI.
Paradigm sabía que necesitaba un modelo especializado en medicina para obtener los mejores resultados. Les «sorprendió» descubrir que GPT‑4 superara en rendimiento al de un equipo de expertos altamente cualificados y versados en tareas de evaluación de datos complejos.
Finalmente se decantaron por OpenAI por distintos motivos:
- Precisión: Paradigm evaluó con el máximo rigor los conjuntos de datos de calidad seleccionados por sus expertos. GPT‑4 resultó ser como mínimo un 10 % más preciso que los modelos de ML más avanzados en una métrica combinada de precisión y exhaustividad. En algunos casos, observaron mejoras «inimaginables». «La precisión de OpenAI era mejor que la de nuestros mejores modelos del sector entrenados por expertos y optimizados. En algunos casos, incluso fue mejor que la de nuestro personal clínico con más experiencia», admite Hirsch. «Cuanto más compleja y más repartida estaba la información, mejores resultados daba GPT‑4».
- Uso intuitivo: «No tuvimos dificultades con el producto. La API era fácil de usar y de integrar con nuestra pila tecnológica». El equipo también valoró que la documentación de la API de OpenAI fuera de calidad: «En comparación con otras empresas con las que hemos trabajado, OpenAI nos permite ser más autosuficientes».
- Entrada multimodal y ventanas de contexto largas: ambas funciones clave para los historiales médicos.
- Seguridad y cumplimiento normativo: «Lo que nos acabó de convencer de OpenAI fue que se toman muy en serio el cumplimiento normativo, incluida nuestra necesidad de cumplir con la HIPAA. Puesto que trabajamos con profesionales sanitarios y sus pacientes, el cumplimiento normativo es un requisito irrenunciable para nosotros».
- Extraer nuevos elementos de datos en cuestión de días, no de meses: GPT‑4 ha transformado la forma en la que Paradigm se plantea su infraestructura central, y ha pasado de crear modelos de ML independientes a componentes de datos individuales. Este nuevo método ha agilizado la hoja de ruta de Paradigm y les ha ayudado a captar nuevas colaboraciones e introducir otros tipos de ensayos.
- Se reduce en un 90 % el tiempo que necesitan los profesionales clínicos en validar los modelos: Paradigm calcula que para evaluar los resultados que arroja GPT‑4 solo necesitan una décima parte de los datos de los modelos de ML especializados anteriores.
- Aumenta la precisión un 10 %: al disponer de más datos precisos que antes y dado que, en muchos casos, estos datos mejoran los resultados de los expertos, GPT‑4 ha reducido la necesidad de intervención humana en los resultados de los modelos. A raíz de esto, el personal médico y de enfermería de Paradigm, y sus colaboradores del sector sanitario, pueden dedicar más tiempo a sus pacientes en lugar de a leer documentación.
- Acceso más equitativo a los ensayos: aunque los resultados no son definitivos, Paradigm cree firmemente que GPT‑4 es capaz de seleccionar con más precisión a los pacientes olvidados para que participen en estudios. Se trata de pacientes que suelen tener una historia clínica más caótica y más datos desestructurados (por ejemplo, en forma de anotaciones), algo que a GPT‑4 se le da muy bien extraer e interpretar.
En el futuro, Paradigm se propone aprovechar el potencial de la comprensión del lenguaje natural de GPT‑4 para seguir reduciendo la carga de trabajo de los médicos. En lugar de tener que escribir código para analizar los datos, los médicos e investigadores podrían conversar con ChatGPT para saber si son aptos para los ensayos, conocer la información que les falta y saber cómo proceder.
Paradigm está deseando encontrar nuevas formas de mejorar los índices de cribado de los pacientes. Con ayuda de GPT‑4, su plataforma podrá llegar a evaluar a cientos de pacientes por minuto. Imaginemos la diferencia que supone con respecto a un coordinador de ensayo clínico, que puede revisar manualmente unos 50 pacientes al día. Como consecuencia, los pacientes disfrutarían de un mayor acceso a los estudios clínicos, y el personal médico y de enfermería podría dedicar más tiempo a atenderlos y menos a revisar documentación. Por si fuera poco, los nuevos tratamientos que podrían salvar vidas podrían llegar al mercado más rápido.


