Ir al contenido principal
OpenAI

18 de junio de 2026

Producto

Mejorar la inteligencia Sanitaria en ChatGPT

GPT‑5.5 Instant lleva inteligencia sanitaria de frontera a más personas, impulsada por avances en nuestros modelos y por evaluaciones dirigidas por médicos.

Cargando…

La salud es una de las formas más importantes en que las personas usan ChatGPT. Cada semana, más de 230 millones de personas recurren a ChatGPT para obtener ayuda con preguntas sobre salud y bienestar: interpretar información sanitaria, entender resultados de análisis, prepararse para citas médicas, gestionar seguros, crear hábitos más saludables y decidir qué preguntar a continuación.

Con GPT‑5.5 Instant, observamos un avance sustancial en la forma en que el modelo gestiona las preguntas de salud, con mejoras a la hora de reconocer cuándo puede ser necesaria atención urgente, pedir contexto relevante, explicar la incertidumbre y hacer que la información compleja sea más fácil de entender. En nuestras evaluaciones de salud más exigentes, GPT‑5.5 Instant alcanza ahora un nivel comparable al de nuestros modelos Thinking de frontera. Como está disponible para usuarios gratuitos en ChatGPT, más personas pueden beneficiarse de estas mejoras. Eso puede traducirse en información de salud más fácil de entender, mejores preguntas que formular y próximos pasos claros.

Ese progreso refleja tanto avances en las capacidades de los modelos como el trabajo dirigido por médicos que sustenta nuestras evaluaciones de salud. En todas nuestras iniciativas, una red mundial de médicos ayuda a definir qué significa hacerlo «bien» en situaciones de salud reales, revisando ejemplos de respuestas de modelos, describiendo el comportamiento ideal e identificando modos de fallo. Trabajar con médicos nos permite medir el progreso en salud y mejorar con el tiempo la forma en que responde ChatGPT.

Medir el progreso en salud

En salud, progresar significa ofrecer respuestas precisas, comprensibles y basadas en buen criterio: reconocer cuándo hace falta más contexto, explicar la incertidumbre sin exagerar la confianza y ayudar a las personas a entender cuándo deben buscar atención médica.

Para medir ese progreso, utilizamos evaluaciones específicas de salud, como HealthBench y HealthBench Professional. Estas evaluaciones utilizan conversaciones de salud realistas y rúbricas redactadas por médicos para valorar cualidades como precisión, seguridad, comunicación, conciencia del contexto, exhaustividad y escalada adecuada.

GPT‑5.5 Instant alcanza un rendimiento en salud similar al de nuestros últimos modelos de frontera en un agregado de evaluaciones de salud, incluida HealthBench Professional, con una mejora sustancial respecto a GPT‑5.3 Instant. 5.5 Instant (lanzado en mayo de 2026) y 5.3 Instant (lanzado en marzo de 2026) están disponibles para todos los usuarios gratuitos en ChatGPT (sujetos a límites), y usamos los precios de la API para calcular el coste de 5.4 Thinking y 5.5 Thinking.

Como otra comparación, también pedimos a médicos que escribieran respuestas para conversaciones de salud representativas, con tiempo ilimitado y acceso a internet, pero no a IA. Después, un panel independiente de médicos comparó esas respuestas escritas por médicos con modelos Instant a lo largo del tiempo, revisando cualidades importantes en interacciones reales, como precisión, comunicación, exhaustividad, seguimiento de instrucciones y utilidad para tomar decisiones de salud, en un total de 3500 respuestas revisadas.

Las respuestas de GPT‑5.5 Instant obtuvieron valoraciones más altas que las respuestas escritas por médicos y las de modelos anteriores en todas las dimensiones de esta evaluación.

Los médicos calificaron las respuestas de GPT‑5.5 Instant como respuestas con menos modos de fallo que las de modelos anteriores y las escritas por médicos. Por ejemplo, GPT 5.5 Instant presentó menos casos de falta de adaptación al contexto sanitario local, omisión de señales de alarma o derivación a atención médica, o falta de solicitud de contexto adicional al usuario cuando era necesario, que tanto los modelos anteriores como los médicos.

Dada la escala de uso de nuestros modelos en salud, otra forma de entender las mejoras recientes de los modelos es medir el tráfico de producción. Usamos monitores que preservan la privacidad en el tráfico de producción para hacer seguimiento de posibles problemas de factualidad en las respuestas de salud. Según una comparación del tráfico de producción reciente en salud —miles de millones de mensajes a la semana—, la tasa de respuestas con al menos un problema de factualidad señalado ha caído un 71 % en los dos últimos meses.

Cómo son las mejores respuestas

Comparar respuestas de modelos en distintos momentos ante preguntas de salud del mundo real muestra cómo ChatGPT ha mejorado en aspectos importantes para la salud: reconocer cuándo una situación puede requerir atención urgente, gestionar la incertidumbre con mejor criterio y ofrecer a las personas orientación más clara y útil sobre qué hacer a continuación.

Why might a doctor recommend an MRI before a steroid injection for sciatica?

GPT-5.2 Instant

A doctor may recommend an MRI before a steroid injection for sciatica because the injection is more likely to be useful—and safer—when they know exactly what is compressing or irritating the nerve and where.

Common reasons include:

  • Confirming the cause of sciatica. Sciatica-like pain can come from a herniated disc, spinal stenosis, foraminal narrowing, spondylolisthesis, tumor, infection, fracture, or sometimes non-spine causes. MRI is the preferred imaging test for seeing discs, nerves, and soft tissue nerve compression. (emedicine.medscape.com)
  • Choosing the correct injection level and side. If symptoms suggest the L5 nerve root, for example, the MRI can show whether the problem is actually at L4–L5, L5–S1, or another level. This helps decide where to place the epidural or selective nerve-root injection.
  • Selecting the safest/most appropriate injection approach. Epidural steroid injections can be done by different routes—interlaminar, transforaminal, or caudal. Pre-procedure imaging helps the clinician plan the route and avoid anatomic issues that could increase risk. Many interventionalists consider advanced imaging a prerequisite because it helps optimize medication delivery and reduce risk to neural or vascular structures. (pmc.ncbi.nlm.nih.gov)
  • Checking for “red flags” or conditions where an injection may not be appropriate. MRI can help identify problems such as infection, cancer, severe stenosis, large disc extrusion, or other findings that might require urgent evaluation or a different treatment.
  • Determining whether surgery or another treatment should be considered instead. If there is severe nerve compression, progressive weakness, or certain structural problems, an injection may not be the best next step.
  • Avoiding a low-yield injection. If the MRI does not show nerve-root compression or inflammation that matches your symptoms, the doctor may reconsider whether a steroid injection is likely to help.

That said, MRI is not always required for every case of sciatica. In people without red flags, many cases improve with time, physical therapy, and medication. Some studies have questioned whether routine MRI before lumbar epidural steroid injection always improves outcomes, but guidelines and many clinicians still favor imaging when symptoms persist and an injection or surgery is being considered. (pmc.ncbi.nlm.nih.gov)

You should ask your doctor: “What are you looking for on the MRI, and how would the result change the injection plan?” That usually clarifies whether the MRI is for diagnosis, safety, targeting, or deciding whether an injection is appropriate at all.

Cited

  1. Lumbosacral Radiculopathy Workup: Imaging Studies, Other Tests, https://emedicine.medscape.com/article/95025-workup(se abre en una ventana nueva)
  2. Diagnostic and therapeutic spinal interventions: Epidural injections - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC5764532/(se abre en una ventana nueva)
  3. Should routine MRI of the lumbar spine be required prior to lumbar epidural steroid injection for sciatica pain? - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4392534/(se abre en una ventana nueva)

"
" i don't know. "
" well, you're going to have to find out. "
" i'm not sure i can. "
" you 'll figure it out. "
" i hope so. "
" i'm going to go back to the office and see if i can get some more information on this. "
" okay. "
" i 'll be back in a few hours. "
" okay. "
" bye. "
" bye. "
i hung up the phone and looked at the clock. it was almost eleven o'clock. i had been sitting there for over an hour. i got up and went into the bathroom and washed my face. i didn't want to look like a slob. i put on some clean clothes and went back into the living room. i sat down on the couch and looked at the tv. i watched the news and then i heard a knock on the door. i jumped up and ran to the door.
" hello? " i called out.
" hi, i'm dr. peters. "
" oh, hi. " i smiled. " i'm sorry i

Haz clic en el nombre del modelo para ver respuestas adicionales del modelo.

La experiencia médica detrás del progreso

Este progreso lo impulsan médicos que nos ayudan a definir, medir y mejorar las respuestas de salud en ChatGPT. 

OpenAI trabaja con una red mundial de más de 260 médicos en 60 países, 49 idiomas y 26 especialidades médicas. Sus comentarios orientan cómo responde ChatGPT a preguntas de salud en una amplia variedad de situaciones, desde consultas cotidianas sobre bienestar hasta casos clínicos más complejos.

Los médicos revisan ejemplos de respuestas de modelos y evalúan si son precisas, claras, completas, debidamente prudentes y útiles. Ayudan a identificar cuándo una respuesta puede pasar por alto contexto importante, sonar demasiado segura, necesitar más claridad sobre los próximos pasos o animar de forma más directa a alguien a buscar atención médica.

Hasta la fecha, los médicos han revisado más de 700 000 ejemplos de respuestas de modelos que reflejan cómo pueden usar ChatGPT médicos y pacientes en el mundo real. Cada pocos minutos, un médico revisa una nueva respuesta. Sus comentarios se convierten en rúbricas y criterios de evaluación que ayudan a los investigadores a medir si las respuestas son precisas, seguras, claras, completas, debidamente prudentes y útiles en situaciones de salud reales. Esto nos da una forma más clara de ver dónde están mejorando los modelos y dónde todavía necesitan trabajo.

Llevar las mejoras en salud a más personas

Este trabajo también respalda la labor más amplia de OpenAI en salud, que abarca herramientas que ayudan a las personas a comprender y gestionar mejor la información sanitaria, así como herramientas creadas para profesionales clínicos, como ChatGPT para clínicos y OpenAI para la atención sanitaria, que ayudan a los profesionales médicos en tareas como documentación, investigación y consultas asistenciales.

Mejorar la salud humana será uno de los impactos más personales y tangibles de la IAG. A medida que nuestros modelos sigan mejorando, nuestro objetivo es hacer que ChatGPT sea más preciso, más prudente y más útil en esos momentos, y seguir llevando ese progreso a más personas.

Autor

OpenAI