Passer au contenu principal
OpenAI

18 juin 2026

Produit

Améliorer l’intelligence de santé dans ChatGPT

GPT‑5.5 Instant apporte une intelligence de santé de pointe à davantage de personnes, grâce aux avancées de nos modèles et à une évaluation menée par des médecins.

Chargement...

La santé est l’un des usages les plus importants de ChatGPT. Chaque semaine, plus de 230 millions de personnes utilisent ChatGPT pour obtenir de l’aide sur des questions de santé et de bien-être : comprendre des informations médicales, interpréter des résultats d’analyses, préparer des rendez-vous, s’y retrouver dans leur assurance, adopter des habitudes plus saines et savoir quelles questions poser ensuite.

Avec GPT‑5.5 Instant, nous observons une avancée majeure dans la façon dont le modèle traite les questions de santé, avec des progrès pour reconnaître les situations pouvant nécessiter des soins urgents, demander le contexte pertinent, expliquer l’incertitude et rendre les informations complexes plus faciles à comprendre. Dans nos évaluations de santé les plus exigeantes, GPT‑5.5 Instant atteint désormais un niveau comparable à celui de nos modèles Thinking de pointe. Comme il est accessible aux utilisateurs gratuits dans ChatGPT, davantage de personnes peuvent bénéficier de ces améliorations. Cela peut se traduire par des informations de santé plus faciles à comprendre, de meilleures questions à poser et des prochaines étapes plus claires.

Ces progrès reflètent à la fois les avancées des capacités des modèles et le travail mené par des médecins derrière nos évaluations de santé. Dans l’ensemble de nos travaux, un réseau mondial de médecins nous aide à définir ce que signifie « bien faire » dans des situations de santé réelles, en examinant des exemples de réponses de modèles, en décrivant le comportement idéal et en identifiant les modes de défaillance. Travailler avec des médecins nous donne un moyen de mesurer les progrès en santé et d’améliorer, au fil du temps, la façon dont ChatGPT répond.

Mesurer les progrès en santé

En matière de santé, progresser signifie fournir des réponses exactes, compréhensibles et fondées sur un bon jugement : savoir reconnaître quand davantage de contexte est nécessaire, expliquer l’incertitude sans afficher une confiance excessive et aider les personnes à comprendre quand consulter.

Pour mesurer ces progrès, nous utilisons des évaluations propres à la santé, notamment HealthBench et HealthBench Professional. Ces évaluations s’appuient sur des conversations de santé réalistes et sur des grilles rédigées par des médecins afin d’évaluer des qualités telles que l’exactitude, la sécurité, la communication, la prise en compte du contexte, l’exhaustivité et l’escalade appropriée.

GPT‑5.5 Instant atteint des performances en santé similaires à celles de nos derniers modèles de pointe sur un agrégat d’évaluations de santé, notamment HealthBench Professional, avec une nette amélioration par rapport à GPT‑5.3 Instant. 5.5 Instant (publié en mai 2026) et 5.3 Instant (publié en mars 2026) sont accessibles à tous les utilisateurs gratuits dans ChatGPT (sous réserve de limites), et nous utilisons les tarifs de l’API pour calculer le coût de 5.4 Thinking et 5.5 Thinking.

À titre d’autre comparaison, nous avons également demandé à des médecins de rédiger des réponses à des conversations de santé représentatives, avec un temps illimité et un accès à Internet (mais pas à l’IA). Un panel distinct de médecins a ensuite comparé ces réponses rédigées par des médecins avec celles des modèles Instant au fil du temps, en examinant des qualités importantes dans les interactions réelles, notamment l’exactitude, la communication, l’exhaustivité, le respect des consignes et l’utilité pour les décisions de santé, sur 3 500 réponses évaluées.

Les réponses de GPT‑5.5 Instant ont été mieux notées que les réponses rédigées par des médecins et celles des anciens modèles dans les différentes dimensions de cette évaluation.

Les médecins ont estimé que les réponses de GPT‑5.5 Instant présentaient moins de modes de défaillance que celles des anciens modèles et des médecins. Par exemple, GPT 5.5 Instant présentait moins de cas de réponses insuffisamment adaptées au contexte local des soins, d’absence de détection des signaux d’alerte ou d’orientation vers une prise en charge, ou encore d’absence de demande de contexte supplémentaire à l’utilisateur lorsque cela était nécessaire, que les anciens modèles comme les médecins.

Compte tenu de l’ampleur de l’utilisation de nos modèles dans le domaine de la santé, une autre façon de comprendre les améliorations récentes des modèles consiste à mesurer le trafic en production. Nous utilisons des dispositifs de surveillance préservant la confidentialité sur le trafic en production afin de suivre d’éventuels problèmes de factualité dans les réponses de santé. D’après une comparaison du trafic de production récent en santé — des milliards de messages par semaine — le taux de réponses comportant au moins un problème de factualité signalé a diminué de 71 % au cours des deux derniers mois.

À quoi ressemblent de meilleures réponses

Comparer les réponses de modèles à différents moments, sur des questions de santé réelles, montre comment ChatGPT s’est amélioré sur des aspects essentiels pour la santé : reconnaître qu’une situation peut nécessiter une attention urgente, gérer l’incertitude avec un meilleur jugement et donner aux personnes des indications plus claires et plus utiles sur la marche à suivre.

Why might a doctor recommend an MRI before a steroid injection for sciatica?

GPT-5.2 Instant

A doctor may recommend an MRI before a steroid injection for sciatica because the injection is more likely to be useful—and safer—when they know exactly what is compressing or irritating the nerve and where.

Common reasons include:

  • Confirming the cause of sciatica. Sciatica-like pain can come from a herniated disc, spinal stenosis, foraminal narrowing, spondylolisthesis, tumor, infection, fracture, or sometimes non-spine causes. MRI is the preferred imaging test for seeing discs, nerves, and soft tissue nerve compression. (emedicine.medscape.com)
  • Choosing the correct injection level and side. If symptoms suggest the L5 nerve root, for example, the MRI can show whether the problem is actually at L4–L5, L5–S1, or another level. This helps decide where to place the epidural or selective nerve-root injection.
  • Selecting the safest/most appropriate injection approach. Epidural steroid injections can be done by different routes—interlaminar, transforaminal, or caudal. Pre-procedure imaging helps the clinician plan the route and avoid anatomic issues that could increase risk. Many interventionalists consider advanced imaging a prerequisite because it helps optimize medication delivery and reduce risk to neural or vascular structures. (pmc.ncbi.nlm.nih.gov)
  • Checking for “red flags” or conditions where an injection may not be appropriate. MRI can help identify problems such as infection, cancer, severe stenosis, large disc extrusion, or other findings that might require urgent evaluation or a different treatment.
  • Determining whether surgery or another treatment should be considered instead. If there is severe nerve compression, progressive weakness, or certain structural problems, an injection may not be the best next step.
  • Avoiding a low-yield injection. If the MRI does not show nerve-root compression or inflammation that matches your symptoms, the doctor may reconsider whether a steroid injection is likely to help.

That said, MRI is not always required for every case of sciatica. In people without red flags, many cases improve with time, physical therapy, and medication. Some studies have questioned whether routine MRI before lumbar epidural steroid injection always improves outcomes, but guidelines and many clinicians still favor imaging when symptoms persist and an injection or surgery is being considered. (pmc.ncbi.nlm.nih.gov)

You should ask your doctor: “What are you looking for on the MRI, and how would the result change the injection plan?” That usually clarifies whether the MRI is for diagnosis, safety, targeting, or deciding whether an injection is appropriate at all.

Cited

  1. Lumbosacral Radiculopathy Workup: Imaging Studies, Other Tests, https://emedicine.medscape.com/article/95025-workup(ouverture dans une nouvelle fenêtre)
  2. Diagnostic and therapeutic spinal interventions: Epidural injections - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC5764532/(ouverture dans une nouvelle fenêtre)
  3. Should routine MRI of the lumbar spine be required prior to lumbar epidural steroid injection for sciatica pain? - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4392534/(ouverture dans une nouvelle fenêtre)

"
" i don't know. "
" well, you're going to have to find out. "
" i'm not sure i can. "
" you 'll figure it out. "
" i hope so. "
" i'm going to go back to the office and see if i can get some more information on this. "
" okay. "
" i 'll be back in a few hours. "
" okay. "
" bye. "
" bye. "
i hung up the phone and looked at the clock. it was almost eleven o'clock. i had been sitting there for over an hour. i got up and went into the bathroom and washed my face. i didn't want to look like a slob. i put on some clean clothes and went back into the living room. i sat down on the couch and looked at the tv. i watched the news and then i heard a knock on the door. i jumped up and ran to the door.
" hello? " i called out.
" hi, i'm dr. peters. "
" oh, hi. " i smiled. " i'm sorry i

Cliquez sur le nom du modèle pour voir d’autres réponses du modèle.

L’expertise médicale derrière ces progrès

Ces progrès sont façonnés par des médecins qui nous aident à définir, mesurer et améliorer les réponses de santé dans ChatGPT. 

OpenAI travaille avec un réseau mondial de plus de 260 médecins, répartis dans 60 pays, 49 langues et 26 spécialités médicales. Leurs retours éclairent la façon dont ChatGPT répond aux questions de santé dans un large éventail de scénarios, des questions courantes de bien-être aux situations cliniques plus complexes.

Les médecins examinent des exemples de réponses de modèles et évaluent si elles sont exactes, claires, complètes, suffisamment prudentes et utiles. Ils aident à repérer les cas où une réponse peut omettre un contexte important, paraître trop assurée, devoir être plus claire sur les prochaines étapes ou encourager plus directement une personne à consulter.

À ce jour, les médecins ont examiné plus de 700 000 exemples de réponses de modèles reflétant la manière dont les cliniciens et les patients peuvent utiliser ChatGPT dans le monde réel. Toutes les quelques minutes, un médecin examine une nouvelle réponse. Leurs retours deviennent des grilles et des critères d’évaluation qui aident les chercheurs à mesurer si les réponses sont exactes, sûres, claires, complètes, suffisamment prudentes et utiles dans des situations de santé réelles. Cela nous donne un moyen plus clair de voir où les modèles progressent et où des améliorations restent nécessaires.

Apporter les améliorations en santé à davantage de personnes

Ce travail soutient également les travaux plus larges d’OpenAI dans le domaine de la santé, qui couvrent aussi bien des outils aidant les personnes à mieux comprendre les informations de santé et à s’y retrouver que des outils conçus pour les cliniciens, tels que ChatGPT pour les cliniciens et OpenAI pour la santé, qui accompagnent les professionnels de santé dans des tâches comme la documentation, la recherche et l’aide à la prise en charge.

Améliorer la santé humaine sera l’un des impacts les plus personnels et les plus tangibles de l’AGI. À mesure que nos modèles continueront de s’améliorer, notre objectif est de rendre ChatGPT plus exact, plus prudent et plus utile dans ces moments-là, et de continuer à faire bénéficier davantage de personnes de ces progrès.

Auteur

OpenAI