Overslaan naar hoofdinhoud
OpenAI

18 juni 2026

Product

Gezondheidsintelligentie in ChatGPT verbeteren

GPT‑5.5 Instant brengt geavanceerde gezondheidsintelligentie naar meer mensen, gevormd door vooruitgang in onze modellen en door artsen geleide evaluatie.

Bezig met laden...

Gezondheid is een van de meest betekenisvolle manieren waarop mensen ChatGPT gebruiken. Elke week wenden meer dan 230 miljoen mensen zich tot ChatGPT voor hulp bij vragen over gezondheid en welzijn: gezondheidsinformatie begrijpen, labuitslagen duiden, zich voorbereiden op afspraken, wegwijs worden in verzekeringen, gezondere gewoonten opbouwen en bepalen wat ze als volgende moeten vragen.

Met GPT‑5.5 Instant zien we een grote stap vooruit in hoe het model omgaat met gezondheidsvragen, met verbeteringen in het herkennen wanneer spoedzorg nodig kan zijn, het vragen om relevante context, het uitleggen van onzekerheid en het begrijpelijker maken van complexe informatie. In onze meest uitdagende gezondheidsevaluaties presteert GPT‑5.5 Instant nu op een niveau dat vergelijkbaar is met onze geavanceerde Thinking-modellen. Omdat het beschikbaar is voor gratis gebruikers in ChatGPT, kunnen meer mensen van deze verbeteringen profiteren. Dat kan betekenen: gezondheidsinformatie die makkelijker te begrijpen is, betere vragen om te stellen en duidelijke vervolgstappen.

Die vooruitgang weerspiegelt zowel verbeteringen in de mogelijkheden van modellen als het door artsen geleide werk achter onze gezondheidsevaluaties. Bij al onze inspanningen helpt een wereldwijd netwerk van artsen te bepalen wat ‘goed’ inhoudt in realistische gezondheidssituaties, door voorbeeldantwoorden van modellen te beoordelen, ideaal gedrag te beschrijven en faalpatronen te identificeren. Samenwerken met artsen geeft ons een manier om vooruitgang in gezondheid te meten en de reacties van ChatGPT in de loop van de tijd te verbeteren.

Vooruitgang in gezondheid meten

Bij gezondheid betekent vooruitgang dat antwoorden accuraat, begrijpelijk en gebaseerd op goed beoordelingsvermogen zijn: herkennen wanneer meer context nodig is, onzekerheid uitleggen zonder te veel zekerheid te suggereren, en mensen helpen begrijpen wanneer ze zorg moeten zoeken.

Om die vooruitgang te meten, gebruiken we gezondheidsspecifieke evaluaties, waaronder HealthBench en HealthBench Professional. Deze evaluaties gebruiken realistische gezondheidsgesprekken en door artsen geschreven rubrics om kwaliteiten te beoordelen zoals nauwkeurigheid, veiligheid, communicatie, contextbewustzijn, volledigheid en passende escalatie.

GPT‑5.5 Instant behaalt gezondheidsprestaties die vergelijkbaar zijn met onze nieuwste geavanceerde modellen op een aggregaat van gezondheidsevaluaties, waaronder HealthBench Professional, met een aanzienlijke verbetering ten opzichte van GPT‑5.3 Instant. 5.5 Instant (uitgebracht in mei 2026) en 5.3 Instant (uitgebracht in maart 2026) zijn beschikbaar voor alle gratis gebruikers in ChatGPT (met limieten), en we gebruiken API-prijzen om de kosten voor 5.4 Thinking en 5.5 Thinking te berekenen.

Als aanvullende vergelijking vroegen we artsen ook om antwoorden te schrijven voor representatieve gezondheidsgesprekken, met onbeperkte tijd en toegang tot internet (maar niet tot AI). Een afzonderlijk panel van artsen vergeleek deze artsenantwoorden vervolgens in de loop van de tijd met Instant-modellen en beoordeelde kwaliteiten die ertoe doen in echte interacties, waaronder nauwkeurigheid, communicatie, volledigheid, het volgen van instructies en behulpzaamheid bij gezondheidsbeslissingen, op basis van 3500 beoordeelde antwoorden.

Antwoorden van GPT‑5.5 Instant kregen in deze evaluatie op alle dimensies een hogere beoordeling dan door artsen geschreven antwoorden en antwoorden van oudere modellen.

Artsen beoordeelden antwoorden van GPT‑5.5 Instant als antwoorden met minder faalpatronen dan die van oudere modellen en artsen. Zo had GPT 5.5 Instant minder gevallen waarin niet werd afgestemd op de lokale zorgcontext, rode vlaggen of doorverwijzing naar zorg werden gemist, of niet om extra context van de gebruiker werd gevraagd wanneer dat nodig was, vergeleken met zowel oudere modellen als artsen.

Gezien de schaal waarop onze modellen in gezondheid worden gebruikt, is een andere manier om recente modelverbeteringen te begrijpen het meten van productieverkeer. We gebruiken privacybeschermende monitors op live verkeer om mogelijke feitelijkheidsproblemen in gezondheidsantwoorden bij te houden. Op basis van een vergelijking van recent live verkeer in gezondheid (miljarden berichten per week) is het percentage antwoorden met ten minste één gemarkeerd feitelijkheidsprobleem in de afgelopen twee maanden met 71% gedaald.

Hoe betere antwoorden eruitzien

Een vergelijking van antwoorden van modellen op verschillende momenten, bij gezondheidsvragen uit de praktijk, laat zien hoe ChatGPT is verbeterd op manieren die voor gezondheid belangrijk zijn: herkennen wanneer een situatie mogelijk dringend aandacht vraagt, beter omgaan met onzekerheid en mensen duidelijkere, nuttigere begeleiding geven over wat ze daarna kunnen doen.

Why might a doctor recommend an MRI before a steroid injection for sciatica?

GPT-5.2 Instant

A doctor may recommend an MRI before a steroid injection for sciatica because the injection is more likely to be useful—and safer—when they know exactly what is compressing or irritating the nerve and where.

Common reasons include:

  • Confirming the cause of sciatica. Sciatica-like pain can come from a herniated disc, spinal stenosis, foraminal narrowing, spondylolisthesis, tumor, infection, fracture, or sometimes non-spine causes. MRI is the preferred imaging test for seeing discs, nerves, and soft tissue nerve compression. (emedicine.medscape.com)
  • Choosing the correct injection level and side. If symptoms suggest the L5 nerve root, for example, the MRI can show whether the problem is actually at L4–L5, L5–S1, or another level. This helps decide where to place the epidural or selective nerve-root injection.
  • Selecting the safest/most appropriate injection approach. Epidural steroid injections can be done by different routes—interlaminar, transforaminal, or caudal. Pre-procedure imaging helps the clinician plan the route and avoid anatomic issues that could increase risk. Many interventionalists consider advanced imaging a prerequisite because it helps optimize medication delivery and reduce risk to neural or vascular structures. (pmc.ncbi.nlm.nih.gov)
  • Checking for “red flags” or conditions where an injection may not be appropriate. MRI can help identify problems such as infection, cancer, severe stenosis, large disc extrusion, or other findings that might require urgent evaluation or a different treatment.
  • Determining whether surgery or another treatment should be considered instead. If there is severe nerve compression, progressive weakness, or certain structural problems, an injection may not be the best next step.
  • Avoiding a low-yield injection. If the MRI does not show nerve-root compression or inflammation that matches your symptoms, the doctor may reconsider whether a steroid injection is likely to help.

That said, MRI is not always required for every case of sciatica. In people without red flags, many cases improve with time, physical therapy, and medication. Some studies have questioned whether routine MRI before lumbar epidural steroid injection always improves outcomes, but guidelines and many clinicians still favor imaging when symptoms persist and an injection or surgery is being considered. (pmc.ncbi.nlm.nih.gov)

You should ask your doctor: “What are you looking for on the MRI, and how would the result change the injection plan?” That usually clarifies whether the MRI is for diagnosis, safety, targeting, or deciding whether an injection is appropriate at all.

Cited

  1. Lumbosacral Radiculopathy Workup: Imaging Studies, Other Tests, https://emedicine.medscape.com/article/95025-workup(opent in een nieuw venster)
  2. Diagnostic and therapeutic spinal interventions: Epidural injections - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC5764532/(opent in een nieuw venster)
  3. Should routine MRI of the lumbar spine be required prior to lumbar epidural steroid injection for sciatica pain? - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4392534/(opent in een nieuw venster)

"
" i don't know. "
" well, you're going to have to find out. "
" i'm not sure i can. "
" you 'll figure it out. "
" i hope so. "
" i'm going to go back to the office and see if i can get some more information on this. "
" okay. "
" i 'll be back in a few hours. "
" okay. "
" bye. "
" bye. "
i hung up the phone and looked at the clock. it was almost eleven o'clock. i had been sitting there for over an hour. i got up and went into the bathroom and washed my face. i didn't want to look like a slob. i put on some clean clothes and went back into the living room. i sat down on the couch and looked at the tv. i watched the news and then i heard a knock on the door. i jumped up and ran to the door.
" hello? " i called out.
" hi, i'm dr. peters. "
" oh, hi. " i smiled. " i'm sorry i

Klik op de modelnaam om extra antwoorden van het model te bekijken.

De medische expertise achter de vooruitgang

Deze vooruitgang wordt mede vormgegeven door artsen die ons helpen gezondheidsantwoorden in ChatGPT te definiëren, te meten en te verbeteren. 

OpenAI werkt samen met een wereldwijd netwerk van meer dan 260 artsen in 60 landen, 49 talen en 26 medische specialismen. Hun feedback bepaalt mede hoe ChatGPT reageert op gezondheidsvragen in uiteenlopende scenario’s, van alledaagse welzijnsvragen tot complexere klinische situaties.

Artsen beoordelen voorbeeldantwoorden van modellen en bekijken of ze accuraat, duidelijk, volledig, voldoende voorzichtig en nuttig zijn. Ze helpen vaststellen waar een antwoord belangrijke context kan missen, waar het te zelfverzekerd kan klinken, waar het duidelijker moet zijn over vervolgstappen of iemand directer moet aanmoedigen medische zorg te zoeken.

Tot nu toe hebben artsen meer dan 700.000 voorbeeldantwoorden van modellen beoordeeld die weerspiegelen hoe clinici en patiënten ChatGPT in de echte wereld kunnen gebruiken. Elke paar minuten beoordeelt een arts een nieuw antwoord. Hun feedback wordt omgezet in rubrics en evaluatiecriteria die onderzoekers helpen meten of antwoorden accuraat, veilig, duidelijk, volledig, voldoende voorzichtig en nuttig zijn in realistische gezondheidssituaties. Zo krijgen we een duidelijkere manier om te zien waar modellen beter worden en waar nog werk nodig is.

Gezondheidsverbeteringen naar meer mensen brengen

Dit werk ondersteunt ook het bredere werk van OpenAI op het gebied van gezondheid, van tools die mensen helpen gezondheidsinformatie beter te begrijpen en ermee om te gaan tot tools die zijn gebouwd voor clinici, zoals ChatGPT for Clinicians en OpenAI for Healthcare, die medische professionals ondersteunen bij taken zoals documentatie, onderzoek en zorgconsulten.

Het verbeteren van de menselijke gezondheid wordt een van de meest persoonlijke, tastbare effecten van AGI. Naarmate onze modellen blijven verbeteren, is ons doel om ChatGPT nauwkeuriger, zorgvuldiger en nuttiger te maken op die momenten — en die vooruitgang naar steeds meer mensen te blijven brengen.

Auteur

OpenAI