Gezondheidsintelligentie in ChatGPT verbeteren
GPT‑5.5 Instant brengt geavanceerde gezondheidsintelligentie naar meer mensen, gevormd door vooruitgang in onze modellen en door artsen geleide evaluatie.
Gezondheid is een van de meest betekenisvolle manieren waarop mensen ChatGPT gebruiken. Elke week wenden meer dan 230 miljoen mensen zich tot ChatGPT voor hulp bij vragen over gezondheid en welzijn: gezondheidsinformatie begrijpen, labuitslagen duiden, zich voorbereiden op afspraken, wegwijs worden in verzekeringen, gezondere gewoonten opbouwen en bepalen wat ze als volgende moeten vragen.
Met GPT‑5.5 Instant zien we een grote stap vooruit in hoe het model omgaat met gezondheidsvragen, met verbeteringen in het herkennen wanneer spoedzorg nodig kan zijn, het vragen om relevante context, het uitleggen van onzekerheid en het begrijpelijker maken van complexe informatie. In onze meest uitdagende gezondheidsevaluaties presteert GPT‑5.5 Instant nu op een niveau dat vergelijkbaar is met onze geavanceerde Thinking-modellen. Omdat het beschikbaar is voor gratis gebruikers in ChatGPT, kunnen meer mensen van deze verbeteringen profiteren. Dat kan betekenen: gezondheidsinformatie die makkelijker te begrijpen is, betere vragen om te stellen en duidelijke vervolgstappen.
Die vooruitgang weerspiegelt zowel verbeteringen in de mogelijkheden van modellen als het door artsen geleide werk achter onze gezondheidsevaluaties. Bij al onze inspanningen helpt een wereldwijd netwerk van artsen te bepalen wat ‘goed’ inhoudt in realistische gezondheidssituaties, door voorbeeldantwoorden van modellen te beoordelen, ideaal gedrag te beschrijven en faalpatronen te identificeren. Samenwerken met artsen geeft ons een manier om vooruitgang in gezondheid te meten en de reacties van ChatGPT in de loop van de tijd te verbeteren.
Bij gezondheid betekent vooruitgang dat antwoorden accuraat, begrijpelijk en gebaseerd op goed beoordelingsvermogen zijn: herkennen wanneer meer context nodig is, onzekerheid uitleggen zonder te veel zekerheid te suggereren, en mensen helpen begrijpen wanneer ze zorg moeten zoeken.
Om die vooruitgang te meten, gebruiken we gezondheidsspecifieke evaluaties, waaronder HealthBench en HealthBench Professional. Deze evaluaties gebruiken realistische gezondheidsgesprekken en door artsen geschreven rubrics om kwaliteiten te beoordelen zoals nauwkeurigheid, veiligheid, communicatie, contextbewustzijn, volledigheid en passende escalatie.
GPT‑5.5 Instant behaalt gezondheidsprestaties die vergelijkbaar zijn met onze nieuwste geavanceerde modellen op een aggregaat van gezondheidsevaluaties, waaronder HealthBench Professional, met een aanzienlijke verbetering ten opzichte van GPT‑5.3 Instant. 5.5 Instant (uitgebracht in mei 2026) en 5.3 Instant (uitgebracht in maart 2026) zijn beschikbaar voor alle gratis gebruikers in ChatGPT (met limieten), en we gebruiken API-prijzen om de kosten voor 5.4 Thinking en 5.5 Thinking te berekenen.
Als aanvullende vergelijking vroegen we artsen ook om antwoorden te schrijven voor representatieve gezondheidsgesprekken, met onbeperkte tijd en toegang tot internet (maar niet tot AI). Een afzonderlijk panel van artsen vergeleek deze artsenantwoorden vervolgens in de loop van de tijd met Instant-modellen en beoordeelde kwaliteiten die ertoe doen in echte interacties, waaronder nauwkeurigheid, communicatie, volledigheid, het volgen van instructies en behulpzaamheid bij gezondheidsbeslissingen, op basis van 3500 beoordeelde antwoorden.
Antwoorden van GPT‑5.5 Instant kregen in deze evaluatie op alle dimensies een hogere beoordeling dan door artsen geschreven antwoorden en antwoorden van oudere modellen.
Artsen beoordeelden antwoorden van GPT‑5.5 Instant als antwoorden met minder faalpatronen dan die van oudere modellen en artsen. Zo had GPT 5.5 Instant minder gevallen waarin niet werd afgestemd op de lokale zorgcontext, rode vlaggen of doorverwijzing naar zorg werden gemist, of niet om extra context van de gebruiker werd gevraagd wanneer dat nodig was, vergeleken met zowel oudere modellen als artsen.
Gezien de schaal waarop onze modellen in gezondheid worden gebruikt, is een andere manier om recente modelverbeteringen te begrijpen het meten van productieverkeer. We gebruiken privacybeschermende monitors op live verkeer om mogelijke feitelijkheidsproblemen in gezondheidsantwoorden bij te houden. Op basis van een vergelijking van recent live verkeer in gezondheid (miljarden berichten per week) is het percentage antwoorden met ten minste één gemarkeerd feitelijkheidsprobleem in de afgelopen twee maanden met 71% gedaald.
Een vergelijking van antwoorden van modellen op verschillende momenten, bij gezondheidsvragen uit de praktijk, laat zien hoe ChatGPT is verbeterd op manieren die voor gezondheid belangrijk zijn: herkennen wanneer een situatie mogelijk dringend aandacht vraagt, beter omgaan met onzekerheid en mensen duidelijkere, nuttigere begeleiding geven over wat ze daarna kunnen doen.
GPT-5.2 Instant
Klik op de modelnaam om extra antwoorden van het model te bekijken.
Deze vooruitgang wordt mede vormgegeven door artsen die ons helpen gezondheidsantwoorden in ChatGPT te definiëren, te meten en te verbeteren.
OpenAI werkt samen met een wereldwijd netwerk van meer dan 260 artsen in 60 landen, 49 talen en 26 medische specialismen. Hun feedback bepaalt mede hoe ChatGPT reageert op gezondheidsvragen in uiteenlopende scenario’s, van alledaagse welzijnsvragen tot complexere klinische situaties.
Artsen beoordelen voorbeeldantwoorden van modellen en bekijken of ze accuraat, duidelijk, volledig, voldoende voorzichtig en nuttig zijn. Ze helpen vaststellen waar een antwoord belangrijke context kan missen, waar het te zelfverzekerd kan klinken, waar het duidelijker moet zijn over vervolgstappen of iemand directer moet aanmoedigen medische zorg te zoeken.
Tot nu toe hebben artsen meer dan 700.000 voorbeeldantwoorden van modellen beoordeeld die weerspiegelen hoe clinici en patiënten ChatGPT in de echte wereld kunnen gebruiken. Elke paar minuten beoordeelt een arts een nieuw antwoord. Hun feedback wordt omgezet in rubrics en evaluatiecriteria die onderzoekers helpen meten of antwoorden accuraat, veilig, duidelijk, volledig, voldoende voorzichtig en nuttig zijn in realistische gezondheidssituaties. Zo krijgen we een duidelijkere manier om te zien waar modellen beter worden en waar nog werk nodig is.
Dit werk ondersteunt ook het bredere werk van OpenAI op het gebied van gezondheid, van tools die mensen helpen gezondheidsinformatie beter te begrijpen en ermee om te gaan tot tools die zijn gebouwd voor clinici, zoals ChatGPT for Clinicians en OpenAI for Healthcare, die medische professionals ondersteunen bij taken zoals documentatie, onderzoek en zorgconsulten.
Het verbeteren van de menselijke gezondheid wordt een van de meest persoonlijke, tastbare effecten van AGI. Naarmate onze modellen blijven verbeteren, is ons doel om ChatGPT nauwkeuriger, zorgvuldiger en nuttiger te maken op die momenten — en die vooruitgang naar steeds meer mensen te blijven brengen.


