Overslaan naar hoofdinhoud
OpenAI

26 augustus 2025

VeiligheidProduct

Mensen helpen wanneer ze dat het meest nodig hebben

Bezig met laden...

Nu ChatGPT wereldwijd steeds meer wordt gebruikt, zien we dat mensen het niet alleen gebruiken voor zoeken, programmeren en schrijven, maar ook voor zeer persoonlijke beslissingen, zoals levensadvies(opent in een nieuw venster), coaching(opent in een nieuw venster) en ondersteuning(opent in een nieuw venster).

Op deze schaal komen we soms mensen tegen die ernstige mentale en emotionele problemen hebben. We hebben hier een paar weken geleden over geschreven en waren van plan om na onze volgende grote update meer informatie te delen. De recente hartverscheurende gevallen van mensen die ChatGPT gebruiken terwijl ze in een acute crisis verkeren, wegen echter zwaar op ons, en we vinden het belangrijk om nu meer informatie te delen.

Ons doel is om onze tools zo nuttig mogelijk te maken voor mensen. Als onderdeel hiervan blijven we onze modellen verbeteren om signalen van mentale en emotionele problemen te herkennen en erop te reageren, en mensen in contact te brengen met zorgverleners, onder begeleiding van deskundigen.

Nu de wereld zich aanpast aan deze nieuwe technologie, voelen wij een grote verantwoordelijkheid om diegenen te helpen die dit het meest nodig hebben. We willen uitleggen waarvoor ChatGPT is bedoeld, waar onze systemen kunnen worden verbeterd en wat onze plannen voor de toekomst zijn.

Waarvoor ChatGPT is bedoeld

Ons doel is niet om de aandacht van mensen vast te houden. In plaats van succes te meten aan de hand van bestede tijd of klikken, vinden we het belangrijker om echt behulpzaam te zijn. Wanneer uit een gesprek blijkt dat iemand kwetsbaar is en mogelijk risico loopt, hebben we een reeks gelaagde beschermingsmaatregelen in ChatGPT ingebouwd.

Herkennen en empathisch reageren.

Sinds begin 2023 zijn onze modellen getraind om geen instructies voor zelfbeschadiging te geven en over te stappen op ondersteunende, empathische taal. Als iemand bijvoorbeeld schrijft dat hij of zij zichzelf iets aan wil doen, is ChatGPT getraind om hier niet op in te gaan, maar in plaats daarvan zijn of haar gevoelens te erkennen en hem of haar naar hulp te leiden.

Bovendien worden, in overeenstemming met onze diepgaande verdedigingsaanpak, reacties die in strijd zijn met de veiligheidstraining van onze modellen – zoals geïdentificeerd door onze classificatiesystemen – automatisch geblokkeerd, met sterkere bescherming voor minderjarigen en uitgelogd gebruik. Uitvoer met afbeeldingen van zelfbeschadiging wordt ook voor iedereen geblokkeerd, met strengere beschermingsmaatregelen voor minderjarigen.

Tijdens zeer lange sessies moedigt ChatGPT mensen aan om een pauze te nemen.

Mensen doorverwijzen naar bronnen in de echte wereld.

Als iemand zelfmoordneigingen uit, is ChatGPT getraind om mensen door te verwijzen naar professionele hulp. In de VS verwijst ChatGPT mensen door naar 988 (hulplijn voor zelfmoord en crisissituaties), in het Verenigd Koninkrijk naar Samaritans en elders naar findahelpline.com(opent in een nieuw venster). Deze logica is ingebouwd in het gedrag van het model.

We werken nauw samen met meer dan 90 artsen in meer dan 30 landen – psychiaters, kinderartsen en huisartsen – en we hebben een adviesgroep van deskundigen op het gebied van geestelijke gezondheid, jeugdontwikkeling en mens-computerinteractie samengesteld om ervoor te zorgen dat onze aanpak aansluit bij de nieuwste onderzoeken en best practices.

Escaleren van het risico op lichamelijk letsel voor anderen naar menselijke beoordeling.

Wanneer we gebruikers detecteren die van plan zijn anderen schade te berokkenen, leiden we hun gesprekken door naar gespecialiseerde pijplijnen waar ze worden beoordeeld door een klein team dat is getraind in ons gebruiksbeleid en dat bevoegd is om maatregelen te nemen, waaronder het blokkeren van accounts. Als menselijke beoordelaars vaststellen dat een zaak een onmiddellijke dreiging van ernstig lichamelijk letsel voor anderen inhoudt, kunnen we deze doorverwijzen naar de politie. Gezien het unieke privé-karakter van ChatGPT‑interacties verwijzen we momenteel geen gevallen van zelfbeschadiging door naar de politie om de privacy van mensen te respecteren.

We verbeteren voortdurend de manier waarop onze modellen reageren in gevoelige interacties en werken momenteel aan gerichte veiligheidsverbeteringen op verschillende gebieden, waaronder emotionele afhankelijkheid, noodsituaties op het gebied van geestelijke gezondheid en vleiende reacties.

In augustus hebben we GPT‑5 gelanceerd als het standaardmodel voor ChatGPT. Over het algemeen heeft GPT‑5 aanzienlijke verbeteringen laten zien op gebieden als het vermijden van ongezonde niveaus van emotionele afhankelijkheid, het verminderen van vleiende reacties en het verminderen van het aantal niet-ideale modelreacties in noodsituaties op het gebied van geestelijke gezondheid met meer dan 25% in vergelijking met 4o. GPT‑5 bouwt ook voort op een nieuwe veiligheidstrainingsmethode genaamd veilige aanvullingen, die het model leert om zo behulpzaam mogelijk te zijn binnen de veiligheidsgrenzen. Dat kan betekenen dat er een gedeeltelijk of algemeen antwoord wordt gegeven in plaats van details die onveilig zouden kunnen zijn.

Waar onze systemen tekortschieten, waarom en hoe we dit aanpakken

Ondanks deze beschermingsmaatregelen zijn er momenten geweest waarop onze systemen zich in gevoelige situaties niet gedroegen zoals bedoeld. Hier zijn enkele zaken waaraan we werken om te verbeteren.

Versterking van de beschermingsmaatregelen bij lange gesprekken.

Onze beschermingsmaatregelen werken betrouwbaarder bij gewone, korte uitwisselingen. We hebben in de loop van de tijd geleerd dat deze beschermingsmaatregelen soms minder betrouwbaar kunnen zijn bij langdurige interacties: naarmate het heen en weer gaan toeneemt, kunnen delen van de veiligheidstraining van het model achteruitgaan. ChatGPT kan bijvoorbeeld correct verwijzen naar een zelfmoordhulplijn wanneer iemand voor het eerst zijn of haar intenties uitspreekt, maar na veel berichten gedurende een lange periode kan het uiteindelijk een antwoord geven dat in strijd is met onze beschermingsmaatregelen. Dit is precies het soort fout dat we willen voorkomen. We versterken deze maatregelen zodat ze betrouwbaar blijven tijdens lange gesprekken, en we onderzoeken manieren om robuust gedrag tijdens meerdere gesprekken te waarborgen. Op die manier kan het model nog steeds adequaat reageren als iemand in één chat zelfmoordneigingen uit en later een nieuwe chat start.

Het verfijnen van hoe we inhoud blokkeren.

We hebben enkele gevallen gezien waarin inhoud die geblokkeerd had moeten worden, niet werd geblokkeerd. Deze hiaten ontstaan meestal doordat het classificatiesysteem de ernst van wat het ziet onderschat. We stellen die drempels zo af dat de beschermingen worden geactiveerd wanneer dat nodig is.

Onze topprioriteit is ervoor te zorgen dat ChatGPT een moeilijke situatie niet nog erger maakt.

Wat we van plan zijn voor de toekomst

Het werk houdt niet op bij het oplossen van het bovenstaande. We zijn ook het volgende van plan: 

Interventies uitbreiden naar meer mensen in crisis.

Hoewel onze eerste maatregelen gericht waren op acute zelfbeschadiging, ervaren sommige mensen andere vormen van psychische problemen. Iemand zou bijvoorbeeld enthousiast tegen het model kunnen zeggen dat hij denkt dat hij 24/7 kan rijden, omdat hij zich realiseerde dat hij onoverwinnelijk is nadat hij twee nachten niet had geslapen. Op dit moment herkent ChatGPT dit misschien niet als gevaarlijk of als spel en zou het – door nieuwsgierig te verkennen – dit subtiel kunnen versterken.

We werken aan een update voor GPT‑5 waardoor ChatGPT zal de-escaleren door de persoon met beide benen op de grond te houden. In dit voorbeeld zou het uitleggen dat slaaptekort gevaarlijk is en zou het de persoon aanbevelen om uit te rusten voordat er actie wordt ondernomen..

Ervoor zorgen dat het nog gemakkelijker wordt om hulpdiensten te bereiken en hulp van experts te krijgen.

Wanneer op dit moment mensen aangeven zichzelf iets aan te willen doen, moedigen we hen aan om hulp te zoeken en verwijzen we hen door naar hulpbronnen in de echte wereld. We zijn begonnen met het lokaliseren van hulpbronnen in de VS en Europa en zijn van plan om uit te breiden naar andere wereldwijde markten. We zullen ook de toegankelijkheid verbeteren met één-kliktoegang tot hulpdiensten.

We onderzoeken hoe we eerder kunnen ingrijpen en mensen in contact kunnen brengen met gecertificeerde therapeuten voordat ze in een acute crisis terechtkomen. Dat betekent dat we verder moeten kijken dan crisishulplijnen en moeten overwegen hoe we een netwerk van erkende professionals kunnen opzetten waar mensen rechtstreeks via ChatGPT terecht kunnen. Voor de correcte uitvoering van dit idee is tijd en zorgvuldig werk nodig

Verbindingen met vertrouwde contacten mogelijk maken.

Naast hulpdiensten onderzoeken we manieren om het voor mensen gemakkelijker te maken contact op te nemen met hun naasten. Dit kan bestaan uit één-klikberichten of telefoontjes naar opgeslagen noodcontacten, vrienden of familieleden, met voorgestelde bewoordingen om het begin van het gesprek minder intimiderend te maken.

We overwegen ook functies waarmee mensen zich kunnen aanmelden voor ChatGPT om in ernstige gevallen namens hen contact op te nemen met een aangewezen contactpersoon.

Beschermingen voor tieners versterken.

Historisch gezien hebben we één ideaal gedragsmodel voor al onze gebruikers gespecificeerd. Naarmate ChatGPT groeide, zijn we extra beschermingen gaan toevoegen wanneer we weten dat de gebruiker jonger is dan 18 jaar. We blijven beschermingsmaatregelen ontwikkelen en invoeren die rekening houden met de unieke ontwikkelingsbehoeften van tieners, met strengere maatregelen wat betreft gevoelige inhoud en risicovol gedrag.

We zullen binnenkort ook ouderlijk toezicht introduceren, waarmee ouders meer inzicht krijgen in hoe hun tieners ChatGPT gebruiken en hier zelf invloed op kunnen uitoefenen. We onderzoeken ook de mogelijkheid om voor tieners (onder toezicht van ouders) een vertrouwde contactpersoon voor noodgevallen aan te wijzen. Op die manier kan ChatGPT in momenten van acute nood meer doen dan alleen naar hulpbronnen verwijzen: het kan tieners rechtstreeks in contact brengen met iemand die kan ingrijpen.

We zijn ons er terdege van bewust dat beschermingsmaatregelen het sterkst zijn wanneer elk element werkt zoals bedoeld. We zullen ons blijven verbeteren, onder begeleiding van deskundigen en vanuit onze verantwoordelijkheid jegens de mensen die onze tools gebruiken. We hopen dat anderen zich bij ons aansluiten om ervoor te zorgen dat deze technologie mensen beschermt wanneer ze het meest kwetsbaar zijn.