Aanvulling op de GPT‑5‑systeemkaart: Gevoelige gesprekken
Toen we GPT‑5 lanceerden, vermeldden we in de systeemkaart dat we bezig waren met het opstellen van betere benchmarks en het verder versterken van de modelveiligheid rondom geestelijke en emotionele problemen. Op 3 oktober hebben we een update(opent in een nieuw venster) geïmplementeerd die deze inspanningen weerspiegelde. Hierbij werd het standaardmodel van ChatGPT verbeterd om mensen in noodsituaties beter te herkennen en ondersteunen. In dit kader hebben we samengewerkt met meer dan 170 deskundigen op het gebied van geestelijke gezondheid om ChatGPT te helpen signalen van nood betrouwbaarder te herkennen, zorgvuldig te reageren en mensen naar echte hulp te begeleiden. Hierdoor zijn reacties die niet aan ons gewenst gedrag voldoen met 65-80% afgenomen.
We publiceren een gerelateerde blogpost met meer informatie over dit werk. Ook hebben we deze aanvulling bij de GPT‑5‑systeemkaart gemaakt om basisveiligheidsevaluaties te delen. Deze evaluaties vergelijken de versie van 15 augustus(opent in een nieuw venster) van het standaardmodel van ChatGPT, ook bekend als GPT‑5 Instant, met de bijgewerkte versie die sinds 3 oktober beschikbaar is.


