Introductie van de Lockdown-modus en consistente labels voor 'Verhoogd risico' in ChatGPT
Naarmate AI-systemen complexere taken uitvoeren (vooral taken die gebruikmaken van internet en gekoppelde apps) veranderen de beveiligingsrisico's.
Eén opkomend risico is met name belangrijk geworden: prompt-injectie. Bij deze aanvallen probeert een derde partij een AI-systeem te misleiden, zodat het schadelijke instructies opvolgt of gevoelige informatie prijsgeeft.
Vandaag introduceren we twee nieuwe beveiligingsmaatregelen die gebruikers en organisaties helpen om prompt-injectieaanvallen te beperken door middel van beter inzicht in de risico's en sterkere beheersmogelijkheden:
- Lockdown-modus in ChatGPT: een geavanceerde, optionele beveiligingsinstelling voor gebruikers met een verhoogd risicoprofiel
- Labels voor 'Verhoogd risico': voor bepaalde functies die extra risico's kunnen meebrengen in ChatGPT, ChatGPT Atlas en Codex
Deze toevoegingen bouwen voort op onze bestaande beveiligingslagen op model-, product- en systeemniveau. Hieronder vallen sandboxing, bescherming tegen data-exfiltratie via URL's, monitoring en handhaving, en beheersmaatregelen zoals rolgebaseerde toegang en auditlogs.
De Lockdown-modus is een optionele, geavanceerde beveiligingsinstelling die is ontworpen voor een selecte groep zeer beveiligingsbewuste gebruikers (zoals leidinggevenden of beveiligingsteams bij grote organisaties) die verhoogde bescherming tegen geavanceerde bedreigingen nodig hebben. Voor de meeste gebruikers is deze modus niet noodzakelijk. De Lockdown-modus beperkt strikt hoe ChatGPT communiceert met externe systemen om het risico op data-exfiltratie via prompt-injecties te verkleinen.
De Lockdown-modus schakelt systematisch bepaalde tools en functies in ChatGPT uit die een aanvaller zou kunnen proberen te misbruiken om gevoelige gegevens uit gesprekken of gekoppelde apps te stelen.
Zo is surfen op het web in de Lockdown-modus bijvoorbeeld beperkt tot inhoud uit de cache, zodat er geen actieve netwerkverzoeken het gecontroleerde netwerk van OpenAI verlaten. Deze beperking is bedoeld om te voorkomen dat gevoelige gegevens via de browserfunctie naar een aanvaller worden weggesluisd. Bepaalde functies worden volledig uitgeschakeld wanneer we de gegevensveiligheid niet volledig kunnen garanderen.

De Lockdown-modus is een nieuwe, deterministische instelling die helpt voorkomen dat gegevens onbedoeld met derden worden gedeeld door de interactie van ChatGPT met bepaalde externe systemen strikt te beperken.
Zakelijke ChatGPT‑abonnementen bieden al gegevensbeveiliging op enterpriseniveau. De Lockdown-modus bouwt voort op die bescherming en is beschikbaar voor ChatGPT Enterprise, ChatGPT Edu, ChatGPT for Healthcare en ChatGPT for Teachers. Beheerders kunnen dit inschakelen in de Werkruimte-instellingen(opent in een nieuw venster) door een nieuwe rol(opent in een nieuw venster) aan te maken. Indien ingeschakeld, voegt de Lockdown-modus extra beperkingen toe bovenop de bestaande beheerdersinstellingen.
Lees meer over de Lockdown-modus in ons Helpcentrum(opent in een nieuw venster).
Omdat sommige cruciale workflows afhankelijk zijn van apps, behouden werkruimtebeheerders meer gedetailleerde controle. Zij kunnen nauwkeurig bepalen welke apps (en welke specifieke acties binnen die apps) beschikbaar zijn voor gebruikers in de Lockdown-modus. Daarnaast biedt het Compliance API Logs Platform(opent in een nieuw venster) (los van de Lockdown-modus) gedetailleerd inzicht in appgebruik, gedeelde gegevens en verbonden bronnen, wat beheerders helpt toezicht te houden.
We zijn van plan de Lockdown-modus in de komende maanden beschikbaar te maken voor consumenten.
AI-producten kunnen nuttiger zijn wanneer ze verbonden zijn met je apps en het internet, en we hebben fors geïnvesteerd in het beveiligen van die verbonden gegevens. Tegelijkertijd introduceren sommige netwerkgerelateerde mogelijkheden nieuwe risico's die nog niet volledig zijn afgedekt door de gangbare veiligheidsnormen in de sector. Sommige gebruikers accepteren deze risico's; wij vinden het belangrijk dat gebruikers zelf kunnen beslissen of en hoe ze deze functies gebruiken, vooral wanneer ze met privégegevens werken.
Onze aanpak is om in het product zelf begeleiding te bieden bij functies die mogelijk extra risico met zich meebrengen. Om dit duidelijker en consistenter te maken, standaardiseren we de manier waarop we een select aantal bestaande functies labelen. Deze functies krijgen nu consistent het label 'Verhoogd risico' in ChatGPT, ChatGPT Atlas en Codex, zodat gebruikers overal dezelfde waarschuwing zien.
In Codex, onze programmeerassistent, kunnen ontwikkelaars bijvoorbeeld netwerktoegang verlenen zodat Codex acties op het internet kan uitvoeren, zoals documentatie opzoeken. Het betreffende instellingenscherm toont het label 'Verhoogd risico', samen met een duidelijke uitleg over wat er verandert, welke risico's er kunnen ontstaan en wanneer die toegang gepast is.

Een screenshot van het Codex-instellingenscherm waar gebruikers de netwerktoegang voor Codex kunnen configureren.
We blijven investeren in de versterking van onze veiligheidsmaatregelen, vooral met het oog op nieuwe, opkomende of groeiende risico's. Naarmate we de beveiliging voor deze functies verbeteren, zullen we het label 'Verhoogd risico' verwijderen zodra vaststaat dat de risico's voldoende zijn beperkt voor algemeen gebruik. We zullen ook blijven evalueren welke functies dit label dragen om risico's zo helder mogelijk aan gebruikers te communiceren.


