Etter hvert som AI-systemer påtar seg mer komplekse oppgaver–særlig oppgaver som involverer internett og tilkoblede apper–endrer sikkerhetsrisikoen seg.
En fremvoksende risiko har blitt spesielt viktig: meldingsmanipulasjon. I disse angrepene forsøker en tredjepart å villede et konversasjonelt AI-system til å følge ondsinnede instruksjoner eller avsløre sensitiv informasjon.
I dag introduserer vi to nye beskyttelser som er designet for å hjelpe brukere og organisasjoner med å redusere meldingsmanipulasjonangrep, med tydeligere innsyn i risiko og sterkere kontroller:
- Nedstengningsmodus i ChatGPT, en avansert, valgfri sikkerhetsinnstilling for brukere med høyere risiko
- «Etiketter for “forhøyet risiko” for visse funksjoner som kan medføre ytterligere risiko i ChatGPT, ChatGPT Atlas og Codex
Disse tilleggene bygger videre på våre eksisterende beskyttelser på modell-, produkt- og systemnivå. Dette inkluderer sikkerhetsboks, beskyttelse mot URL-basert dataeksfiltrering, overvåking og håndheving, og virksomhetsstyring som rollebaserte tilgangskontroller og revisjonslogger.
Nedstengningsmodus er en valgfri, avansert sikkerhetsinnstilling designet for en liten gruppe svært sikkerhetsbevisste brukere–som ledere eller sikkerhetsteam i fremtredende organisasjoner–som krever økt beskyttelse mot avanserte trusler. Det er ikke nødvendig for de fleste brukere. Nedstengningsmodus begrenser strengt hvordan ChatGPT kan samhandle med eksterne systemer for å redusere risikoen for meldingsmanipulasjonsbasert dataeksfiltrering.
Nedstengningsmodus deaktiverer deterministisk visse verktøy og funksjoner i ChatGPT som en angriper kan forsøke å utnytte for å eksfiltrere sensitive data fra brukernes samtaler eller tilkoblede apper via angrep som meldingsmanipulasjoner.
Nettlesing i nedstengningsmodus er for eksempel begrenset til bufret innhold, slik at ingen direkte nettverksforespørsler forlater OpenAIs kontrollerte nettverk. Denne begrensningen er designet for å forhindre at sensitive data blir eksfiltrert til en angriper gjennom nettlesing. Noen funksjoner deaktiveres helt når vi ikke kan gi sterke deterministiske garantier for datasikkerhet.

Nedstengningsmodus er en ny deterministisk innstilling som hjelper til med å beskytte data mot utilsiktet deling med tredjeparter ved å stramt begrense hvordan ChatGPT kan samhandle med visse eksterne systemer.
ChatGPTs virksomhetsplaner tilbyr allerede datasikkerhet i bedriftsklassen. Nedstengningsmodus bygger videre på disse beskyttelsene, og er tilgjengelig for ChatGPT Enterprise, ChatGPT Edu, ChatGPT for Healthcare og ChatGPT for Teachers. Administratorer kan aktivere det i Innstillinger for arbeidsområde(åpnes i et nytt vindu) ved å opprette en ny rolle(åpnes i et nytt vindu). Når den er aktivert, legger nedstengningsmodus til ytterligere restriksjoner på toppen av eksisterende administratorinnstillinger.
Finn ut mer om nedstengningsmodus i vårt Hjelpesenter(åpnes i et nytt vindu).
Fordi noen kritiske arbeidsflyter er avhengige av apper, har arbeidsområdeadministratorer mer detaljert kontroll. De kan velge nøyaktig hvilke apper – og hvilke spesifikke handlinger i disse appene – som er tilgjengelige for brukere i nedstengningsmodus . I tillegg, og separat fra nedstengningsmodus , gir API-plattformen for samsvarslogger(åpnes i et nytt vindu) detaljert innsikt i appbruk, delte data og tilkoblede kilder, og hjelper administratorer med å opprettholde oversikt.
Vi planlegger å gjøre nedstengningsmodus tilgjengelig for forbrukere i løpet av de kommende månedene.
KI-produkter kan være mer nyttige når de er koblet til appene dine og nettet, og vi har investert mye i å beskytte tilkoblede data. Samtidig introduserer noen nettverksrelaterte funksjoner nye risikoer som ennå ikke er fullt ut adressert av bransjens sikkerhets- og sikringstiltak. Noen brukere kan være komfortable med å ta på seg disse risikoene, og vi mener det er viktig at brukere har muligheten til å bestemme om og hvordan de vil bruke dem, spesielt når de jobber med sine private data.
Vår tilnærming har vært å tilby veiledning i produktet for funksjoner som kan medføre ekstra risiko. For å gjøre dette tydeligere og mer konsekvent, standardiserer vi hvordan vi merker en kort liste over eksisterende funksjoner. Disse funksjonene vil nå bruke en konsekvent “Forhøyet risiko”-etikett på tvers av ChatGPT, ChatGPT Atlas og Codex, slik at brukerne får den samme veiledningen uansett hvor de møter dem.
Utviklere kan for eksempel gi Codex, vår kodeassistent, nettverkstilgang slik at den kan utføre handlinger på nettet, som å slå opp dokumentasjon. Den relevante innstillingsskjermen inkluderer etiketten “Forhøyet risiko”, sammen med en tydelig forklaring på hva som endres, hvilke risikoer som kan introduseres, og når denne tilgangen er hensiktsmessig.

Et skjermbilde av Codex-innstillingsskjermen der brukere kan konfigurere hvilken nettverkstilgang Codex har.
Vi fortsetter å investere for å styrke våre sikkerhets- og sikringstiltak, spesielt for nye, fremvoksende eller økende risikoer. Når vi styrker sikkerhetstiltakene for disse funksjonene, fjerner vi etiketten «Forhøyet risiko» når vi fastslår at sikkerhetsforbedringer har redusert disse risikoene tilstrekkelig for generell bruk. Vi vil også fortsette å oppdatere hvilke funksjoner som har denne etiketten over tid for å kommunisere risikoen på best mulig måte til brukerne.


