Pāriet uz galveno saturu
OpenAI

2026. gada 13. februāris

DrošībaProdukts

Iepazīstinām ar bloķēšanas režīmu un konsekventiem paaugstināta riska marķējumiem ChatGPT platformā

Notiek ielāde…

Mākslīgā intelekta sistēmām uzņemoties sarežģītākus uzdevumus – īpaši tādus, kas saistīti ar tīmekli un savienotajām lietotnēm – mainās drošības riski.

Viens no jaunajiem riskiem, kas ir kļuvis īpaši svarīgs, ir uzvedņu injekcija. Šāda veida uzbrukumos kāda trešā puse mēģina maldināt sarunvalodas mākslīgā intelekta (MI) sistēmu, lai tā sekotu ļaunprātīgām instrukcijām vai atklātu sensitīvu informāciju.

Šodien mēs ieviešam divus jaunus aizsardzības mehānismus, kas paredzēti, lai palīdzētu lietotājiem un organizācijām ierobežot uzvedņu injekcijas uzbrukumus, nodrošinot skaidrāku riska redzamību un stingrāku kontroli:

  • Bloķēšanas režīms ChatGPT vidē – tas ir paplašināts, izvēles drošības iestatījums augsta riska lietotājiem
  • “Paaugstināta riska” marķējumi noteiktām funkcijām, kas var radīt papildu risku ChatGPT, ChatGPT Atlas un Codex

Šie papildinājumi ir balstīti uz mūsu esošajiem aizsardzības pasākumiem modeļa, produkta un sistēmas līmenī. Tie ietver smilškastes izolāciju, aizsardzību pret uz URL balstītu datu eksfiltrāciju, uzraudzību un noteikumu izpildi, kā arī uzņēmuma līmeņa kontroli, piemēram, uz lomām balstītu piekļuvi un audita žurnālus.

Palīdzam organizācijām aizsargāt darbiniekus, kuri ir visvairāk pakļauti kiberuzbrukumu riskam

Bloķēšanas režīms ir izvēles, paplašināts drošības iestatījums, kas paredzēts nelielai īpaši uz drošību orientētu lietotāju grupai – piemēram, vadošiem darbiniekiem vai drošības komandām nozīmīgās organizācijās – kam nepieciešama paaugstināta aizsardzība pret sarežģītiem draudiem. Lielākajai daļai lietotāju tas nav nepieciešams. Bloķēšanas režīms stingri ierobežo, kā ChatGPT var mijiedarboties ar ārējām sistēmām, lai mazinātu risku, kas saistīts ar datu eksfiltrāciju, izmantojot uzvedņu injekcijas.

Bloķēšanas režīms deterministiski atslēdz noteiktus ChatGPT rīkus un iespējas, ko pretinieks varētu mēģināt izmantot, lai, lietojot tādus uzbrukuma veidus kā uzvedņu injekcijas, no lietotāju sarunām vai savienotajām lietotnēm izvilktu sensitīvus datus.

Piemēram, tīmekļa pārlūkošana bloķēšanas režīmā aprobežojas ar kešatmiņā saglabātu saturu, tāpēc neviens tiešsaistes tīkla pieprasījums neatstāj OpenAI kontrolēto tīklu. Šis ierobežojums ir izstrādāts, lai novērstu sensitīvu datu noplūdi uzbrucējam pārlūkošanas laikā. Dažas funkcijas tiek pilnībā atspējotas, ja mēs nevaram nodrošināt spēcīgas deterministiskas garantijas attiecībā uz datu drošību.

Diagramma ar nosaukumu “Bloķēšanas režīms”, kurā ChatGPT ir attēlots aizsargātā zonā ar savienojumiem ar privāto tīmekļa kešatmiņu, failu lejupielādi, piekļūšanu tīmeklim caur Canvas un publiskā tīmekļa pārlūkošanu. Ārējs “uzbrucējs” un publiskais tīmeklis ir attēloti ārpus robežas, ar bloķētiem ieejas punktiem, kas norāda uz ierobežotu piekļuvi bloķēšanas režīmā.

Bloķēšanas režīms ir jauns deterministisks iestatījums, kas palīdz pasargāt datus no nejaušas izpaušanas trešajām pusēm, stingri ierobežojot to, kā ChatGPT var mijiedarboties ar noteiktām ārējām sistēmām.

ChatGPT biznesa plāni jau nodrošina uzņēmuma līmeņa datu drošību. Bloķēšanas režīms papildina šos aizsardzības pasākumus un ir pieejams ChatGPT Enterprise, ChatGPT Edu, ChatGPT veselības aprūpei un ChatGPT for Teachers. Administratori to var iespējot darbvietas iestatījumos(atveras jaunā logā), izveidojot jaunu lomu(atveras jaunā logā). Kad tas ir iespējots, bloķēšanas režīms pievieno papildu ierobežojumus esošajiem administratora iestatījumiem.

Uzzini vairāk par bloķēšanas režīmu mūsu palīdzības centrā(atveras jaunā logā).

Tā kā dažas kritiski svarīgas darbplūsmas balstās uz lietotnēm, darbvietas administratori saglabā detalizētāku kontroli. Viņi var izvēlēties, kuras lietotnes un kādas konkrētas darbības šajās lietotnēs ir pieejamas lietotājiem bloķēšanas režīmā. Turklāt, atsevišķi no bloķēšanas režīma, Compliance API žurnālu platforma(atveras jaunā logā) nodrošina detalizētu pārskatu par lietotņu izmantošanu, kopīgotajiem datiem un savienotajiem avotiem, palīdzot administratoriem veikt pārraudzību.

Mēs plānojam tuvāko mēnešu laikā padarīt bloķēšanas režīmu pieejamu patērētājiem.

Palīdzība lietotājiem pieņemt pārdomātus lēmumus par risku

MI produkti var būt noderīgāki, ja tie ir savienoti ar tavām lietotnēm un tīmekli, un mēs esam ieguldījuši ievērojamus resursus, lai nodrošinātu savienoto datu drošību. Vienlaikus dažas ar tīklu saistītas iespējas rada jaunus riskus, kurus nozares drošības un aizsardzības mehānismi vēl nav pilnībā novērsuši. Daži lietotāji var justies gatavi uzņemties šos riskus, un mēs uzskatām, ka ir svarīgi, lai lietotājiem būtu iespēja izlemt, vai un kā izmantot aizsardzības mehānismus, īpaši strādājot ar saviem privātajiem datiem.

Mūsu pieeja ir sniegt norādījumus par produktā iekļautajām funkcijām, kas var radīt papildu risku. Lai to padarītu skaidrāku un konsekventāku, mēs standartizējam veidu, kā apzīmējam īsu esošo iespēju sarakstu. Šīs funkcijas tagad izmantos vienotu “paaugstināta riska” marķējumu visā ChatGPT, ChatGPT Atlas un Codex vidē, lai lietotāji saņemtu vienādus norādījumus neatkarīgi no tā, kur ar tām saskaras.

Piemēram, mūsu kodēšanas palīga Codex platformā izstrādātāji var piešķirt Codex piekļuvi tīklam, lai tas varētu veikt darbības tīmeklī, piemēram, meklēt dokumentāciju. Attiecīgajā iestatījumu ekrānā ir iekļauta etiķete “Paaugstināts risks”, kā arī skaidrojums par to, kas mainās, kādi riski var tikt radīti un kad šāda piekļuve ir piemērota.

Iestatījumu panelis “Aģentu piekļuve Internetam” ar pārslēdzēju, kas iestatīts stāvoklī Ieslēgts, un rāda opcijas atļauto domēnu sarakstam, papildu atļautos domēnus (tostarp openai.com), atļautās HTTP metodes un izceltu brīdinājumu, kurā norādīti paaugstināti drošības riski, atļaujot piekļuvi Internetam.

Ekrānuzņēmums ar Codex iestatījumu ekrānu, kur lietotāji var konfigurēt, kāda tīkla piekļuve Codex ir pieejama.

Kas būs tālāk?

Mēs turpinām ieguldīt drošības un aizsardzības pasākumu stiprināšanā, īpaši attiecībā uz jauniem vai augošiem riskiem. Stiprinot šo funkciju aizsardzības pasākumus, mēs noņemsim “paaugstināta riska” etiķeti, tiklīdz noteiksim, ka drošības uzlabojumi ir pietiekami mazinājuši šos riskus vispārējai lietošanai. Mēs arī turpināsim atjaunināt, kurām funkcijām laika gaitā būs šis marķējums, lai vislabāk informētu lietotājus par risku.

Autors

OpenAI