Mākslīgā intelekta sistēmām uzņemoties sarežģītākus uzdevumus – īpaši tādus, kas saistīti ar tīmekli un savienotajām lietotnēm – mainās drošības riski.
Viens no jaunajiem riskiem, kas ir kļuvis īpaši svarīgs, ir uzvedņu injekcija. Šāda veida uzbrukumos kāda trešā puse mēģina maldināt sarunvalodas mākslīgā intelekta (MI) sistēmu, lai tā sekotu ļaunprātīgām instrukcijām vai atklātu sensitīvu informāciju.
Šodien mēs ieviešam divus jaunus aizsardzības mehānismus, kas paredzēti, lai palīdzētu lietotājiem un organizācijām ierobežot uzvedņu injekcijas uzbrukumus, nodrošinot skaidrāku riska redzamību un stingrāku kontroli:
- Bloķēšanas režīms ChatGPT vidē – tas ir paplašināts, izvēles drošības iestatījums augsta riska lietotājiem
- “Paaugstināta riska” marķējumi noteiktām funkcijām, kas var radīt papildu risku ChatGPT, ChatGPT Atlas un Codex
Šie papildinājumi ir balstīti uz mūsu esošajiem aizsardzības pasākumiem modeļa, produkta un sistēmas līmenī. Tie ietver smilškastes izolāciju, aizsardzību pret uz URL balstītu datu eksfiltrāciju, uzraudzību un noteikumu izpildi, kā arī uzņēmuma līmeņa kontroli, piemēram, uz lomām balstītu piekļuvi un audita žurnālus.
Bloķēšanas režīms ir izvēles, paplašināts drošības iestatījums, kas paredzēts nelielai īpaši uz drošību orientētu lietotāju grupai – piemēram, vadošiem darbiniekiem vai drošības komandām nozīmīgās organizācijās – kam nepieciešama paaugstināta aizsardzība pret sarežģītiem draudiem. Lielākajai daļai lietotāju tas nav nepieciešams. Bloķēšanas režīms stingri ierobežo, kā ChatGPT var mijiedarboties ar ārējām sistēmām, lai mazinātu risku, kas saistīts ar datu eksfiltrāciju, izmantojot uzvedņu injekcijas.
Bloķēšanas režīms deterministiski atslēdz noteiktus ChatGPT rīkus un iespējas, ko pretinieks varētu mēģināt izmantot, lai, lietojot tādus uzbrukuma veidus kā uzvedņu injekcijas, no lietotāju sarunām vai savienotajām lietotnēm izvilktu sensitīvus datus.
Piemēram, tīmekļa pārlūkošana bloķēšanas režīmā aprobežojas ar kešatmiņā saglabātu saturu, tāpēc neviens tiešsaistes tīkla pieprasījums neatstāj OpenAI kontrolēto tīklu. Šis ierobežojums ir izstrādāts, lai novērstu sensitīvu datu noplūdi uzbrucējam pārlūkošanas laikā. Dažas funkcijas tiek pilnībā atspējotas, ja mēs nevaram nodrošināt spēcīgas deterministiskas garantijas attiecībā uz datu drošību.

Bloķēšanas režīms ir jauns deterministisks iestatījums, kas palīdz pasargāt datus no nejaušas izpaušanas trešajām pusēm, stingri ierobežojot to, kā ChatGPT var mijiedarboties ar noteiktām ārējām sistēmām.
ChatGPT biznesa plāni jau nodrošina uzņēmuma līmeņa datu drošību. Bloķēšanas režīms papildina šos aizsardzības pasākumus un ir pieejams ChatGPT Enterprise, ChatGPT Edu, ChatGPT veselības aprūpei un ChatGPT for Teachers. Administratori to var iespējot darbvietas iestatījumos(atveras jaunā logā), izveidojot jaunu lomu(atveras jaunā logā). Kad tas ir iespējots, bloķēšanas režīms pievieno papildu ierobežojumus esošajiem administratora iestatījumiem.
Uzzini vairāk par bloķēšanas režīmu mūsu palīdzības centrā(atveras jaunā logā).
Tā kā dažas kritiski svarīgas darbplūsmas balstās uz lietotnēm, darbvietas administratori saglabā detalizētāku kontroli. Viņi var izvēlēties, kuras lietotnes un kādas konkrētas darbības šajās lietotnēs ir pieejamas lietotājiem bloķēšanas režīmā. Turklāt, atsevišķi no bloķēšanas režīma, Compliance API žurnālu platforma(atveras jaunā logā) nodrošina detalizētu pārskatu par lietotņu izmantošanu, kopīgotajiem datiem un savienotajiem avotiem, palīdzot administratoriem veikt pārraudzību.
Mēs plānojam tuvāko mēnešu laikā padarīt bloķēšanas režīmu pieejamu patērētājiem.
MI produkti var būt noderīgāki, ja tie ir savienoti ar tavām lietotnēm un tīmekli, un mēs esam ieguldījuši ievērojamus resursus, lai nodrošinātu savienoto datu drošību. Vienlaikus dažas ar tīklu saistītas iespējas rada jaunus riskus, kurus nozares drošības un aizsardzības mehānismi vēl nav pilnībā novērsuši. Daži lietotāji var justies gatavi uzņemties šos riskus, un mēs uzskatām, ka ir svarīgi, lai lietotājiem būtu iespēja izlemt, vai un kā izmantot aizsardzības mehānismus, īpaši strādājot ar saviem privātajiem datiem.
Mūsu pieeja ir sniegt norādījumus par produktā iekļautajām funkcijām, kas var radīt papildu risku. Lai to padarītu skaidrāku un konsekventāku, mēs standartizējam veidu, kā apzīmējam īsu esošo iespēju sarakstu. Šīs funkcijas tagad izmantos vienotu “paaugstināta riska” marķējumu visā ChatGPT, ChatGPT Atlas un Codex vidē, lai lietotāji saņemtu vienādus norādījumus neatkarīgi no tā, kur ar tām saskaras.
Piemēram, mūsu kodēšanas palīga Codex platformā izstrādātāji var piešķirt Codex piekļuvi tīklam, lai tas varētu veikt darbības tīmeklī, piemēram, meklēt dokumentāciju. Attiecīgajā iestatījumu ekrānā ir iekļauta etiķete “Paaugstināts risks”, kā arī skaidrojums par to, kas mainās, kādi riski var tikt radīti un kad šāda piekļuve ir piemērota.

Ekrānuzņēmums ar Codex iestatījumu ekrānu, kur lietotāji var konfigurēt, kāda tīkla piekļuve Codex ir pieejama.
Mēs turpinām ieguldīt drošības un aizsardzības pasākumu stiprināšanā, īpaši attiecībā uz jauniem vai augošiem riskiem. Stiprinot šo funkciju aizsardzības pasākumus, mēs noņemsim “paaugstināta riska” etiķeti, tiklīdz noteiksim, ka drošības uzlabojumi ir pietiekami mazinājuši šos riskus vispārējai lietošanai. Mēs arī turpināsim atjaunināt, kurām funkcijām laika gaitā būs šis marķējums, lai vislabāk informētu lietotājus par risku.


