Ko sistemi umetne inteligence (UI) prevzemajo zahtevnejše naloge, zlasti tiste, ki vključujejo splet in povezane aplikacije, se spremenijo varnostna tveganja.
Ena od nastajajočih tveganj je postala posebej pomembna: vstavljanje zavajajočega poziva. Pri teh napadih tretja oseba poskuša pogovorni sistem umetne inteligence zavesti, da sledi zlonamernim navodilom ali razkrije občutljive informacije.
Danes uvajamo dve novi zaščiti, zasnovani za pomoč uporabnikom in organizacijam pri zmanjševanju napadov z vstavljanjem zavajajočega poziva, ob boljši vidnosti tveganja in močnejših kontrolah:
- Način zaklepa v ChatGPT‑ju, napredna, neobvezna varnostna nastavitev za uporabnike z višjo stopnjo tveganja
- Oznake »povečano tveganje« za določene zmožnosti, ki lahko v ChatGPT, ChatGPT Atlas in Codex uvedejo dodatno tveganje
Te dopolnitve nadgrajujejo naše obstoječe zaščite na ravni modela, produkta in sistema. To vključuje izvedbo v peskovniku, zaščite pred izčrpavanjem podatkov na podlagi URL-jev, spremljanje in uveljavljanje ter upravljanje za podjetja, kot sta nadzor dostopa na podlagi vlog in revizijski dnevniki.
Način zaklepa je neobvezna, napredna varnostna nastavitev, zasnovana za majhen nabor uporabnikov, ozaveščenih o pomenu varnosti, kot so vodstveni delavci ali varnostne ekipe v uglednih organizacijah, in ki potrebujejo povečano zaščito pred naprednimi grožnjami. Za večino uporabnikov to ni potrebno. Način zaklepa strogo omejuje, kako lahko ChatGPT komunicira z zunanjimi sistemi, da zmanjša tveganje izčrpavanja podatkov na podlagi vstavljanja zavajajočega poziva.
Način zaklepa deterministično onemogoči določena orodja in zmožnosti v ChatGPT‑ju, ki bi jih napadalec lahko poskušal zlorabiti za izčrpavanje občutljivih podatkov iz pogovorov uporabnikov ali povezanih aplikacij z napadi, kot je vstavljanje zavajajočega poziva.
Na primer, brskanje po spletu je v načinu zaklepa omejeno na predpomnjeno vsebino, zato iz nadzorovanega omrežja OpenAI ne odhajajo nobene sprotne omrežne zahteve. Ta omejitev je zasnovana tako, da preprečuje eksfiltracijo občutljivih podatkov do napadalca prek brskanja. Nekatere funkcionalnosti so v celoti onemogočene, kadar ne moremo zagotoviti trdnih determinističnih jamstev glede varnosti podatkov.

Način zaklepa je nova deterministična nastavitev, ki pomaga varovati podatke pred nenamernim deljenjem s tretjimi osebami, in sicer tako, da strogo omejuje, kako lahko ChatGPT komunicira z določenimi zunanjimi sistemi.
Naročniški paketi ChatGPT Business že zagotavljajo varnost podatkov na ravni podjetij. Način zaklepa nadgrajuje te zaščite in je na voljo za ChatGPT Enterprise, ChatGPT Edu, ChatGPT za zdravstvo in ChatGPT za učitelje. Skrbniki ga lahko omogočijo v nastavitvah delovnega prostora(odpre se v novem oknu) z ustvarjanjem nove vloge(odpre se v novem oknu). Ko je način zaklepa omogočen, se uvedejo dodatne omejitve poleg obstoječih nastavitev skrbnika.
Več o načinu zaklepa lahko preberete v našem centru za pomoč(odpre se v novem oknu).
Ker so nekateri ključni delovni tokovi odvisni od aplikacij, skrbniki delovnega prostora ohranijo bolj granularne možnosti upravljanja. Izberejo lahko natančno, katere aplikacije in katera konkretna dejanja znotraj teh aplikacij so uporabnikom na voljo v načinu zaklepa. Poleg tega in neodvisno od načina zaklepa platforma dnevnikov aplikacijskega programskega vmesnika (API)(odpre se v novem oknu) za skladnost omogoča podroben vpogled v uporabo aplikacij, deljene podatke in povezane vire ter tako skrbnikom pomaga ohranjati nadzor.
V prihajajočih mesecih načrtujemo omogočitev načina zaklepa tudi potrošnikom.
Izdelki z UI so lahko uporabnejši, ko so povezani z vašimi aplikacijami in spletom, zato smo veliko vlagali v zagotavljanje varnosti povezanih podatkov. Hkrati pa nekatere zmožnosti, povezane z omrežjem, uvajajo nova tveganja, ki jih varnostni in zaščitni ukrepi v panogi še ne obravnavajo v celoti. Nekateri uporabniki so morda pripravljeni prevzeti ta tveganja, zato menimo, da je pomembno, da imajo uporabniki možnost odločiti se, ali in kako jih bodo uporabljali, zlasti pri delu s svojimi zasebnimi podatki.
Naš pristop je zagotavljanje usmeritev znotraj produkta za funkcionalnosti, ki lahko uvedejo dodatno tveganje. Da bi to naredili jasnejše in bolj dosledno, poenotimo način označevanja kratkega seznama obstoječih zmožnosti. Te funkcionalnosti bodo zdaj v ChatGPT‑ju, ChatGPT Atlasu in Codexu dosledno označene z oznako »povečano tveganje«, tako da bodo uporabniki prejeli enake usmeritve, kjer koli jih bodo srečali.
Na primer, v Codex, našem pomočniku za programiranje, lahko razvijalci Codex podelijo dostop do omrežja, da lahko izvaja dejanja na spletu, kot je iskanje dokumentacije. Ustrezni zaslon z nastavitvami vključuje oznako »povečano tveganje« skupaj z jasno razlago, kaj se spremeni, katera tveganja se lahko uvedejo in kdaj je tak dostop primeren.

Posnetek zaslona z nastavitvami za Codex, v katerem lahko uporabniki konfigurirajo, kakšen dostop do omrežja ima Codex.
Še naprej vlagamo v krepitev naših varnostnih in zaščitnih mehanizmov, zlasti glede novih, nastajajočih ali naraščajočih tveganj. Ko bomo okrepili zaščitne mehanizme za te funkcionalnosti, bomo oznako »povečano tveganje« odstranili, ko bomo ugotovili, da so varnostne izboljšave ta tveganja zadostno ublažile za splošno uporabo. Prav tako bomo sčasoma posodabljali, katere funkcionalnosti nosijo to oznako, da bi uporabnikom čim bolje posredovali informacije o tveganju.


