13 februarie 2026

Introducerea Modului de carantină și a etichetelor consecvente pentru risc ridicat în ChatGPT

Se încarcă…

Pe măsură ce sistemele de AI preiau sarcini mai complexe - în special cele care implică webul și aplicațiile conectate - mizele securității se schimbă.

Un risc emergent a devenit deosebit de important: injectarea de solicitări⁠. În aceste atacuri, o terță parte încearcă să inducă în eroare un sistem de AI conversațională pentru a urma instrucțiuni rău intenționate sau pentru a dezvălui informații sensibile.

Astăzi, introducem două protecții noi concepute pentru a ajuta utilizatorii și organizațiile să atenueze atacurile de injectări solicitare, cu o vizibilitate mai clară asupra riscului și controale mai puternice:

Modul de carantină în ChatGPT, o setare avansată și opțională de securitate pentru utilizatorii cu risc ridicat
Etichete „Risc Ridicat” pentru anumite capabilități care pot introduce riscuri suplimentare în ChatGPT, ChatGPT Atlas și Codex

Aceste completări se bazează pe protecțiile noastre existente la nivel de model, produs și sistem. Aceasta include izolarea în sandbox, protecții împotriva exfiltrării datelor bazate pe URL⁠, monitorizare și aplicare, și controale la nivel de companie⁠ precum controale de acces bazate pe roluri și jurnale de audit.

Ajutăm organizațiile să protejeze angajații cei mai vulnerabili la atacuri cibernetice

Modul de carantină este o setare de securitate avansată, opțională, concepută pentru un grup mic de utilizatori extrem de preocupați de securitate - cum ar fi directorii sau echipele de securitate din cadrul unor organizații importante - care necesită o protecție sporită împotriva amenințărilor avansate. Nu este necesar pentru majoritatea utilizatorilor. Modul de carantină restricționează strict modul în care ChatGPT poate interacționa cu sistemele externe pentru a reduce riscul de exfiltrare a datelor bazată pe injectare promptă.

Modul de carantină dezactivează în mod determinist anumite instrumente și capabilități din ChatGPT pe care un adversar ar putea încerca să le exploateze pentru a exfiltra date sensibile din conversațiile utilizatorilor sau din aplicațiile conectate prin atacuri precum injecțiile de solicitări.

De exemplu, navigarea pe web în Modul de carantină este limitată la conținutul din cache, astfel încât nicio solicitare live din rețea nu părăsește rețeaua controlată de OpenAI. Această restricție este concepută pentru a preveni exfiltrarea datelor sensibile către un atacator prin navigare pe web. Unele funcționalități sunt dezactivate complet atunci când nu putem oferi garanții deterministe solide privind siguranța datelor.

Diagramă intitulată „Mod de carantină” care arată ChatGPT în interiorul unei limite securizate, cu conexiuni la un cache web privat, descărcare de fișiere, acces la web prin Canvas și navigare pe web public. Un „atacator” extern și web-ul public sunt reprezentate în afara limitei, cu puncte de intrare blocate care indică acces restricționat în modul de carantină.

Modul de carantină este o nouă setare deterministă care ajută la protejarea datelor împotriva partajării accidentale cu terțe părți, prin restricționarea strictă a modului în care ChatGPT poate interacționa cu anumite sisteme externe.

Planurile de afaceri ChatGPT oferă deja securitate a datelor de nivel enterprise⁠. Modul de carantină se bazează pe aceste protecții și este disponibil pentru ChatGPT Enterprise, ChatGPT Edu, ChatGPT pentru sectorul medical și ChatGPT pentru profesori. Administratorii pot activa această opțiune în Setările spațiului de lucru⁠(se deschide într-o fereastră nouă) prin crearea unui nou rol⁠(se deschide într-o fereastră nouă). Când este activat, Modul de carantină adaugă restricții suplimentare peste setările de administrare existente.

Află mai multe despre Modul de carantină în Centrul de asistență⁠(se deschide într-o fereastră nouă).

Deoarece unele fluxuri de lucru critice se bazează pe aplicații, administratorii spațiului de lucru păstrează un control mai detaliat. Aceștia pot alege exact ce aplicații – și ce acțiuni specifice din cadrul acelor aplicații – sunt disponibile utilizatorilor în Modul de carantină. În plus, separat de Modul de carantină, platforma Compliance API Logs⁠(se deschide într-o fereastră nouă) oferă vizibilitate detaliată asupra utilizării aplicațiilor, a datelor partajate și a surselor conectate, ajutând administratorii să mențină supravegherea.

Intenționăm să punem Modul de carantină la dispoziția consumatorilor în lunile următoare.

Ajutăm utilizatorii să facă alegeri informate cu privire la risc.

Produsele AI pot fi mai utile atunci când sunt conectate la aplicațiile tale și la web, iar noi am investit mult în păstrarea datelor conectate în siguranță⁠. În același timp, unele capacități legate de rețea introduc riscuri noi care nu sunt încă pe deplin abordate de măsurile de siguranță și securitate ale industriei. Unii utilizatori ar putea fi confortabili să își asume aceste riscuri, iar noi credem că este important ca utilizatorii să aibă capacitatea de a decide dacă și cum să le utilizeze, mai ales atunci când lucrează cu datele lor private.

Abordarea noastră a fost să oferim ghidare în produs pentru funcții care pot introduce riscuri suplimentare. Pentru a clarifica și a asigura consecvența, standardizăm etichetarea unei liste scurte de capabilități existente. Aceste funcționalități vor folosi acum o etichetă consecventă „Risc ridicat” în ChatGPT, ChatGPT Atlas și Codex, astfel încât utilizatorii să primească aceleași îndrumări oriunde le întâlnesc.

De exemplu, în Codex, asistentul nostru de codare, dezvoltatorii pot oferi Codex acces la rețea, astfel încât să poată efectua acțiuni pe web, cum ar fi consultarea documentației. Ecranul de setări relevant include eticheta „Risc crescut”, împreună cu o explicație clară despre ce se schimbă, ce riscuri pot fi introduse și când este adecvat acel acces.

Panou de setări pentru „Acces la internet al agentului” cu comutatorul setat pe Activat, afișând opțiuni pentru o listă de permisiuni pentru domenii, domenii suplimentare permise (inclusiv openai.com), metode HTTP permise și un avertisment evidențiat care menționează riscuri de securitate sporite atunci când se activează accesul la internet.

O captură de ecran a ecranului de setări Codex, unde utilizatorii pot configura accesul la rețea al Codex.

Ce urmează

Continuăm să investim în întărirea măsurilor noastre de siguranță și securitate, mai ales pentru riscuri noi, emergente sau în creștere. Pe măsură ce consolidăm măsurile de protecție pentru aceste funcții, vom elimina eticheta „Risc crescut” odată ce stabilim că progresele în materie de securitate au atenuat suficient aceste riscuri pentru utilizarea generală. Vom continua să actualizăm ce funcții poartă această etichetă, pentru a comunica cât mai bine riscul către utilizatori.

2026

Autor

OpenAI

Continuă să citești

Vezi toate

Launching Health in ChatGPT

Produs23 iul. 2026

Îți prezentăm OpenAI Presence

Produs22 iul. 2026

Safety and alignment in an era of long-horizon models

Siguranță20 iul. 2026