10 decembrie 2025

Consolidarea rezilienței cibernetice pe măsură ce capabilitățile AI avansează

Pe măsură ce modelele noastre devin mai bune în domeniul securității cibernetice, investim în îmbunătățirea lor, adăugăm măsuri suplimentare de protecție și colaborăm cu experți globali în securitate.

Se încarcă…

Capabilitățile cibernetice ale modelelor AI avansează rapid, aducând beneficii semnificative pentru apărarea cibernetică, precum și noi riscuri de utilizare duală care trebuie gestionate cu atenție. De exemplu, capacitățile evaluate prin testări tip capturează-steagul (CTF) s-au îmbunătățit de la 27% pentru GPT‑5⁠(se deschide într-o fereastră nouă), în august 2025, la 76% pentru GPT‑5.1‑Codex‑Max⁠(se deschide într-o fereastră nouă), în noiembrie 2025.

Ne așteptăm ca modelele AI viitoare să continue pe această traiectorie; pentru a fi pregătiți, planificăm și evaluăm ca și cum fiecare model nou ar putea atinge niveluri „ridicate” de capacitate de securitate cibernetică, măsurate de Cadrul nostru de pregătire⁠(se deschide într-o fereastră nouă). Prin aceasta, ne referim la modele care pot fie să dezvolte exploatări remote zero-day funcționale împotriva unor sisteme bine apărate, fie să sprijine în mod semnificativ operațiuni complexe și discrete de intruziune în medii enterprise sau industriale, care vizează efecte în lumea reală. Acest articol explică modul în care gândim măsurile de protecție pentru modelele care ating aceste niveluri de capacitate și cum ne asigurăm că ele ajută în mod semnificativ apărătorii, limitând utilizarea abuzivă.

Pe măsură ce aceste capabilități avansează, OpenAI investește în consolidarea modelelor noastre pentru sarcini defensive de securitate cibernetică și în crearea de instrumente care le permit apărătorilor să desfășoare mai ușor fluxuri de lucru, precum auditarea codului și remedierea vulnerabilităților. Obiectivul nostru este ca modelele și produsele noastre să aducă avantaje semnificative pentru apărători, care sunt adesea depășiți numeric și au resurse insuficiente.

La fel ca alte domenii cu dublă utilizare, fluxurile de lucru cibernetice defensive și ofensive se bazează adesea pe aceleași cunoștințe și tehnici de bază. Investim în măsuri de protecție pentru a ne asigura că aceste capacități puternice aduc beneficii în principal utilizărilor defensive și limitează utilizarea în scopuri rău intenționate. Securitatea cibernetică influențează aproape fiecare domeniu, ceea ce înseamnă că nu ne putem baza pe o singură categorie de măsuri de protecție — cum ar fi restricționarea cunoștințelor sau utilizarea exclusivă a accesului verificat — ci avem nevoie de o abordare de apărare aprofundată, care să echilibreze riscul și să ofere utilizatorilor autonomie. În practică, acest lucru înseamnă modelarea felului în care capabilitățile sunt accesate, ghidate și aplicate, astfel încât modelele avansate să consolideze securitatea, în loc să reducă barierele în calea utilizării abuzive.

Vedem această muncă nu ca pe un efort unic, ci ca pe o investiție susținută, pe termen lung, care să ofere un avantaj apărătorilor și să întărească în mod constant securitatea infrastructurii critice din întregul ecosistem.

Atenuarea utilizărilor rău intenționate

Modelele noastre sunt concepute și instruite să funcționeze în siguranță, sprijinite de sisteme proactive care detectează și răspund la abuzul cibernetic. Perfecționăm continuu aceste măsuri de protecție pe măsură ce capabilitățile noastre și peisajul amenințărilor se schimbă. Deși niciun sistem nu poate garanta prevenirea completă a utilizării abuzive în securitatea cibernetică fără a afecta grav utilizările defensive, strategia noastră este de a reduce riscul printr-un sistem de siguranță stratificat.

La baza acestui lucru, adoptăm o abordare de apărare aprofundată, bazându-ne pe o combinație de controale de acces, consolidarea infrastructurii, controale de ieșire și monitorizare. Completăm aceste măsuri cu sisteme de detectare și răspuns, precum și cu programe dedicate de informații despre amenințări și de gestionare a riscurilor interne, astfel încât amenințările emergente să fie identificate și blocate rapid. Aceste măsuri de protecție sunt concepute să evolueze odată cu peisajul amenințărilor. Pornim de la ideea că schimbarea este constantă și construim astfel încât să ne putem adapta rapid și adecvat.

Pornind de la această bază:

Antrenarea modelului să refuze sau să răspundă în siguranță la solicitări dăunătoare, rămânând în același timp util pentru cazuri de utilizare educaționale și defensive: ne antrenăm modelele de vârf să refuze sau să răspundă în siguranță la solicitări care ar permite abuzuri cibernetice clare, rămânând în același timp cât mai utile pentru cazuri de utilizare legitime, defensive și educaționale.
Sisteme de detectare: rafinăm și menținem monitorizarea la nivelul întregului sistem în toate produsele care utilizează modele de vârf pentru a detecta activități cibernetice potențial rău intenționate. Când activitatea pare nesigură, putem bloca rezultatul generat, direcționa solicitările către modele mai sigure sau mai puțin capabile ori escalada cazul pentru aplicarea de măsuri. Aplicarea măsurilor de către noi combină revizuirea automată și cea umană, ghidată de factori precum cerințele legale, gravitatea și comportamentul repetat. De asemenea, colaborăm îndeaproape cu dezvoltatorii și clienții corporativi pentru a ne pune de acord asupra standardelor de siguranță și pentru a permite utilizarea responsabilă, cu căi clare de escaladare.
Red teaming de la un capăt la altul: colaborăm cu organizații experte în red teaming pentru a evalua și îmbunătăți măsurile noastre de siguranță. Rolul lor este să încerce să ocolească toate mecanismele noastre de apărare, operând de la un capăt la altul, la fel cum ar face un adversar hotărât și bine echipat. Acest lucru ne ajută să identificăm lacunele din timp și să consolidăm întregul sistem.

Inițiative ale ecosistemului pentru consolidarea rezilienței cibernetice

OpenAI a investit devreme în aplicarea AI la cazuri de utilizare defensivă în domeniul securității cibernetice, iar echipa noastră colaborează îndeaproape cu experți globali pentru a dezvolta atât modelele noastre, cât și aplicarea acestora. Apreciem comunitatea globală a practicienilor din domeniul securității cibernetice, care lucrează pentru a face lumea noastră digitală mai sigură și ne angajăm să oferim instrumente puternice, care sprijină securitatea defensivă. Pe măsură ce implementăm noi măsuri de protecție, vom continua să colaborăm cu comunitatea de securitate cibernetică pentru a înțelege cum AI poate consolida semnificativ reziliența și unde măsurile de protecție bine gândite sunt cele mai importante.

Pe lângă aceste colaborări, punem la cale câteva inițiative menite să-i ajute pe apărători să se miște mai repede, să ne bazăm măsurile de protecție pe nevoile reale și să accelerăm remedierea responsabilă la scară largă.

Programe de acces de încredere pentru apărarea cibernetică

În curând vom introduce un program de acces de încredere, în cadrul căruia vom explora posibilitatea de a oferi utilizatorilor și clienților eligibili, care lucrează în domeniul apărării cibernetice, acces pe niveluri la capabilități îmbunătățite în cele mai recente modele ale noastre, pentru cazuri de utilizare defensivă. Încă explorăm limita corectă a capabilităților la care putem oferi acces larg și care dintre acestea necesită restricții pe niveluri, ceea ce ar putea influența designul viitor al acestui program. Ne propunem ca acest program de acces de încredere să fie un element de bază pentru un ecosistem rezilient.

Extinderea capacității de apărare cu Aardvark

Aardvark, cercetătorul nostru de securitate agentivă, care ajută dezvoltatorii și echipele de securitate să găsească și să remedieze vulnerabilități la scară largă, este acum disponibil în versiune beta privată. Scanează bazele de cod pentru a identifica vulnerabilități și propune patch-uri pe care responsabilii cu întreținerea le pot adopta rapid. A identificat deja noi CVE-uri în software open-source prin raţionament asupra unor baze de cod întregi. Plănuim să oferim acoperire gratuită pentru anumite depozite open source non-comerciale, pentru a contribui la securitatea ecosistemului software open source și a lanțului de aprovizionare. Depune-ți candidatura aici pentru a participa.

Consiliu pentru Risc de Frontieră

Vom înființa Consiliul pentru Riscuri de Frontieră, un grup consultativ care va aduce apărători cibernetici cu experiență și practicieni în domeniul securității într-o colaborare strânsă cu echipele noastre. Acest consiliu își va începe activitatea concentrându-se pe securitatea cibernetică și se va extinde în viitor și în alte domenii de capabilități de vârf. Membrii vor oferi îndrumări cu privire la limita dintre capacitatea utilă și responsabilă și potențiala utilizare abuzivă, iar aceste concluzii vor fundamenta în mod direct evaluările noastre și măsurile noastre de protecție. Vom împărtăși mai multe despre consiliu în curând.

Dezvoltarea unei înțelegeri comune cu industria a modelelor de amenințare

În cele din urmă, anticipăm că utilizarea abuzivă în domeniul cibernetic ar putea deveni fezabilă cu orice model de vârf din industrie. Pentru a aborda acest aspect, colaborăm cu alte laboratoare de vârf prin intermediul Frontier Model Forum, o organizație nonprofit susținută de laboratoare AI de top și parteneri din industrie, pentru a dezvolta o înțelegere comună a modelelor de amenințări și a celor mai bune practici. În acest context, modelarea amenințărilor ajută la reducerea riscurilor prin identificarea modului în care capabilitățile AI ar putea fi transformate în arme, unde există blocaje critice pentru diferiți actori rău intenționați și cum modelele de vârf ar putea oferi un impuls semnificativ. Această colaborare își propune să construiască o înțelegere consistentă, la nivelul întregului ecosistem, a actorilor amenințători și a căilor de atac, permițând laboratoarelor, personalului de mentenanță și apărătorilor să își îmbunătățească atenuarea și să asigure propagarea rapidă a informațiilor critice despre securitate în întregul ecosistem. Colaborăm, de asemenea, cu echipe externe pentru a dezvolta evaluări de securitate cibernetică⁠(se deschide într-o fereastră nouă). Sperăm că un ecosistem de evaluări independente va contribui în continuare la construirea unei înțelegeri comune a capabilităților modelelor.

Împreună, aceste eforturi reflectă angajamentul nostru pe termen lung față de consolidarea laturii defensive a ecosistemului. Pe măsură ce modelele devin mai capabile, scopul nostru este să contribuim la asigurarea faptului că aceste capabilități se traduc în avantaje reale pentru apărători — bazate pe nevoi din lumea reală, modelate de contribuția experților și implementate cu grijă. Pe lângă această activitate, intenționăm să explorăm și alte inițiative și granturi pentru securitate cibernetică, pentru a contribui la identificarea unor idei revoluționare care s-ar putea să nu apară prin canalele tradiționale și pentru a colecta, prin contribuții din surse diverse, mecanisme de apărare îndrăznețe și creative din mediul universitar, industrie și comunitatea open source. Per ansamblu, aceasta este o activitate continuă și ne așteptăm să continuăm să dezvoltăm aceste programe pe măsură ce învățăm ce contribuie cel mai eficient la îmbunătățirea securității în lumea reală.