18 decembrie 2025

Îți prezentăm GPT‑5.2‑Codex

Cel mai avansat model de codare agentivă pentru inginerie software profesională și securitate cibernetică defensivă.

Astăzi lansăm GPT‑5.2‑Codex, cel mai avansat model de codare agentivă de până acum pentru inginerie software complexă, din lumea reală. GPT‑5.2‑Codex este o versiune a GPT‑5.2⁠ optimizată suplimentar pentru codarea agentivă în Codex, incluzând îmbunătățiri pentru lucrul pe termen lung prin compactarea contextului, performanțe mai bune la modificări mari de cod, cum ar fi refactorizarea și migrările, performanțe îmbunătățite în medii Windows și capabilități de securitate cibernetică semnificativ mai puternice.

Pe măsură ce modelele noastre continuă să avanseze pe frontiera inteligenței, am observat că aceste îmbunătățiri se traduc și în salturi de capacitate în domenii specializate, cum ar fi securitatea cibernetică⁠. De exemplu, chiar săptămâna trecută, un cercetător în securitate folosind GPT‑5.1‑Codex‑Max cu Codex CLI a găsit și a dezvăluit⁠(se deschide într-o fereastră nouă) în mod responsabil o vulnerabilitate în React, care ar putea duce la expunerea codului sursă.

GPT‑5.2‑Codex are capacități de securitate cibernetică mai puternice decât orice model pe care l-am lansat până acum. Aceste progrese pot ajuta la consolidarea securității cibernetice la scară largă, dar ridică, de asemenea, noi riscuri de utilizare duală care necesită o implementare atentă. Deși GPT‑5.2‑Codex nu atinge un nivel „ridicat” de capacitate cibernetică în cadrul Cadrului nostru de Pregătire, concepem abordarea noastră de implementare⁠ având în vedere creșterea viitoare a capacităților.

Lansăm GPT‑5.2‑Codex astăzi pe toate platformele Codex pentru utilizatorii plătitori ai ChatGPT și lucrăm pentru a permite accesul în siguranță la GPT‑5.2‑Codex pentru utilizatorii API în următoarele săptămâni. În paralel, test[m accesul de încredere doar pe bază de invitație la capabilitățile viitoare și modele mai permisive pentru profesioniștii și organizațiile verificate, axate pe activități autorizate de securitate cibernetică defensivă. Credem că această abordare a implementării va echilibra accesibilitatea cu siguranța.

Împingem frontierele în ingineria software din lumea reală

GPT‑5.2‑Codex se bazează pe punctele forte ale GPT‑5.2⁠ în domeniul cunoașterii profesionale și pe GPT‑5.1‑Codex‑Max⁠ cu ale sale capacități de codare agentivă de avangardă și de utilizare a terminalului. GPT‑5.2‑Codex este acum mai performant în înțelegerea contextului extins, apelarea fiabilă a instrumentelor, îmbunătățirea factualității și compactarea nativă, devenind un partener mai de încredere pentru sarcinile de programare de lungă durată, rămânând totodată eficient din punct de vedere al consumului de tokenuri în raționamentul său.

GPT‑5.2‑Codex atinge performanțe de ultimă generație pe SWE-Bench Pro și Terminal-Bench 2.0, teste de performanță concepute pentru a testa performanța agenților pe o gamă largă de sarcini în medii de terminale realiste. De asemenea, este mult mai eficient și mai fiabil la codarea agentivă în medii Windows native, bazându-se pe capabilitățile introduse în GPT‑5.1‑Codex‑Max.

Cu aceste îmbunătățiri, Codex este mai capabil să lucreze în depozite mari pe parcursul unor sesiuni extinse, cu contextul complet intact. Poate finaliza mai fiabil sarcini complexe, cum ar fi refactorizări mari, migrări de cod și dezvoltări de funcționalități — continuând să itereze fără a pierde șirul, chiar și atunci când planurile se schimbă sau încercările eșuează.

În SWE-Bench Pro⁠⁠⁠⁠, unui model i se atribuie un depozit de cod și trebuie să genereze un patch pentru a rezolva o sarcină realistă de inginerie software. Terminal-Bench 2.0 este un benchmark pentru testarea agenților AI în medii reale de terminale. Sarcinile includ compilarea codului, antrenarea modelelor și configurarea serverelor.

Performanța vizuală mai puternică permite GPT‑5.2‑Codex să interpreteze mai precis capturile de ecran, diagramele tehnice, graficele și suprafețele UI partajate în timpul sesiunilor de codare.

Codex poate prelua machete de design și le poate transforma rapid în prototipuri funcționale, iar tu poți colabora cu Codex pentru a duce aceste prototipuri în producție.

Machetă de design

Prototip generat de GPT‑5.2‑Codex

Avansarea frontierei cibernetice

Când analizăm performanța uneia dintre evaluările noastre de bază în securitatea cibernetică de-a lungul timpului, observăm o creștere bruscă a capacității începând cu GPT‑5‑Codex, o altă creștere semnificativă cu GPT‑5.1‑Codex‑Max și acum o a treia creștere cu GPT‑5.2‑Codex. Ne așteptăm ca modelele AI viitoare să continue pe această traiectorie. În pregătire, planificăm și evaluăm ca și cum fiecare model nou ar putea atinge niveluri „ridicate” de capacitate de securitate cibernetică, măsurate de Cadrul nostru de pregătire⁠(se deschide într-o fereastră nouă). Deși GPT‑5.2‑Codex nu a atins încă nivelul „ridicat” de capabilitate cibernetică, ne pregătim pentru viitoarele modele care vor depăși acest prag. Datorită creșterii capabilităților cibernetice, am adăugat măsuri de protecție suplimentare în model și în produs, care sunt prezentate în fișa sistemului⁠.

Evaluarea profesională de tip Capture-the-Flag (CTF) măsoară cât de des poate modelul să rezolve provocări avansate, în mai mulți pași, din lumea reală (care necesită abilități de securitate cibernetică la nivel profesional) într-un mediu Linux.

Capabilități cibernetice din lumea reală

Societatea modernă funcționează pe bază de software, iar fiabilitatea acestuia depinde de o securitate cibernetică puternică - menținerea online a sistemelor critice din domeniul bancar, al asistenței medicale, al comunicațiilor și al serviciilor esențiale, protejarea datelor sensibile și asigurarea faptului că oamenii pot avea încredere în software-ul pe care se bazează zi de zi. Vulnerabilitățile pot exista cu mult înainte ca cineva să știe de ele, iar găsirea, validarea și remedierea lor depind adesea de o comunitate de ingineri și cercetători independenți în domeniul securității, echipați cu instrumentele potrivite.

În 11 decembrie 2025, echipa React a publicat trei vulnerabilități de securitate care afectează aplicațiile construite cu componente React Server. Ceea ce a făcut ca această dezvăluire să fie notabilă nu au fost doar vulnerabilitățile în sine, ci și modul în care acestea au fost descoperite.

Andrew MacPherson, un inginer principal de securitate la Privy (o companie Stripe), folosea GPT‑5.1‑Codex‑Max cu Codex CLI și alți agenți de codare pentru a reproduce și studia o altă vulnerabilitate critică a React, dezvăluită în săptămâna precedentă, cunoscută sub numele de React2Shell⁠(se deschide într-o fereastră nouă) (CVE-2025-55182⁠(se deschide într-o fereastră nouă)). Scopul său a fost să evalueze cât de bine ar putea ajuta modelul la cercetarea vulnerabilităților din lumea reală.

Inițial, el a încercat mai multe analize de tip „zero-shot”, determinând modelul să examineze patch-ul și să identifice vulnerabilitatea pe care o aborda. Când aceasta nu a dat rezultate, a trecut la o abordare iterativă, cu solicitări mai mari. Când aceste abordări nu au avut succes, el a ghidat Codex prin fluxuri de lucru standard de securitate defensivă - configurarea unui mediu de testare local, analizarea suprafețelor potențiale de atac și folosind fuzzing pentru a testa sistemul cu intrări malformate. În timp ce încerca să reproducă problema React2Shell inițială, Codex a scos la iveală comportamente neașteptate care necesitau o investigație mai aprofundată. Pe parcursul unei singure săptămâni, acest proces a dus la descoperirea unor vulnerabilități necunoscute anterior, care au fost dezvăluite în mod responsabil echipei React.

Diagramă de flux intitulată „Descoperirea vulnerabilităților cu Codex: CVE-2025-55183” care prezintă un flux de lucru care începe cu un depozit Git și scanarea codului Codex pentru vulnerabilități. O încercare de tip zero-shot eșuează, urmată de un proces ghidat de experți care examinează baza de cod, identifică posibilele ținte, construiește un dispozitiv de testare și efectuează testarea fuzz pe o aplicație exemplu cu revalidare. Rezultatele sunt verificate pentru a crea o dovadă a conceptului, ceea ce duce la o dezvăluire responsabilă și la un patch care este aplicat înapoi în depozit.

Acest lucru demonstrează cum sistemele AI avansate pot accelera semnificativ activitatea de securitate defensivă în software-ul utilizat pe scară largă, în lumea reală. În același timp, capabilitățile care ajută apărătorii să se miște mai rapid pot fi, de asemenea, exploatate de actori rău intenționați.

Pe măsură ce sistemele agentive devin mai capabile în sarcini relevante pentru securitatea cibernetică, ne propunem ca prioritate fundamentală să ne asigurăm că aceste progrese sunt implementate în mod responsabil - combinând fiecare câștig de capabilitate cu garanții mai puternice, controale de acces mai stricte și o colaborare continuă cu comunitatea de securitate.

Îmbunătățirea apărării cibernetice prin acces de încredere

Echipele de securitate se pot confrunta cu restricții atunci când încearcă să emuleze actorii amenințători, să analizeze programe malware pentru a sprijini remedierea sau să testeze infrastructura critică. Dezvoltăm un program pilot de acces de încredere pentru a elimina fricțiunile pentru utilizatorii și organizațiile eligibile și a activa apărătorii de încredere să utilizeze capabilități AI cibernetice de ultimă generație pentru a accelera apărarea cibernetică.

Inițial, programul pilot va fi disponibil doar pe bază de invitație pentru profesioniștii verificați din domeniul securității, care au un istoric de dezvăluire responsabilă a vulnerabilităților și pentru organizațiile cu un caz clar de utilizare profesională în securitatea cibernetică. Participanții calificați vor avea acces la cele mai performante modele ale noastre pentru utilizări defensive, pentru a activa munca legitimă cu dublă utilizare.

Dacă ești un profesionist în domeniul securității sau faci parte dintr-o organizație care desfășoară activități de securitate etică, cum ar fi cercetarea vulnerabilităților sau red-teaming autorizat, te invităm să îți exprimi interesul de a ni te alătura și să ne oferi feedback despre ce ai dori să vezi de la program aici⁠(se deschide într-o fereastră nouă).

Concluzie

GPT‑5.2‑Codex reprezintă un pas înainte în modul în care AI avansată poate sprijini ingineria software din lumea reală și domenii specializate precum securitatea cibernetică - ajutând dezvoltatorii și apărătorii să abordeze sarcini complexe, pe termen lung, și consolidând instrumentele disponibile pentru cercetarea responsabilă în domeniul securității.

Prin Implementarea treptată a GPT‑5.2‑Codex, asociem implementarea cu măsuri de siguranță și colaborăm îndeaproape cu comunitatea de securitate, propunându-ne să maximizăm impactul defensiv și să reducem riscul de utilizare abuzivă. Ceea ce învățăm din această lansare va influența direct cum extindem accesul în timp, pe măsură ce frontierele software și cibernetice continuă să avanseze.

Autor

OpenAI

Continuă să citești

Vezi toate

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 este acum modelul preferat în Microsoft 365 Copilot

Produs9 iul. 2026

ChatGPT este acum un partener pentru munca ta cea mai ambițioasă

Produs9 iul. 2026

GPT-5.6: inteligență de vârf care crește odată cu ambiția ta

Produs9 iul. 2026