23 aprilie 2026

Prezentăm GPT‑5.5

O nouă clasă de inteligență pentru munca reală

Se încarcă…

Actualizare din 24 aprilie 2026: GPT‑5.5 și GPT‑5.5 Pro sunt acum disponibile în API. Fișa de sistem a fost, de asemenea, actualizată pentru a descrie măsurile de protecție suplimentare care se aplică.

Lansăm GPT‑5.5, cel mai inteligent și mai intuitiv model al nostru de până acum, precum și următorul pas către un nou mod de a lucra pe calculator.

GPT‑5.5 înțelege mai repede ce încerci să faci și poate prelua singur o parte mai mare din muncă. Excelează la scrierea și depanarea codului, cercetare pe internet, analiza datelor, crearea de documente și foi de calcul, utilizarea programelor și trecerea de la un instrument la altul până la finalizarea unei sarcini. În loc să gestionezi cu atenție fiecare pas, îi poți da lui GPT‑5.5 o sarcină dezordonată, alcătuită din mai multe părți, și să ai încredere că va planifica, va folosi instrumente, își va verifica munca, va naviga prin ambiguitate și va merge mai departe.

Progresele sunt deosebit de puternice în programarea agentică, utilizarea calculatorului, munca intelectuală și cercetarea științifică aflată în stadii incipiente, adică domenii în care progresul depinde de raționament aplicat în contexte diverse și de întreprinderea de acțiuni în timp. GPT‑5.5 oferă acest salt înainte în materie de inteligență fără a compromite viteza: modelele mai mari și mai capabile sunt adesea mai lente la utilizare, dar GPT‑5.5 egalează latența pe token a GPT‑5.4 în condiții reale de utilizare, în timp ce oferă un nivel de inteligență mult mai ridicat. De asemenea, utilizează semnificativ mai puține tokenuri pentru a finaliza aceleași sarcini Codex, ceea ce îl face mai eficient, dar și mai capabil.

Lansăm GPT‑5.5 cu cel mai puternic set de măsuri de protecție de până acum, concepute pentru a reduce utilizarea abuzivă, păstrând în același timp accesul pentru activități benefice. Am evaluat acest model în raport cu întreaga noastră suită de cadre de siguranță și pregătire, am colaborat cu specialiști în red teaming interni și externi, am adăugat teste specifice pentru funcțiile avansate de securitate cibernetică și biologie și am adunat opinii și sugestii privind cazuri reale de utilizare de la aproape 200 de parteneri de încredere cu acces timpuriu înainte de lansare.

Astăzi, GPT‑5.5 este lansat pentru utilizatorii Plus, Pro, Business și Enterprise în ChatGPT și Codex, iar GPT‑5.5 Pro este lansat pentru utilizatorii Pro, Business și Enterprise în ChatGPT. Implementările API-ului necesită măsuri de protecție diferite, iar noi colaborăm îndeaproape cu partenerii și clienții pentru a defini cerințele privind siguranța și securitatea pentru furnizarea sa la scară largă. Vom aduce GPT‑5.5 și GPT‑5.5 Pro în API foarte curând.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82,7%	75,1%	-	-	69,4%	68,5%
Expert-SWE (intern)	73,1%	68,5%	-	-	-	-
GDPval (wins or ties)	84,9%	83,0%	82,3%	82,0%	80,3%	67,3%
OSWorld-Verified	78,7%	75,0%	-	-	78,0%	-
Toolathlon	55,6%	54,6%	-	-	-	48,8%
BrowseComp	84,4%	82,7%	90,1%	89,3%	79,3%	85,9%
FrontierMath Nivelurile 1–3	51,7%	47,6%	52,4%	50,0%	43,8%	36,9%
FrontierMath Nivelul 4	35,4%	27,1%	39,6%	38,0%	22,9%	16,7%
CyberGym	81,8%	79,0%	-	-	73,1%	-

Capacitățile modelului

OpenAI construiește infrastructura globală pentru inteligența artificială agentică, făcând posibil ca oamenii și companiile din întreaga lume să își desfășoare activitatea cu ajutorul inteligenței artificiale. În ultimul an, am văzut cum inteligența artificială a accelerat semnificativ ingineria informatică. Cu GPT‑5.5 în Codex și ChatGPT, aceeași transformare începe să se extindă către cercetarea științifică și activitatea mai amplă pe care oamenii o desfășoară pe calculatoare.

În toate aceste domenii, GPT‑5.5 nu este doar mai inteligent; este și mai eficient în modul în care abordează problemele, oferind adesea rezultate de calitate mai ridicată cu mai puține tokenuri și mai puține reîncercări. Pe Coding Index al Artificial Analysis, GPT‑5.5 oferă inteligență de ultimă generație la jumătate din costul modelelor competitive de vârf pentru programare.

Artificial Analysis Intelligence Index⁠(se deschide într-o fereastră nouă) este media ponderată a 10 evaluări efectuate de o parte terță: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Programare agentică

GPT‑5.5 este cel mai puternic model de codare agentică al nostru de până acum. Pe Terminal-Bench 2.0, care testează fluxuri de lucru complexe în linia de comandă ce necesită planificare, iterație și coordonarea instrumentelor, atinge o acuratețe de ultimă generație de 82,7%. Pe SWE-Bench Pro, care evaluează rezolvarea problemelor GitHub din lumea reală, atinge 58,6%, rezolvând integral mai multe sarcini dintr-o singură trecere decât modelele anterioare. Pe Expert-SWE, evaluarea noastră internă de vârf pentru sarcini de programare pe termen lung, cu un timp mediu estimat de finalizare de către un om de 20 de ore, GPT‑5.5 depășește, de asemenea, GPT‑5.4.

În toate cele trei evaluări, GPT‑5.5 aduce îmbunătățiri față de scorurile GPT‑5.4, folosind totodată mai puține tokenuri.

Punctele forte ale modelului în materie de programare se evidențiază în mod deosebit în Codex, unde acesta poate prelua sarcini de inginerie informatică, de la implementare și refactorizare până la depanare, testare și validare. Testele preliminare indică faptul că GPT‑5.5 excelează în aspectele esențiale pentru activitatea reală de inginerie, precum menținerea contextului în sisteme de mari dimensiuni, raționamentul în cazul erorilor ambigue, verificarea ipotezelor cu ajutorul instrumentelor și implementarea modificărilor în codul sursă aferent.

Traiectoria redată utilizează datele vectoriale din baza de date NASA/JPL Horizons pentru constelația Orion, Lună și Soare, cu o scalare a afișajului aplicată pentru o mai bună lizibilitate.

Solicitare:[imagine anexată] Implementează aceasta ca o aplicație nouă folosind WebGL și Vite, utilizând date reale din misiunea Artemis II. Asigură-te că testezi temeinic aplicația până când este complet funcțională și arată ca aplicația din imagine. Acordă o atenție deosebită randării planetelor și traiectoriilor de zbor. Vreau să pot interacționa cu randarea 3D. Asigură-te că respectă legi de mecanică orbitală realiste.

Dincolo de testele de performanță, primii utilizatori care au testat modelul au afirmat că GPT‑5.5 demonstrează o capacitate sporită de a înțelege structura unui sistem: de ce apare o eroare, unde trebuie aplicată soluția și ce alte părți ale codului ar putea fi afectate.

„Primul model de programare pe care l-am folosit care are o claritate conceptuală remarcabilă.”

Dan Shipper, fondator și director executiv al Every, a descris GPT‑5.5 drept „primul model de programare pe care l-am folosit care are o claritate conceptuală remarcabilă”.

După lansarea unei aplicații, a petrecut zile întregi rezolvând o problemă apărută după lansare, înainte de a apela la unul dintre cei mai buni ingineri ai săi pentru a rescrie o parte din sistem. Pentru a testa GPT‑5.5, a dat efectiv timpul înapoi: putea modelul să analizeze starea defectă și să producă același tip de rescriere asupra căreia inginerul s-a decis în cele din urmă? GPT‑5.4 nu a putut. GPT‑5.5 a putut.

„Chiar simt că lucrez cu o inteligență superioară și există aproape un sentiment de respect.”

Pietro Schirano, directorul general al MagicPath, a observat un salt similar atunci când GPT‑5.5 a integrat o ramură care conținea sute de modificări la interfața utilizatorului și refactorizări într-o ramură principală care, la rândul ei, suferise modificări substanțiale, finalizând astfel întreaga operațiune dintr-o singură mișcare, în aproximativ 20 de minute.

Inginerii cu experiență care au testat modelul au afirmat că GPT‑5.5 s-a dovedit a fi semnificativ mai performant decât GPT‑5.4 și Claude Opus 4.7 în ceea ce privește capacitatea de raționament și autonomia, identificând problemele din timp și anticipând necesitățile de testare și revizuire fără a fi solicitat în mod explicit. Într-un caz, un inginer i-a cerut să reproiecteze un sistem de comentarii într-un editor colaborativ Markdown, iar sistemul a returnat o listă de 12 modificări care era aproape completă. Alții au afirmat că au avut nevoie de surprinzător de puține ajustări la nivel de implementare și s-au simțit mai încrezători în planurile GPT‑5.5 în comparație cu GPT‑5.4.

Un inginer de la NVIDIA, care a avut acces la model încă din faza incipientă, a mers atât de departe încât a spus: „Pierderea accesului la GPT‑5.5 mă face să simt că mi s-a amputat un membru.”

„GPT-5.5 este vizibil mai inteligent și mai perseverent decât GPT-5.4, cu performanțe de programare mai ridicate și utilizarea mai fiabilă a instrumentelor. Rămâne concentrat asupra sarcinii pentru o perioadă semnificativ mai lungă, fără să se oprească prematur, ceea ce contează cel mai mult pentru activitatea complexă și de lungă durată pe care utilizatorii noștri o deleagă către Cursor.”

– Michael Truell, cofondator și director executiv al Cursor

Muncă bazată pe cunoștințe

Aceleași puncte forte care fac din GPT‑5.5 un model excelent pentru programare îl fac la fel de puternic și pentru munca de zi cu zi la calculator. Deoarece modelul este mai bun la înțelegerea intenției, poate parcurge mai natural întregul ciclu al muncii bazate pe cunoaștere: găsirea informațiilor, înțelegerea lucrurilor importante, utilizarea instrumentelor, verificarea rezultatului și transformarea materiei prime în ceva util.

În Codex, GPT‑5.5 este mai bun decât GPT‑5.4 la generarea de documente, foi de calcul și prezentări de diapozitive. Testerii din faza alfa au afirmat că acest model a depășit performanțele modelelor anterioare în activități precum cercetarea operațională, modelarea în foi de calcul și transformarea datelor de afaceri dezorganizate în planuri. În combinație cu abilitățile de utilizare a calculatorului ale modelului Codex, GPT‑5.5 ne face să simțim tot mai mult că modelul poate chiar să folosească calculatorul alături de tine: vede ce apare pe ecran, dă clicuri, tastează, navighează prin interfețe și trece de la un instrument la altul cu precizie.

Echipele de la OpenAI folosesc deja aceste puncte forte în fluxurile de lucru reale. Astăzi, peste 85% din companie folosește Codex în fiecare săptămână în toate funcțiile, inclusiv inginerie informatică, finanțe, comunicare, marketing, știința datelor și management de produse. În echipa de comunicare, echipa a folosit GPT‑5.5 în Codex pentru a analiza șase luni de date privind solicitările de intervenții, a construi un cadru de evaluare și de risc și a valida un agent Slack automatizat, astfel încât solicitările cu risc scăzut să poată fi gestionate automat, în timp ce solicitările cu risc mai ridicat să fie direcționate în continuare către evaluare umană. În departamentul financiar, echipa a utilizat Codex pentru a revizui 24,771 de formulare fiscale K-1, însumând 71,637 de pagini, folosind un flux de lucru care excludea informațiile personale și a ajutat echipa să finalizeze sarcina cu două săptămâni mai devreme față de anul precedent. În echipa de lansare pe piață, un angajat a automatizat rapoarte săptămânale de activitate, economisind astfel 5-10 ore pe săptămână.

În ChatGPT, GPT‑5.5 Thinking oferă asistență mai rapidă pentru problemele mai dificile, cu răspunsuri mai inteligente și mai concise, care te ajută să gestionezi sarcinile complexe mai eficient. Excelează la activități profesionale precum programare, cercetare, sinteza informațiilor și analiză, precum și sarcini care implică multe documente, mai ales atunci când utilizează extensii.

În GPT‑5.5 Pro, primii testeri observă un salt semnificativ atât în ceea ce privește dificultatea, cât și calitatea activităților pe care ChatGPT le poate prelua, precum și îmbunătățiri ale latenței care îl fac mult mai practic pentru sarcini solicitante. Comparativ cu GPT‑5.4 Pro, testerii au constatat că răspunsurile GPT‑5.5 Pro sunt semnificativ mai cuprinzătoare, mai bine structurate, mai exacte, mai relevante și mai utile, cu performanțe deosebit de bune în afaceri, domeniul juridic, educație și știința datelor.

GPT‑5.5 atinge performanțe de ultimă generație în mai multe teste de performanță care reflectă acest tip de activitate. În GDPval⁠⁠, care testează capacitățile agenților de a produce activități intelectuale bine definite din 44 de profesii, GPT‑5.5 obține un scor de 84,9%. În OSWorld-Verified, care măsoară dacă un model poate opera singur în medii informatice reale, acesta atinge 78,7%. Și pe Tau2-bench Telecom, care testează fluxuri de lucru complexe de servicii pentru clienți, atinge 98,0% fără ajustarea solicitării. GPT‑5.5 dă dovadă, de asemenea, de performanțe puternice în alte teste de performanță pentru munca bazată pe cunoștințe: 60,0% la FinanceAgent, 88,5% pe sarcini interne de modelare pentru investiții bancare și 54,1% la OfficeQA Pro.

Tau2-bench Telecom a fost rulat fără ajustarea solicitărilor (și cu GPT‑4.1 ca model al utilizatorului). GPT‑5.5 înțelege mai bine intenția sarcinii și este mai eficient în privința tokenurilor decât predecesorii săi.

„GPT-5.5 oferă performanța susținută necesară pentru munca ce implică multă execuție. Construit și utilizat pe sistemele NVIDIA GB200 NVL72, modelul le permite echipelor noastre să livreze funcții complete pornind de la solicitări în limbaj natural, să reducă timpul de depanare de la zile la ore și să transforme săptămâni de experimentare în progrese obținute peste noapte în baze de cod complexe. Înseamnă mai mult decât programare mai rapidă: este un nou mod de lucru care îi ajută pe oameni să opereze la o viteză fundamental diferită.”

– Justin Boitano, vicepreședinte IA pentru companii la NVIDIA

Cercetare științifică

GPT‑5.5 demonstrează, de asemenea, îmbunătățiri în fluxurile de lucru din domeniul cercetării științifice și tehnice, care implică mai mult decât simpla răspuns la o întrebare dificilă. Cercetătorii trebuie să exploreze o idee, să adune dovezi, să testeze ipoteze, să interpreteze rezultatele și să decidă ce să încerce în continuare. GPT‑5.5 este mai bun decât alte modele în a persevera pe parcursul acelui ciclu.

În mod remarcabil, GPT‑5.5 arată o îmbunătățire clară față de GPT‑5.4 pe GeneBench⁠(se deschide într-o fereastră nouă), o nouă evaluare care se concentrează pe analiza științifică de date în mai multe etape în genetică și biologie cantitativă. Aceste probleme necesită modele capabile să analizeze date potențial ambigue sau eronate cu un nivel minim de supraveghere, să facă față obstacolelor realiste, precum factorii de confuzie ascunși sau erorile în controlul calității, și să implementeze și să interpreteze corect metodele statistice moderne. Performanța modelului este remarcabilă, având în vedere că sarcinile respective reprezintă adesea proiecte de mai multe zile pentru experții din domeniul științific.

În mod similar, în cadrul BixBench⁠(se deschide într-o fereastră nouă), un test de performanță conceput pe baza unor scenarii reale din domeniul bioinformaticii și al analizei de date, GPT‑5.5 a înregistrat cele mai bune rezultate dintre modelele ale căror scoruri au fost publicate. Capacitățile științifice ale modelului sunt acum suficient de solide pentru a accelera semnificativ progresul la frontierele cercetării biomedicale, în calitate de adevărat co-cercetător.

Într-un alt exemplu, o versiune internă a GPT‑5.5 cu un cadru personalizat a ajutat la descoperirea unei noi demonstrații⁠(se deschide într-o fereastră nouă) despre numerele Ramsey, unul dintre obiectele centrale din combinatorică. Combinatorica studiază modul în care obiectele discrete se potrivesc între ele: grafice, rețele, mulțimi și modele. Numerele Ramsey se referă, în linii mari, la cât de mare trebuie să fie o rețea înainte ca un anumit tip de ordine să apară garantat. Rezultatele în acest domeniu sunt rare și adesea dificil de obținut din punct de vedere tehnic. Aici, GPT‑5.5 a găsit o demonstrație a unui rezultat asimptotic cunoscut de multă vreme despre numerele Ramsey extradiagonale, verificat ulterior în Lean. Rezultatul este un exemplu concret al modului în care GPT‑5.5 contribuie nu doar cu cod sau explicații, ci și cu un argument matematic surprinzător și util într-un domeniu fundamental de cercetare.

Primii utilizatori au folosit GPT‑5.5 Pro în ChatGPT mai degrabă ca pe un partener de cercetare decât ca pe un simplu motor de răspunsuri: analizând critic manuscrisele în mai multe etape, testând la limită argumentele tehnice, propunând analize și lucrând cu coduri, note și documente PDF. Elementul comun este faptul că GPT‑5.5 este mai eficient în a ajuta cercetătorii să treacă de la întrebare la experiment și apoi la rezultate.

Derya Unutmaz, profesor de imunologie și cercetător la Laboratorul Jackson pentru Medicină Genomică, a folosit GPT‑5.5 Pro pentru a analiza un set de date despre expresia genelor, cu 62 de probe și aproape 28.000 de gene, generând un raport de cercetare detaliat care nu doar a rezumat constatările, ci a scos în evidență întrebări importante și perspective interesante, spunând despre această muncă că i-ar fi luat luni întregi echipei sale.

Bartosz Naskręcki, profesor asistent de matematică la Universitatea Adam Mickiewicz din Poznań, Polonia, a folosit GPT‑5.5 în Codex pentru a crea o aplicație de geometrie algebrică pornind de la o singură solicitare, în doar 11 minute, vizualizând intersecția suprafețelor cuadratice și transformând curba rezultată într-un model Weierstrass.

Ulterior, a extins aplicația cu o vizualizare mai stabilă a singularității și coeficienți exacți care pot fi reutilizați în lucrări ulterioare. Pentru el, schimbarea mai importantă este că Codex poate acum să ajute la implementarea unor fluxuri de lucru personalizate de vizualizare matematică și algebră computerizată, care anterior necesitau instrumente dedicate. Împreună, aceste exemple arată cum GPT‑5.5 transformă intenția experților în instrumente de cercetare și analize funcționale.

Credit: Bartosz Naskręcki⁠(se deschide într-o fereastră nouă)

Solicitare: # Intersecția suprafețelor în geometria algebrică

Creează o aplicație care desenează două suprafețe cuadratice și colorează cu roșu curba de intersecție. Folosiți teorema Riemann-Roch în formă matematică pentru a transforma aceasta într-o curbă Weierstrass.

## Fereastră principală

Două suprafețe colorate, cu o umbrire ușor transparentă și o randare de calitate superioară, se întâlnesc pe o curbă algebrică roșie

Rotire cu mausul în ambele direcții, mecanism complet de apropiere a degetelor pentru mărire, apăsare tactilă pentru afișarea meniului mic cu glisoare pentru modificarea coeficienților fiecărei suprafețe; detectare prin nivelul de tampon de date de adâncime

## Fereastră din partea dreaptă

Ecuația scurtă a lui Weierstrass (pe corpul Q sau pe o extensie a unui corp cuadratic) calculată pe loc folosind formulele efective ale teoremei Riemann-Roch

## Mod ambiental în care toate comenzile sunt ascunse, iar utilizatorul poate admira frumusețea formelor

## Specificații

Aplicația rulează în navigator, este o implementare simplă, bazată pe cele mai noi biblioteci complete, portabilă și gata de implementare

## Documente

Depozit Git, jurnal, plan (fișiere Markdown)

„Este incredibil de energizant să folosim noul model GPT-5.5 de la OpenAI în infrastructura noastră de testare, să îl punem să analizeze seturi masive de date biochimice pentru a prezice rezultatele medicamentelor la oameni, iar apoi să îl vedem obținând îmbunătățiri semnificative ale acurateței la cele mai dificile evaluări ale noastre privind descoperirea de medicamente. Dacă OpenAI continuă în ritmul ăsta, fundamentele descoperirii de medicamente se vor schimba până la sfârșitul anului.”

– Brandon White, cofondator și director executiv al Axiom Bio

Eficiență de inferență de nouă generație

Furnizarea GPT‑5.5 la latența GPT‑5.4 a necesitat regândirea inferenței ca un sistem integrat, nu ca un set de optimizări izolate. GPT‑5.5 a fost proiectat special pentru sistemele NVIDIA GB200 și GB300 NVL72, a fost antrenat pe acestea și a funcționat pe acestea. Codex și GPT‑5.5 au jucat un rol esențial în modul în care ne-am atins obiectivele de performanță. Codex a ajutat echipa să treacă mai repede de la idee la o implementare care să poată fi evaluată, schițând abordări, realizând experimente și contribuind la identificarea optimizărilor care meritau o investiție mai amplă. GPT‑5.5 a contribuit la identificarea și implementarea unor îmbunătățiri esențiale în cadrul sistemului. Pe scurt, modelul a ajutat la îmbunătățirea infrastructurii care îl deservește.

O astfel de îmbunătățire a fost echilibrarea sarcinii și euristicile de partiționare. Înainte de GPT‑5.5, împărțeam cererile pe un accelerator într-un număr fix de fragmente pentru a echilibra sarcina de lucru între nucleele de calcul, asigurând că cererile mari și mici puteau rula pe același procesor. Totuși, un număr prestabilit de fragmente statice nu este optim pentru toate tiparele de trafic. Pentru a utiliza mai bine procesoarele, Codex a analizat tiparele traficului de producție pe parcursul mai multor săptămâni și a scris algoritmi euristici personalizați pentru a partiționa și echilibra optim sarcinile. Efortul a avut un impact semnificativ, crescând vitezele de generare a tokenurilor cu peste 20%.

Îmbunătățirea securității cibernetice pentru siguranța tuturor

Pregătirea lumii pentru modele extrem de eficiente în identificarea și remedierea vulnerabilităților de securitate este o muncă de echipă și va necesita eforturi susținute din partea întregului ecosistem pentru a consolida reziliența, prin democratizarea accesului la modele și implementarea iterativă, în vederea noii ere a apărării cibernetice⁠.

Modelele de vârf devin din ce în ce mai capabile în domeniul securității cibernetice. Aceste capacități vor deveni disponibile pe scară largă și credem că cea mai bună cale de urmat este să ne asigurăm că pot fi folosite pentru a accelera apărarea cibernetică și a consolida ecosistemul.

GPT‑5.5 este un pas incremental, dar important, către o inteligență artificială care poate rezolva unele dintre cele mai dificile provocări ale lumii, precum securitatea cibernetică. Odată cu GPT‑5.2, în decembrie, am implementat proactiv măsurile de protecție cibernetică⁠ necesare pentru a limita potențialul de abuz cibernetic asociat modelelor noastre; acum, odată cu GPT‑5.5, implementăm clasificatori mai stricți pentru riscul cibernetic potențial, pe care unii utilizatori le pot considera inițial deranjante, pe măsură ce le ajustăm în timp.

De ani de zile, am identificat securitatea cibernetică drept o categorie în Cadrul de pregătire⁠(se deschide într-o fereastră nouă), pe măsură ce modelele noastre s-au îmbunătățit treptat, în timp ce dezvoltăm și calibrăm iterativ măsurile de diminuare a riscurilor pentru a putea lansa în mod responsabil modele cu capacități semnificative de securitate cibernetică.

Implementăm măsuri de securitate de vârf în domeniu pentru acest nivel de capacitate cibernetică.Am introdus pentru prima dată măsuri de protecție specifice domeniului cibernetic odată cu GPT‑5.2⁠(se deschide într-o fereastră nouă) anul trecut, pe care am continuat să le testăm, să le optimizăm și să le dezvoltăm mai departe în implementările ulterioare. Pentru GPT‑5.5, am conceput măsuri de control mai stricte pentru activitățile cu risc mai ridicat, solicitările cibernetice sensibile și am implementat măsuri de protecție împotriva utilizării abuzive repetate. Accesul extins este posibil datorită investițiilor noastre în siguranța modelului, utilizării autentificate și monitorizării utilizărilor nepermise. Colaborăm de luni de zile cu experți externi pentru a dezvolta, testa și îmbunătăți în mod iterativ robustețea acestor măsuri de siguranță. Cu GPT‑5.5, ne asigurăm că dezvoltatorii își pot securiza codul cu ușurință, instituind totodată măsuri de control mai stricte asupra fluxurilor de lucru cibernetice care sunt cel mai probabil să fie folosite de actori rău intenționați pentru a provoca daune.
Extindem accesul pentru a accelera apărarea cibernetică la toate nivelurile.Punem la dispoziție modelele noastre cibernetice cu mai puține restricții prin Trusted Access for Cyber⁠, începând cu Codex, care include acces extins la funcțiile avansate de securitate cibernetică ale GPT‑5.5, cu mai puține restricții pentru utilizatorii verificați care îndeplinesc anumite semnale de încredere⁠(se deschide într-o fereastră nouă) la lansare. Organizațiile care sunt responsabile de apărarea infrastructurii critice⁠ pot solicita acces la model permisiv din punct de vedere cibernetic, precum modelul GPT‑5.4‑Cyber, cu condiția să îndeplinească cerințe stricte de securitate pentru a utiliza aceste modele la securizarea sistemelor lor interne. Astfel, o gamă largă de specialiști în securitate verificați beneficiază de instrumente mai performante pentru activități legitime de securitate, cu mai puține obstacole inutile, pentru a asigura democratizarea accesului la capacități defensive importante. Utilizatorii pot solicita acces pe bază de încredere la chatgpt.com/cyber⁠(se deschide într-o fereastră nouă) pentru a reduce refuzurile inutile în timp ce folosesc GPT‑5.5 pentru activități defensive verificate.
Colaborăm cu parteneri guvernamentali pentru a contribui la protejarea infrastructurii critice pentru public. Împreună, explorăm modul în care inteligența artificială avansată poate sprijini activitatea defensivă a oficialilor de încredere responsabili de sistemele pe care oamenii se bazează, de la sistemele digitale care protejează date importante ale contribuabililor până la rețeaua electrică și alimentarea cu apă din comunitățile locale.

Tratăm capacitățile biologice/chimice și de securitate cibernetică ale GPT‑5.5 ca fiind de nivel înalt în Cadrul de pregătire⁠(se deschide într-o fereastră nouă). Deși GPT‑5.5 nu a atins nivelul critic de capacitate în securitate cibernetică, evaluările și testările noastre au arătat că capacitățile sale de securitate cibernetică reprezintă un pas înainte față de GPT‑5.4.

În plus, GPT‑5.5 a trecut prin întregul nostru proces de siguranță și guvernanță înainte de lansare, inclusiv evaluări de pregătire, testare specifică domeniului, noi evaluări specifice pentru capabilități avansate în biologie și securitate cibernetică și teste riguroase cu experți externi. Prezentăm mai multe detalii în fișa de sistem a GPT‑5.5⁠(se deschide într-o fereastră nouă).

Această activitate reflectă abordarea noastră mai amplă privind reziliența inteligenței artificiale, despre care credem că este necesară pe măsură ce funcțiile modelelor avansează. Ne dorim ca o inteligență artificială puternică să fie disponibilă persoanelor care o folosesc pentru a apăra sistemele, instituțiile și publicul. Calea viabilă este accesul pe bază de încredere, măsuri de protecție solide care evoluează odată cu capabilitățile și capacitatea operațională de a detecta și de a răspunde la utilizările abuzive grave.

Disponibilitate și prețuri

În ChatGPT, GPT‑5.5 Thinking este disponibil pentru utilizatorii Plus, Pro, Business și Enterprise. GPT‑5.5 Pro, conceput pentru întrebări și mai dificile și pentru activități care necesită o acuratețe mai mare, este disponibil pentru utilizatorii Pro, Business și Enterprise.

În Codex, GPT‑5.5 este disponibil pentru planurile Plus, Pro, Business, Enterprise, Edu și Go, având o fereastră de context de 400.000. GPT‑5.5 este disponibil și în modul Rapid, generând tokenuri de 1,5x mai rapid, la un cost de 2,5x mai mare.

Pentru dezvoltatorii API, gpt-5.5 va fi disponibil în curând în API-urile Responses și Chat Completions la prețul de 5 $ pe 1 milion de tokenuri de intrare și 30 $ pe 1 milion de tokenuri de ieșire, cu o fereastră de context de 1 milion. Prețurile pentru Batch și Flex sunt disponibile la jumătate din tariful standard al API, în timp ce procesarea prioritară este disponibilă la de 2,5 ori tariful standard. Vom lansa, de asemenea, gpt-5.5-pro în API pentru o acuratețe și mai mare, la prețul de 30 $ pe 1 milion de tokenuri de intrare și 180 $ pe 1 milion de tokenuri de ieșire. Vezi pagina de prețuri⁠ pentru detalii complete.

Deși GPT‑5.5 are un preț mai mare decât GPT‑5.4, este atât mai inteligent, cât și mult mai eficient din punct de vedere al tokenurilor. În Codex, am ajustat cu atenție experiența astfel încât GPT‑5.5 să ofere rezultate mai bune cu mai puține tokenuri decât GPT‑5.4 pentru majoritatea utilizatorilor, continuând în același timp să oferim o utilizare generoasă la toate nivelurile de abonamente.

Evaluări

Programare

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (public) *	58,6%	57,7%	-	-	64,3%	54,2%
Terminal-Bench 2.0	82,7%	75,1%	-	-	69,4%	68,5%
Expert-SWE (intern)	73,1%	68,5%	-	-	-	-

^*^{Laboratoarele au observat}^{dovezi de memorare}⁠(se deschide într-o fereastră nouă)^{în această evaluare}

Profesional

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (wins or ties)	84,9%	83,0%	82,3%	82,0%	80,3%	67,3%
FinanceAgent v1.1	60,0%	56,0%	-	61,5%	64,4%	59,7%
Sarcini de modelare pentru investiții bancare (Intern)	88,5%	87,3%	88,6%	83,6%	-	-
OfficeQA Pro	54,1%	53,2%	-	-	43,6%	18,1%

Utilizarea computerului și viziunea noastră

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld-Verified	78,7%	75,0%	-	-	78,0%	-
MMMU Pro (fără instrumente)	81,2%	81,2%	-	-	-	80,5%
MMMU Pro (cu instrumente)	83,2%	82,1%	-	-	-	-

Utilizarea instrumentelor

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84,4%	82,7%	90,1%	89,3%	79,3%	85,9%
MCP Atlas**	75,3%	70,6%	-	-	79,1%	78,2%
Toolathlon	55,6%	54,6%	-	-	-	48,8%
Tau2-bench Telecom*** (solicitări originale)	98,0%	92,8%	-	-	-	-

^{** MCP Atlas: rezultate de la Scale AI după cea mai recentă actualizare din aprilie 2026.
*** Tau2-bench Telecom: rezultate pentru 5.5 și 5.4 cu solicitările originale, adică fără ajustarea solicitărilor. Aceasta omite rezultatele din alte laboratoare care au fost evaluate cu ajustări ale solicitărilor.}

Academic

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25,0%	19,0%	33,2%	25,6%	-	-
FrontierMath Nivelurile 1–3	51,7%	47,6%	52,4%	50,0%	43,8%	36,9%
FrontierMath Nivelul 4	35,4%	27,1%	39,6%	38,0%	22,9%	16,7%
BixBench	80,5%	74,0%	-	-	-	-
GPQA Diamond	93,6%	92,8%	-	94,4%	94,2%	94,3%
Humanity's Last Exam (fără instrumente)	41,4%	39,8%	43,1%	42,7%	46,9%	44,4%
Humanity's Last Exam (cu instrumente)	52,2%	52,1%	57,2%	58,7%	54,7%	51,4%

Securitate cibernetică

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Sarcini de provocări tip capturează steagul (intern)****	88,1%	83,7%	-	-	-	-
CyberGym	81,8%	79,0%	-	-	73,1%	-

^{**** O extindere a celor mai dificile CTF-uri folosite în fișele de sistem, cu provocări suplimentare dificile.}

Context lung

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73,7%	62,5%	-	-	76,9%	-
Graphwalks BFS 1mil f1	45,4%	9,4%	-	-	41,2% (Opus 4.6)	-
Graphwalks parents 256k f1	90,1%	82,8%	-	-	93,6%	-
Graphwalks parents 1mil f1	58,5%	44,4%	-	-	72,0% (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98,1%	97,3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93,0%	91,4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96,5%	97,2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90,0%	90,5%	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83,1%	86,0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87,5%	79,3%	-	-	59,2%	-
OpenAI MRCR v2 8-needle 256K-512K	81,5%	57,5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74,0%	36,6%	-	-	32,2%	-

Raționament abstract

Evaluare	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (Verified)	95,0%	93,7%	-	94,5%	93,5%	98,0%
ARC-AGI-2 (Verified)	85,0%	73,3%	-	83,3%	75,8%	77,1%

Evaluările GPT au fost rulate cu efortul de raționament stabilit la xhigh și au fost efectuate într-un mediu de cercetare, care poate oferi rezultate ușor diferite față de versiunea ChatGPT de producție în unele cazuri.