Aġġornament tal-24 ta’ April, 2026: GPT‑5.5 u GPT‑5.5 Pro issa huma disponibbli fl-API. Il-kard tas-sistema ġiet aġġornata wkoll biex tiddeskrivi s-salvagwardji addizzjonali li japplikaw.
Qed inħallu GPT‑5.5, l-aktar mudell intelliġenti u intuwittiv tagħna s’issa, u l-pass li jmiss lejn mod ġdid kif isir ix-xogħol fuq kompjuter.
GPT‑5.5 jifhem aktar malajr x’int qed tipprova tagħmel u jista’ jwettaq aktar mix-xogħol waħdu. Huwa eċċellenti fil-kitba u d-debugging tal-kodiċi, fir-riċerka online, fl-analiżi tad-data, fil-ħolqien ta’ dokumenti u spreadsheets, fl-operat ta’ software, u fil-mixi bejn għodod sakemm kompitu jitlesta. Minflok timmaniġġja bir-reqqa kull pass, tista’ tagħti lil GPT‑5.5 kompitu imħawwad u b’ħafna partijiet u tafdah jippjana, juża l-għodod, jiċċekkja x-xogħol tiegħu, jinnaviga l-ambigwità, u jkompli.
Il-qabżiet huma partikolarment b’saħħithom fil-coding aġentiku, fl-użu tal-kompjuter, fix-xogħol tal-għarfien, u fir-riċerka xjentifika bikrija—oqsma fejn il-progress jiddependi fuq raġunament fuq il-kuntest u fuq teħid ta’ azzjoni tul iż-żmien. GPT‑5.5 jagħti dan il-pass ’il fuq fl-intelliġenza mingħajr ma jikkomprometti l-veloċità: mudelli akbar u aktar kapaċi spiss ikunu aktar bil-mod biex jinqdew, iżda GPT‑5.5 jaqbel mal-latency għal kull token ta’ GPT‑5.4 fis-servizz tad-dinja reali, filwaqt li jwettaq f’livell ferm ogħla ta’ intelliġenza. Juża wkoll ferm inqas tokens biex itemm l-istess kompiti ta’ Codex, u b’hekk huwa aktar effiċjenti kif ukoll aktar kapaċi.
Qed inħallu GPT‑5.5 bl-aktar sett b’saħħtu ta’ salvagwardji tagħna sal-lum, iddisinjati biex inaqqsu l-użu ħażin filwaqt li jżommu l-aċċess għal xogħol ta’ benefiċċju. Ivvalutajna dan il-mudell fuq is-suite kollha tagħna ta’ oqfsa ta’ sikurezza u tħejjija, ħdimna ma’ redteamers interni u esterni, żidna testijiet immirati għal kapaċitajiet avvanzati taċ-ċibersigurtà u tal-bijoloġija, u ġbarna feedback fuq każijiet ta’ użu reali minn kważi 200 sieħeb ta’ aċċess bikri fdati qabel ir-rilaxx.
Illum, GPT‑5.5 qed jibda jitqassam lill-utenti Plus, Pro, Business, u Enterprise f’ChatGPT u Codex, u GPT‑5.5 Pro qed jibda jitqassam lill-utenti Pro, Business, u Enterprise f’ChatGPT. Id-distribuzzjonijiet tal-API jeħtieġu salvagwardji differenti u qed naħdmu mill-qrib ma’ sħab u klijenti fuq ir-rekwiżiti ta’ sikurezza u sigurtà biex dan jinqeda fuq skala kbira. Se nġibu GPT‑5.5 u GPT‑5.5 Pro fl-API dalwaqt ħafna.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
Expert-SWE (Intern) | 73.1% | 68.5% | - | - | - | - |
GDPval (rebħiet jew draws) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
OSWorld-Verified | 78.7% | 75.0% | - | - | 78.0% | - |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
FrontierMath Livell 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath Livell 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
OpenAI qed tibni l-infrastruttura globali għal AI aġentika, u tagħmilha possibbli għal nies u negozji madwar id-dinja li jwettqu xogħol bl-AI. Matul is-sena li għaddiet, rajna lill-AI tħaffef b’mod drammatiku l-inġinerija tas-software. B’GPT‑5.5 f’Codex u ChatGPT, dik l-istess trasformazzjoni qed tibda testendi ruħha għar-riċerka xjentifika u għax-xogħol usa’ li n-nies jagħmlu fuq il-kompjuters.
F’dawn id-dominji kollha, GPT‑5.5 mhux biss aktar intelliġenti; huwa wkoll aktar effiċjenti fil-mod kif jaħdem il-problemi, u ħafna drabi jilħaq outputs ta’ kwalità ogħla b’inqas tokens u b’inqas tentattivi mill-ġdid. Fuq il-Coding Index ta’ Artificial Analysis, GPT‑5.5 jagħti intelliġenza state-of-the-art b’nofs l-ispiża ta’ mudelli ta’ coding tal-fruntiera kompetittivi.
L-Indiċi tal-Intelliġenza ta’ Artificial Analysis(jinfetaħ f’tieqa ġdida) huwa medja peżata ta’ 10 evals immexxija minn parti esterna: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 huwa l-aktar mudell tagħna b’saħħtu ta’ coding aġentiku sal-lum. Fuq Terminal-Bench 2.0, li jittestja flussi ta’ xogħol kumplessi tal-command line li jeħtieġu ppjanar, iterazzjoni, u koordinazzjoni ta’ għodod, jilħaq preċiżjoni state-of-the-art ta’ 82.7%. Fuq SWE-Bench Pro, li jevalwa s-soluzzjoni ta’ issues reali ta’ GitHub, jilħaq 58.6%, u jsolvi aktar kompiti end-to-end f’pass wieħed minn mudelli preċedenti. Fuq Expert-SWE, l-eval intern tagħna tal-fruntiera għal kompiti ta’ coding fit-tul b’ħin medjan stmat ta’ tlestija umana ta’ 20 siegħa, GPT‑5.5 ukoll jegħleb lil GPT‑5.4.
Fit-tliet evals kollha, GPT‑5.5 itejjeb il-punteġġi ta’ GPT‑5.4 waqt li juża inqas tokens.
Is-saħħiet tal-mudell fil-coding jidhru b’mod speċjali f’Codex fejn jista’ jieħu fuqu xogħol ta’ inġinerija li jvarja minn implimentazzjoni u refactors sa debugging, testing, u validazzjoni. Testijiet bikrin jissuġġerixxu li GPT‑5.5 huwa aħjar fl-imġibiet li jiddependi fuqhom xogħol inġineristiku reali, bħal iż-żamma tal-kuntest f’sistemi kbar, ir-raġunament fuq fallimenti ambigwi, il-verifika tal-assunzjonijiet b’għodod, u t-twettiq tal-bidliet fil-codebase ta’ madwarhom.
It-trajettorja rrendurjata tuża dejta vettorjali NASA/JPL Horizons għal Orion, il-Qamar u x-Xemx, bi skalar tal-wiri applikat għal qari aħjar.
Prompt: [immaġni mehmuża] Implimenta dan bħala app ġdida billi tuża webgl u vite b’dejta reali mill-missjoni Artemis II. Kun żgur li tittestja l-app bir-reqqa sakemm tkun kompletament funzjonali u tidher bħall-app fl-istampa. Oqgħod attent ħafna għar-rappreżentazzjoni tal-pjaneti u l-mogħdijiet tat-titjira. Irrid inkun nista’ ninteraġixxi mar-rendering 3D. Żgura li jkollha mekkanika orbitali realistika.
Apparti l-benchmarks, testers bikrin qalu li GPT‑5.5 juri abilità aktar b’saħħitha li jifhem il-forma ta’ sistema: għaliex xi ħaġa qed tfalli, fejn trid tinżel is-soluzzjoni, u x’iktar fil-codebase jkun affettwat.

“L-ewwel mudell ta’ kodifikazzjoni li użajt li għandu ċarezza kunċettwali serja.”
Dan Shipper, Fundatur u CEO ta’ Every, iddeskriva GPT‑5.5 bħala “l-ewwel mudell ta’ kodifikazzjoni li użajt li għandu ċarezza kunċettwali serja.”
Wara li nieda app, qatta’ jiem jagħmel debugging ta’ problema wara t-tnedija qabel ma daħħal wieħed mill-aqwa inġiniera tiegħu biex jerġa’ jikteb parti mis-sistema. Biex jittestja GPT‑5.5, effettivament reġa’ dawwar l-arloġġ lura: seta’ l-mudell iħares lejn l-istat miksur u jipproduċi l-istess tip ta’ kitba mill-ġdid li fuqha l-inġinier eventwalment iddeċieda? GPT‑5.4 ma setax. GPT‑5.5 seta’.

“Onestament inħossni bħallikieku qed naħdem ma’ intelliġenza ogħla, u kważi hemm sens ta’ rispett.”
Pietro Schirano, CEO ta’ MagicPath, ra bidla pass pass simili meta GPT‑5.5 għaqqad branch b’mijiet ta’ bidliet fil-frontend u refactor ma’ main branch li kienet ukoll inbidlet sostanzjalment, u solva x-xogħol f’daqqa waħda f’madwar 20 minuta.
Inġiniera anzjani li ttestjaw il-mudell qalu li GPT‑5.5 kien notevolment aktar b’saħħtu minn GPT‑5.4 u Claude Opus 4.7 fir-raġunament u fl-awtonomija, billi jaqbad kwistjonijiet minn qabel u jbassar il-ħtiġijiet tal-ittestjar u r-reviżjoni mingħajr prompt espliċitu. F’każ wieħed, inġinier talbu jerġa’ jiddisinja l-arkitettura ta’ sistema ta’ kummenti f’editur kollaborattiv tal-markdown u meta rritorna sab stack ta’ 12-il diff kważi komplut. Oħrajn qalu li kellhom bżonn sorprendentement ftit korrezzjoni fl-implimentazzjoni u ħassewhom aktar kunfidenti fil-pjanijiet ta’ GPT‑5.5 meta mqabbel ma’ GPT‑5.4.
Inġinier wieħed ta’ NVIDIA li kellu aċċess bikri għall-mudell wasal sa qal: “Li nitlef l-aċċess għal GPT‑5.5 inħossu qisu qatgħuli parti minn ġismi.”
“GPT-5.5 huwa notevolment aktar intelliġenti u aktar persistenti minn GPT-5.4, b’prestazzjoni ta’ kodifikazzjoni aktar qawwija u użu tal-għodod aktar affidabbli. Jibqa’ fuq il-kompitu għal ħafna aktar żmien mingħajr ma jieqaf kmieni, li huwa l-aktar importanti għax-xogħol kumpless u fit-tul li l-utenti tagħna jiddelegaw lil Cursor.”
L-istess saħħiet li jagħmlu lil GPT‑5.5 eċċellenti għall-coding jagħmluh ukoll qawwi għax-xogħol ta’ kuljum fuq kompjuter. Minħabba li l-mudell huwa aħjar biex jifhem l-intenzjoni, jista’ jimxi b’mod aktar naturali tul iċ-ċiklu sħiħ tax-xogħol tal-għarfien: isib informazzjoni, jifhem x’inhu importanti, juża l-għodod, jiċċekkja l-output, u jibdel materjal mhux maħdum f’xi ħaġa utli.
F’Codex, GPT‑5.5 huwa aħjar minn GPT‑5.4 fil-ġenerazzjoni ta’ dokumenti, spreadsheets, u preżentazzjonijiet bi slides. Alpha testers qalu li qabeż mudelli tal-passat f’xogħol bħal riċerka operazzjonali, mudellar ta’ spreadsheets, u fil-bdil ta’ inputs tan-negozju imħawda fi pjanijiet. Meta kkombinat mal-ħiliet ta’ Codex fl-użu tal-kompjuter, GPT‑5.5 iqarribna aktar lejn is-sensazzjoni li l-mudell jista’ verament juża l-kompjuter miegħek: jara x’hemm fuq l-iskrin, jikklikkja, jikteb, jinnaviga interfaces, u jimxi bejn għodod bi preċiżjoni.
It-timijiet f’OpenAI diġà qed jużaw dawn is-saħħiet fi flussi ta’ xogħol reali. Illum, aktar minn 85% tal-kumpanija tuża Codex kull ġimgħa f’funzjonijiet li jinkludu l-inġinerija tas-software, il-finanzi, il-komunikazzjonijiet, il-marketing, ix-xjenza tad-data, u l-ġestjoni tal-prodott. F’Comms, it-tim uża GPT‑5.5 f’Codex biex janalizza sitt xhur ta’ data ta’ talbiet għal taħditiet, jibni qafas ta’ punteġġ u riskju, u jivvalida aġent awtomatizzat ta’ Slack biex talbiet ta’ riskju baxx ikunu jistgħu jiġu ttrattati awtomatikament filwaqt li talbiet ta’ riskju ogħla xorta jintbagħtu għal reviżjoni umana. Fil-Finanzi, it-tim uża Codex biex jirrevedi 24,771 formola tat-taxxa K-1 li b’kollox kellhom 71,637 paġna, billi uża fluss ta’ xogħol li eskluda informazzjoni personali u għen lit-tim iħaffef il-kompitu b’ġimagħtejn meta mqabbel mas-sena ta’ qabel. Fit-tim Go-to-Market, impjegat awtomatizza l-ġenerazzjoni ta’ rapporti tan-negozju ta’ kull ġimgħa, u ffranka 5-10 sigħat fil-ġimgħa.
F’ChatGPT, GPT‑5.5 Thinking jiftaħ għajnuna aktar rapida għal problemi aktar diffiċli, b’tweġibiet aktar intelliġenti u aktar konċiżi biex jgħinuk timxi fix-xogħol kumpless b’mod aktar effiċjenti. Huwa eċċellenti f’xogħol professjonali bħall-coding, ir-riċerka, is-sinteżi u l-analiżi tal-informazzjoni, u kompiti tqal fid-dokumenti, speċjalment meta juża plugins.
F’GPT‑5.5 Pro, testers bikrin qed jaraw pass ’il fuq sinifikanti kemm fid-diffikultà kif ukoll fil-kwalità tax-xogħol li ChatGPT jista’ jieħu fuqu, b’titjib fil-latency li jagħmlu dan ferm aktar prattiku għal kompiti impenjattivi. Meta mqabbel ma’ GPT‑5.4 Pro, it-testers sabu li t-tweġibiet ta’ GPT‑5.5 Pro kienu ferm aktar komprensivi, strutturati tajjeb, preċiżi, rilevanti, u utli, b’prestazzjoni partikolarment b’saħħitha fin-negozju, fil-liġi, fl-edukazzjoni, u fix-xjenza tad-data.
GPT‑5.5 jilħaq prestazzjoni state-of-the-art fuq diversi benchmarks li jirriflettu dan it-tip ta’ xogħol. Fuq GDPval, li jittestja l-kapaċitajiet tal-aġenti li jipproduċu xogħol tal-għarfien speċifikat tajjeb f’44 okkupazzjoni, GPT‑5.5 jikseb 84.9%. Fuq OSWorld-Verified, li jkejjel jekk mudell jistax iħaddem ambjenti reali tal-kompjuter waħdu, jilħaq 78.7%. U fuq Tau2-bench Telecom, li jittestja flussi ta’ xogħol kumplessi tas-servizz tal-klijent, jilħaq 98.0% mingħajr prompt tuning. GPT‑5.5 ukoll jagħti prestazzjoni b’saħħitha fuq benchmarks oħra tax-xogħol tal-għarfien: 60.0% fuq FinanceAgent, 88.5% fuq kompiti interni ta’ mudellar tal-investment banking, u 54.1% fuq OfficeQA Pro.
Tau2-bench Telecom tħaddem mingħajr prompt tuning (u b’GPT‑4.1 bħala mudell tal-utent). GPT‑5.5 jifhem aħjar l-intenzjoni tal-kompitu u huwa aktar effiċjenti fit-tokens mill-predeċessuri tiegħu.
“GPT-5.5 jagħti l-prestazzjoni sostnuta meħtieġa għal xogħol tqil fl-eżekuzzjoni. Mibni u servut fuq sistemi NVIDIA GB200 NVL72, il-mudell jippermetti lit-timijiet tagħna jwasslu features end-to-end minn prompts bil-lingwa naturali, inaqqsu l-ħin tad-debug minn jiem għal sigħat, u jbiddlu ġimgħat ta’ esperimentazzjoni fi progress matul il-lejl f’codebases kumplessi. Huwa aktar minn kodifikazzjoni aktar mgħaġġla—huwa mod ġdid ta’ kif taħdem li jgħin lin-nies joperaw b’veloċità fundamentalment differenti.”
GPT‑5.5 juri wkoll titjib fuq flussi ta’ xogħol ta’ riċerka xjentifika u teknika, li jeħtieġu aktar milli sempliċement twieġeb mistoqsija diffiċli. Ir-riċerkaturi għandhom bżonn jesploraw idea, jiġbru evidenza, jittestjaw assunzjonijiet, jinterpretaw ir-riżultati, u jiddeċiedu x’għandhom jippruvaw wara. GPT‑5.5 huwa aħjar minn mudelli oħra biex jippersisti tul dan iċ-ċiklu.
B’mod notevoli, GPT‑5.5 juri titjib ċar fuq GPT‑5.4 fuq GeneBench(jinfetaħ f’tieqa ġdida), eval ġdid iffukat fuq analiżi xjentifika tad-data f’diversi stadji fil-ġenetika u fil-bijoloġija kwantitattiva. Dawn il-problemi jeħtieġu li l-mudelli jirraġunaw fuq data potenzjalment ambigwa jew żbaljata b’gwida superviżorja minima, jindirizzaw ostakli realistiċi bħal confounders moħbija jew fallimenti tal-QC, u jimplimentaw u jinterpretaw b’mod korrett metodi statistiċi moderni. Il-prestazzjoni tal-mudell hija impressjonanti fid-dawl tal-fatt li l-kompiti hawn spiss jikkorrispondu għal proġetti ta’ diversi jiem għal esperti xjentifiċi.
Bl-istess mod, fuq BixBench(jinfetaħ f’tieqa ġdida), benchmark iddisinjat madwar bijoinformatika u analiżi tad-data tad-dinja reali, GPT‑5.5 kiseb prestazzjoni ta’ quddiem fost mudelli b’punteġġi ppubblikati. Il-kapaċitajiet xjentifiċi tal-mudell issa huma b’saħħithom biżżejjed biex iħaffu b’mod sinifikanti l-progress fil-fruntieri tar-riċerka bijomedika bħala ko-xjenzjat ġenwin.
F’eżempju ieħor, verżjoni interna ta’ GPT‑5.5 b’harness personalizzat għenet biex tiskopri prova ġdida(jinfetaħ f’tieqa ġdida) dwar in-numri ta’ Ramsey, wieħed mill-oġġetti ċentrali fil-kombinatorika. Il-kombinatorika tistudja kif oġġetti diskreti joqogħdu flimkien: graffs, netwerks, settijiet, u mudelli. In-numri ta’ Ramsey jistaqsu, bejn wieħed u ieħor, kemm netwerk irid ikun kbir qabel ma xi tip ta’ ordni jkun garantit li jidher. Riżultati f’dan il-qasam huma rari u spiss teknikament diffiċli. Hawnhekk, GPT‑5.5 sab prova ta’ fatt asintotiku li ilu magħruf dwar in-numri ta’ Ramsey off-diagonal, li aktar tard ġiet ivverifikata f’Lean. Ir-riżultat huwa eżempju konkret ta’ GPT‑5.5 li jikkontribwixxi mhux biss kodiċi jew spjegazzjoni, iżda argument matematiku sorprendenti u utli f’qasam ewlieni tar-riċerka.
Testers bikrin użaw GPT‑5.5 Pro f’ChatGPT inqas bħal magna ta’ tweġibiet one-shot u aktar bħal sieħeb fir-riċerka: jikkritika manuskritti fuq diversi passaggi, jittestja l-qawwa ta’ argumenti tekniċi, jipproponi analiżijiet, u jaħdem ma’ kodiċi, noti, u kuntest minn PDFs. Il-ħajta komuni hija li GPT‑5.5 huwa aħjar biex jgħin lir-riċerkaturi jimxu minn mistoqsija għal esperiment għal output.
Derya Unutmaz, professur u riċerkatur tal-immunoloġija fil-Jackson Laboratory for Genomic Medicine, uża GPT‑5.5 Pro biex janalizza dataset ta’ espressjoni tal-ġeni b’62 kampjun u kważi 28,000 ġene, u pproduċa rapport ta’ riċerka dettaljat li mhux biss ġabar fil-qosor is-sejbiet iżda wkoll ħareġ mistoqsijiet u insights ewlenin—xogħol li qal li kien jieħu lit-tim tiegħu xhur.
Bartosz Naskręcki, assistant professor tal-matematika fl-Università Adam Mickiewicz f’Poznań, il-Polonja, uża GPT‑5.5 f’Codex biex jibni app ta’ ġeometrija alġebrika minn prompt wieħed fi 11-il minuta, li viżwalizzat l-intersezzjoni ta’ superfiċji kwadratiċi u kkonvertiet il-kurva li tirriżulta f’mudell ta’ Weierstrass.
Iktar tard estenda l-app b’viżwalizzazzjoni aktar stabbli tas-singolarità u koeffiċjenti eżatti li jistgħu jerġgħu jintużaw f’xogħol ieħor. Għalih, il-bidla akbar hija li Codex issa jista’ jgħin fl-implimentazzjoni ta’ workflows personalizzati ta’ viżwalizzazzjoni matematika u alġebra tal-kompjuter li qabel kienu jeħtieġu għodod dedikati. Flimkien, dawn l-eżempji juru GPT‑5.5 ibiddel l-intenzjoni tal-espert f’għodod ta’ riċerka u analiżijiet li jaħdmu.

Kreditu: Bartosz Naskręcki(jinfetaħ f’tieqa ġdida)
Prompt: # Intersezzjoni ta’ superfiċji fil-ġeometrija alġebrika
Agħmel app li tiġbed żewġ superfiċji kwadratiċi u tikkolora bl-aħmar il-kurva tal-intersezzjoni. Uża t-teorema komputazzjonali ta’ Riemann-Roch biex tikkonverti dan f’kurva ta’ Weierstrass.
## Tieqa prinċipali
Żewġ superfiċji b’kulur ħafif u shading kemxejn trasparenti, rendering ta’ kwalità għolja li jinterseka tul kurva alġebrika ta’ kulur aħmar
Rotazzjoni bil-maws fiż-żewġ direzzjonijiet, mekkaniżmu sħiħ ta’ pinch għaż-zoom, pressjoni haptic biex jintwera l-menu żgħir bis-sliders għall-bidla tal-koeffiċjenti ta’ kull superfiċje; rilevament permezz tal-livell ta’ Z-buffor
## Tieqa tal-ġenb tal-lemin
Ekwazzjoni qasira ta’ Weierstrass (fuq Q jew estensjoni ta’ kamp kwadratiku) ikkalkulata fuq il-post permezz tal-formuli effettivi tat-teorema ta’ Riemann-Roch
## Modalità ambient fejn il-kontrolli kollha jkunu moħbija u l-utent jista’ jammira s-sbuħija tal-forom
## Specs
L-app taħdem fil-browser, implimentazzjoni ħafifa bl-aktar libreriji ġodda full stack, portabbli, tista’ tiġi deployjata
## Docs
Git repo, ġurnal, pjan (fajls Markdown)
“Huwa tassew enerġizzanti li nużaw il-mudell il-ġdid GPT-5.5 ta’ OpenAI fil-harness tagħna, inħalluh jagħmel raġunament fuq datasets bijokimiċi enormi biex ibassar ir-riżultati tal-mediċini fil-bnedmin, u mbagħad narawh iwassal għal żidiet sinifikanti fl-eżattezza fuq l-aktar evalwazzjonijiet diffiċli tagħna għall-iskoperta tal-mediċini. Jekk OpenAI tkompli taħdem hekk, il-pedamenti tal-iskoperta tal-mediċini se jinbidlu sal-aħħar tas-sena.”
Li nqdu GPT‑5.5 bil-latency ta’ GPT‑5.4 kien jeħtieġ li nerġgħu naħsbu l-inferenza bħala sistema integrata, mhux bħala sett ta’ ottimizzazzjonijiet iżolati. GPT‑5.5 ġie ko-disinjat għal, imħarreġ ma’, u mqassam fuq sistemi NVIDIA GB200 u GB300 NVL72. Codex u GPT‑5.5 kienu strumentali għal kif ksibna l-miri tal-prestazzjoni tagħna. Codex għen lit-tim jimxi aktar malajr mill-idea għal implimentazzjoni li tista’ titkejjel fuq benchmark, billi abbozza approċċi, qabbad esperimenti, u għen jidentifika liema ottimizzazzjonijiet kienu jiswew investiment aktar profond. GPT‑5.5 għen biex jinstabu u jiġu implimentati titjibiet ewlenin fil-munzell innifsu. Fi kliem sempliċi, il-mudell għen biex itejjeb l-infrastruttura li taqdih.
Waħda minn dawn it-titjibiet kienet heuristics tal-load balancing u tal-partitioning. Qabel GPT‑5.5, konna naqsmu t-talbiet fuq aċċeleratur f’numru fiss ta’ biċċiet biex nibbilanċjaw ix-xogħol bejn il-cores tal-komputazzjoni, u b’hekk niżguraw li talbiet kbar u żgħar ikunu jistgħu jimxu fuq l-istess GPU. Madankollu, numru predeterminat ta’ biċċiet statiċi mhuwiex ottimali għall-forom kollha tat-traffiku. Biex nużaw aħjar il-GPUs, Codex analizza xejriet tat-traffiku tal-produzzjoni li jkopru ġimgħat u kiteb algoritmi heuristiċi personalizzati biex jaqsam u jibbilanċja x-xogħol bl-aħjar mod. Dan l-isforz kellu impatt sproporzjonat, u żied il-veloċitajiet tal-ġenerazzjoni tat-tokens b’aktar minn 20%.
It-tħejjija tad-dinja għal mudelli li huma tajbin ħafna biex isibu u jġibu garżi għal vulnerabbiltajiet tas-sigurtà hija sport tat-tim u se teħtieġ li l-ekosistema kollha taħdem bis-sħiħ biex tibni reżiljenza, b’aċċess demokratizzat għall-mudelli u distribuzzjoni iterattiva għall-era li jmiss tad-difiża ċibernetika.
Mudelli tal-fruntiera qed isiru dejjem aktar kapaċi fiċ-ċibersigurtà. Dawn il-kapaċitajiet se jsiru mifruxa b’mod wiesa’ u aħna nemmnu li l-aħjar triq ’il quddiem hija li niżguraw li jistgħu jintużaw biex jitħaffef id-difiża ċibernetika u jissaħħaħ l-ekosistema.
GPT‑5.5 huwa pass inkrementali iżda importanti lejn AI li tista’ ssolvi wħud mill-aktar sfidi iebsa tad-dinja bħaċ-ċibersigurtà. B’GPT‑5.2 f’Diċembru, qsamna b’mod proattiv is-salvagwardji ċibernetiċi meħtieġa biex nillimitaw l-abbuż ċibernetiku potenzjali bil-mudelli tagħna; issa b’GPT‑5.5, qed nużaw klassifikaturi aktar stretti għal riskju ċibernetiku potenzjali li xi utenti jistgħu jsibuhom tedjanti għall-bidu, hekk kif nirranġawhom maż-żmien.
Ilna snin nidentifikaw iċ-ċibersigurtà bħala kategorija fil-Qafas tat-Tħejjija(jinfetaħ f’tieqa ġdida) tagħna hekk kif il-mudelli tagħna tjiebu b’mod inkrementali, waqt li niżviluppaw u nikkalibraw il-mitigazzjonijiet b’mod iterattiv, sabiex inkunu nistgħu nirrilaxxaw b’mod responsabbli mudelli b’kapaċitajiet sinifikanti taċ-ċibersigurtà.
- Qed nużaw salvagwardji ta’ quddiem nett tal-industrija għal dan il-livell ta’ kapaċità ċibernetika. L-ewwel daħħalna salvagwardji speċifiċi għaċ-ċiber b’GPT‑5.2(jinfetaħ f’tieqa ġdida) is-sena l-oħra, li komplejna nittestjaw, nirfinaw, u nibnu fuqhom f’distribuzzjonijiet sussegwenti. Għal GPT‑5.5, iddisinjajna kontrolli aktar stretti madwar attività ta’ riskju ogħla, talbiet ċibernetiċi sensittivi, u żidna protezzjonijiet għal użu ħażin ripetut. L-aċċess wiesa’ huwa possibbli permezz tal-investimenti tagħna fis-sikurezza tal-mudell, fl-użu awtentikat, u fil-monitoraġġ ta’ użu mhux permess. Ilna xhur naħdmu ma’ esperti esterni biex niżviluppaw, nittestjaw u niteraw fuq ir-robustezza ta’ dawn is-salvagwardji. B’GPT‑5.5, qed niżguraw li l-iżviluppaturi jkunu jistgħu jiżguraw il-kodiċi tagħhom b’faċilità, filwaqt li nqiegħdu kontrolli aktar b’saħħithom madwar il-flussi ta’ xogħol ċibernetiċi l-aktar probabbli li jikkawżaw ħsara minn atturi malizzjużi.
- Qed nespandu l-aċċess biex inħaffu d-difiża ċibernetika f’kull livell. Qed nagħmlu l-mudelli permissivi għaċ-ċiber tagħna disponibbli permezz ta’ Trusted Access for Cyber, nibdew b’Codex, li jinkludi aċċess estiż għall-kapaċitajiet avvanzati taċ-ċibersigurtà ta’ GPT‑5.5 b’inqas restrizzjonijiet għal utenti verifikati li jilħqu ċerti sinjali ta’ fiduċja(jinfetaħ f’tieqa ġdida) mat-tnedija. Organizzazzjonijiet li huma responsabbli għad-difiża ta’ infrastruttura kritika jistgħu japplikaw biex jaċċessaw mudelli permissivi għaċ-ċiber bħal GPT‑5.4‑Cyber, filwaqt li jilħqu rekwiżiti stretti ta’ sigurtà biex jużaw dawn il-mudelli għas-sigurtà tas-sistemi interni tagħhom. Dan jagħti lil firxa wiesgħa ta’ difensuri verifikati għodod aktar kapaċi għal xogħol leġittimu ta’ sigurtà b’inqas frizzjoni mhux meħtieġa sabiex niżguraw li niddemokratizzaw l-aċċess għal kapaċitajiet difensivi importanti. L-utenti jistgħu japplikaw għal trusted access fuq chatgpt.com/cyber(jinfetaħ f’tieqa ġdida) biex inaqqsu rifjuti mhux meħtieġa waqt li jużaw GPT‑5.5 għal xogħol difensiv ivverifikat.
- Qed naħdmu ma’ sħab governattivi biex ngħinu nipproteġu infrastruttura kritika għall-pubbliku. Flimkien, qed nesploraw kif AI avvanzata tista’ tappoġġa x-xogħol difensiv ta’ uffiċjali fdati responsabbli għal sistemi li n-nies jiddependu fuqhom, mis-sistemi diġitali li jiżguraw data importanti ta’ min iħallas it-taxxa sal-grid tal-elettriku u l-provvisti tal-ilma fil-komunitajiet lokali.
Qed nittrattaw il-kapaċitajiet bijoloġiċi/kimiki u taċ-ċibersigurtà ta’ GPT‑5.5 bħala High taħt il-Qafas tat-Tħejjija(jinfetaħ f’tieqa ġdida) tagħna. Filwaqt li GPT‑5.5 ma laħaqx il-livell ta’ kapaċità ċibernetika Critical, l-evalwazzjonijiet u t-testijiet tagħna wrew li l-kapaċitajiet taċ-ċibersigurtà tiegħu huma pass ’il fuq meta mqabbla ma’ GPT‑5.4.
Barra minn hekk, GPT‑5.5 għadda mill-proċess sħiħ tagħna ta’ sikurezza u governanza qabel ir-rilaxx, inklużi evalwazzjonijiet ta’ tħejjija, testijiet speċifiċi għad-dominju, evalwazzjonijiet immirati ġodda għal kapaċitajiet avvanzati tal-bijoloġija u taċ-ċibersigurtà, u testijiet robusti ma’ esperti esterni. Naqsmu aktar dettalji fil-kard tas-sistema(jinfetaħ f’tieqa ġdida) ta’ GPT‑5.5.
Dan ix-xogħol jirrifletti l-approċċ usa’ tagħna għar-reżiljenza tal-AI, li nemmnu li hu meħtieġ hekk kif il-kapaċitajiet tal-mudelli javvanzaw. Irridu li AI qawwija tkun disponibbli għan-nies li qed jużawha biex jiddefendu sistemi, istituzzjonijiet, u lill-pubbliku. It-triq vijabbli hija aċċess fdat, salvagwardji robusti li jiskalaw mal-kapaċità, u kapaċità operattiva biex tiskopri u tirrispondi għal użu ħażin serju.
Illum, GPT‑5.5 qed jibda jitqassam lill-utenti Plus, Pro, Business, u Enterprise f’ChatGPT u Codex, u GPT‑5.5 Pro qed jibda jitqassam lill-utenti Pro, Business, u Enterprise f’ChatGPT. Se nġibu GPT‑5.5 u GPT‑5.5 Pro fl-API dalwaqt ħafna.
F’ChatGPT, GPT‑5.5 Thinking huwa disponibbli għall-utenti Plus, Pro, Business, u Enterprise. GPT‑5.5 Pro, iddisinjat għal mistoqsijiet saħansitra aktar diffiċli u xogħol ta’ preċiżjoni ogħla, huwa disponibbli għall-utenti Pro, Business, u Enterprise.
F’Codex, GPT‑5.5 huwa disponibbli għall-pjanijiet Plus, Pro, Business, Enterprise, Edu, u Go b’tieqa ta’ kuntest ta’ 400K. GPT‑5.5 huwa disponibbli wkoll fil-modalità Fast, li tiġġenera tokens 1.5x aktar malajr għal 2.5x l-ispiża.
Għall-iżviluppaturi tal-API, gpt-5.5 dalwaqt se jkun disponibbli fil-Responses API u l-API tat-tlestija taċ-chats bi prezz ta’ $5 għal kull 1M input tokens u $30 għal kull 1M output tokens, b’tieqa ta’ kuntest ta’ 1M. Il-prezzijiet Batch u Flex huma disponibbli b’nofs ir-rata standard tal-API, filwaqt li l-ipproċessar Priority huwa disponibbli b’2.5x ir-rata standard. Se nirrilaxxaw ukoll gpt-5.5-pro fl-API għal preċiżjoni saħansitra ogħla, bi prezz ta’ $30 għal kull 1M input tokens u $180 għal kull 1M output tokens. Ara l-paġna tal-prezzijiet għad-dettalji kollha.
Filwaqt li GPT‑5.5 huwa pprezzat ogħla minn GPT‑5.4, huwa kemm aktar intelliġenti kif ukoll ferm aktar effiċjenti fit-tokens. F’Codex, irfinajna b’attenzjoni l-esperjenza biex GPT‑5.5 jagħti riżultati aħjar b’inqas tokens minn GPT‑5.4 għall-biċċa l-kbira tal-utenti, filwaqt li nkomplu noffru użu ġeneruż fost il-livelli tal-abbonament.
Kodifikazzjoni
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (Pubbliku) * | 58.6% | 57.7% | - | - | 64.3% | 54.2% |
Terminal-Bench 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
Expert-SWE (Intern) | 73.1% | 68.5% | - | - | - | - |
*Il-laboratorji nnutaw evidenza ta’ memorizzazzjoni(jinfetaħ f’tieqa ġdida) f’dan l-eval
Professjonali
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (rebħiet jew draws) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
FinanceAgent v1.1 | 60.0% | 56.0% | - | 61.5% | 64.4% | 59.7% |
Kompiti ta’ Mudellar tal-Investment Banking (Intern) | 88.5% | 87.3% | 88.6% | 83.6% | - | - |
OfficeQA Pro | 54.1% | 53.2% | - | - | 43.6% | 18.1% |
Użu tal-kompjuter u viżjoni
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Verified | 78.7% | 75.0% | - | - | 78.0% | - |
MMMU Pro (mingħajr għodod) | 81.2% | 81.2% | - | - | - | 80.5% |
MMMU Pro (bl-għodod) | 83.2% | 82.1% | - | - | - | - |
Użu tal-għodod
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
MCP Atlas** | 75.3% | 70.6% | - | - | 79.1% | 78.2% |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
Tau2-bench Telecom*** | 98.0% | 92.8% | - | - | - | - |
** MCP Atlas: riżultati minn Scale AI wara l-aħħar aġġornament ta’ April 2026.
*** Tau2-bench telecom: riżultati għal 5.5 u 5.4 bil-prompts oriġinali jiġifieri mingħajr aġġustament tal-prompt. Dan jeskludi riżultati minn labs oħra li ġew evalwati b’aġġustamenti tal-prompt.
Akkademiku
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25.0% | 19.0% | 33.2% | 25.6% | - | - |
FrontierMath Livell 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath Livell 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
BixBench | 80.5% | 74.0% | - | - | - | - |
GPQA Diamond | 93.6% | 92.8% | - | 94.4% | 94.2% | 94.3% |
Humanity's Last Exam (mingħajr għodod) | 41.4% | 39.8% | 43.1% | 42.7% | 46.9% | 44.4% |
Humanity's Last Exam (bl-għodod) | 52.2% | 52.1% | 57.2% | 58.7% | 54.7% | 51.4% |
Ċibersigurtà
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Kompiti ta’ sfida Capture-the-Flags (Intern)**** | 88.1% | 83.7% | - | - | - | - |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
**** Espansjoni tal-aktar CTFs diffiċli użati fil-kards tas-sistema b’sfidi diffiċli addizzjonali.
Kuntest twil
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256k f1 | 73.7% | 62.5% | - | - | 76.9% | - |
Graphwalks BFS 1mil f1 | 45.4% | 9.4% | - | - | 41.2% (Opus 4.6) | - |
Graphwalks parents 256k f1 | 90.1% | 82.8% | - | - | 93.6% | - |
Graphwalks parents 1mil f1 | 58.5% | 44.4% | - | - | 72.0% (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4K-8K | 98.1% | 97.3% | - | - | - | - |
OpenAI MRCR v2 8-needle 8K-16K | 93.0% | 91.4% | - | - | - | - |
OpenAI MRCR v2 8-needle 16K-32K | 96.5% | 97.2% | - | - | - | - |
OpenAI MRCR v2 8-needle 32K-64K | 90.0% | 90.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 64K-128K | 83.1% | 86.0% | - | - | - | - |
OpenAI MRCR v2 8-needle 128K-256K | 87.5% | 79.3% | - | - | 59.2% | - |
OpenAI MRCR v2 8-needle 256K-512K | 81.5% | 57.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 512K-1M | 74.0% | 36.6% | - | - | 32.2% | - |
Raġunament astratt
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (Verifikat) | 95.0% | 93.7% | - | 94.5% | 93.5% | 98.0% |
ARC-AGI-2 (Verifikat) | 85.0% | 73.3% | - | 83.3% | 75.8% | 77.1% |
L-evals ta’ GPT tmexxew b’reasoning effort issettjat għal xhigh u twettqu f’ambjent ta’ riċerka, li f’xi każijiet jista’ jipprovdi output kemxejn differenti minn ChatGPT tal-produzzjoni.








