23 ta’ April 2026

Nintroduċu GPT‑5.5

Klassi ġdida ta’ intelliġenza għal xogħol reali

Qed jillowdja…

Aġġornament tal-24 ta’ April, 2026: GPT‑5.5 u GPT‑5.5 Pro issa huma disponibbli fl-API. Il-kard tas-sistema ġiet aġġornata wkoll biex tiddeskrivi s-salvagwardji addizzjonali li japplikaw.

Qed inħallu GPT‑5.5, l-aktar mudell intelliġenti u intuwittiv tagħna s’issa, u l-pass li jmiss lejn mod ġdid kif isir ix-xogħol fuq kompjuter.

GPT‑5.5 jifhem aktar malajr x’int qed tipprova tagħmel u jista’ jwettaq aktar mix-xogħol waħdu. Huwa eċċellenti fil-kitba u d-debugging tal-kodiċi, fir-riċerka online, fl-analiżi tad-data, fil-ħolqien ta’ dokumenti u spreadsheets, fl-operat ta’ software, u fil-mixi bejn għodod sakemm kompitu jitlesta. Minflok timmaniġġja bir-reqqa kull pass, tista’ tagħti lil GPT‑5.5 kompitu imħawwad u b’ħafna partijiet u tafdah jippjana, juża l-għodod, jiċċekkja x-xogħol tiegħu, jinnaviga l-ambigwità, u jkompli.

Il-qabżiet huma partikolarment b’saħħithom fil-coding aġentiku, fl-użu tal-kompjuter, fix-xogħol tal-għarfien, u fir-riċerka xjentifika bikrija—oqsma fejn il-progress jiddependi fuq raġunament fuq il-kuntest u fuq teħid ta’ azzjoni tul iż-żmien. GPT‑5.5 jagħti dan il-pass ’il fuq fl-intelliġenza mingħajr ma jikkomprometti l-veloċità: mudelli akbar u aktar kapaċi spiss ikunu aktar bil-mod biex jinqdew, iżda GPT‑5.5 jaqbel mal-latency għal kull token ta’ GPT‑5.4 fis-servizz tad-dinja reali, filwaqt li jwettaq f’livell ferm ogħla ta’ intelliġenza. Juża wkoll ferm inqas tokens biex itemm l-istess kompiti ta’ Codex, u b’hekk huwa aktar effiċjenti kif ukoll aktar kapaċi.

Qed inħallu GPT‑5.5 bl-aktar sett b’saħħtu ta’ salvagwardji tagħna sal-lum, iddisinjati biex inaqqsu l-użu ħażin filwaqt li jżommu l-aċċess għal xogħol ta’ benefiċċju. Ivvalutajna dan il-mudell fuq is-suite kollha tagħna ta’ oqfsa ta’ sikurezza u tħejjija, ħdimna ma’ redteamers interni u esterni, żidna testijiet immirati għal kapaċitajiet avvanzati taċ-ċibersigurtà u tal-bijoloġija, u ġbarna feedback fuq każijiet ta’ użu reali minn kważi 200 sieħeb ta’ aċċess bikri fdati qabel ir-rilaxx.

Illum, GPT‑5.5 qed jibda jitqassam lill-utenti Plus, Pro, Business, u Enterprise f’ChatGPT u Codex, u GPT‑5.5 Pro qed jibda jitqassam lill-utenti Pro, Business, u Enterprise f’ChatGPT. Id-distribuzzjonijiet tal-API jeħtieġu salvagwardji differenti u qed naħdmu mill-qrib ma’ sħab u klijenti fuq ir-rekwiżiti ta’ sikurezza u sigurtà biex dan jinqeda fuq skala kbira. Se nġibu GPT‑5.5 u GPT‑5.5 Pro fl-API dalwaqt ħafna.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (Intern)	73.1%	68.5%	-	-	-	-
GDPval (rebħiet jew draws)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
OSWorld-Verified	78.7%	75.0%	-	-	78.0%	-
Toolathlon	55.6%	54.6%	-	-	-	48.8%
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
FrontierMath Livell 1–3	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
FrontierMath Livell 4	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
CyberGym	81.8%	79.0%	-	-	73.1%	-

Kapaċitajiet tal-mudell

OpenAI qed tibni l-infrastruttura globali għal AI aġentika, u tagħmilha possibbli għal nies u negozji madwar id-dinja li jwettqu xogħol bl-AI. Matul is-sena li għaddiet, rajna lill-AI tħaffef b’mod drammatiku l-inġinerija tas-software. B’GPT‑5.5 f’Codex u ChatGPT, dik l-istess trasformazzjoni qed tibda testendi ruħha għar-riċerka xjentifika u għax-xogħol usa’ li n-nies jagħmlu fuq il-kompjuters.

F’dawn id-dominji kollha, GPT‑5.5 mhux biss aktar intelliġenti; huwa wkoll aktar effiċjenti fil-mod kif jaħdem il-problemi, u ħafna drabi jilħaq outputs ta’ kwalità ogħla b’inqas tokens u b’inqas tentattivi mill-ġdid. Fuq il-Coding Index ta’ Artificial Analysis, GPT‑5.5 jagħti intelliġenza state-of-the-art b’nofs l-ispiża ta’ mudelli ta’ coding tal-fruntiera kompetittivi.

L-Indiċi tal-Intelliġenza ta’ Artificial Analysis⁠(jinfetaħ f’tieqa ġdida) huwa medja peżata ta’ 10 evals immexxija minn parti esterna: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Coding aġentiku

GPT‑5.5 huwa l-aktar mudell tagħna b’saħħtu ta’ coding aġentiku sal-lum. Fuq Terminal-Bench 2.0, li jittestja flussi ta’ xogħol kumplessi tal-command line li jeħtieġu ppjanar, iterazzjoni, u koordinazzjoni ta’ għodod, jilħaq preċiżjoni state-of-the-art ta’ 82.7%. Fuq SWE-Bench Pro, li jevalwa s-soluzzjoni ta’ issues reali ta’ GitHub, jilħaq 58.6%, u jsolvi aktar kompiti end-to-end f’pass wieħed minn mudelli preċedenti. Fuq Expert-SWE, l-eval intern tagħna tal-fruntiera għal kompiti ta’ coding fit-tul b’ħin medjan stmat ta’ tlestija umana ta’ 20 siegħa, GPT‑5.5 ukoll jegħleb lil GPT‑5.4.

Fit-tliet evals kollha, GPT‑5.5 itejjeb il-punteġġi ta’ GPT‑5.4 waqt li juża inqas tokens.

Is-saħħiet tal-mudell fil-coding jidhru b’mod speċjali f’Codex fejn jista’ jieħu fuqu xogħol ta’ inġinerija li jvarja minn implimentazzjoni u refactors sa debugging, testing, u validazzjoni. Testijiet bikrin jissuġġerixxu li GPT‑5.5 huwa aħjar fl-imġibiet li jiddependi fuqhom xogħol inġineristiku reali, bħal iż-żamma tal-kuntest f’sistemi kbar, ir-raġunament fuq fallimenti ambigwi, il-verifika tal-assunzjonijiet b’għodod, u t-twettiq tal-bidliet fil-codebase ta’ madwarhom.

It-trajettorja rrendurjata tuża dejta vettorjali NASA/JPL Horizons għal Orion, il-Qamar u x-Xemx, bi skalar tal-wiri applikat għal qari aħjar.

Prompt: [immaġni mehmuża] Implimenta dan bħala app ġdida billi tuża webgl u vite b’dejta reali mill-missjoni Artemis II. Kun żgur li tittestja l-app bir-reqqa sakemm tkun kompletament funzjonali u tidher bħall-app fl-istampa. Oqgħod attent ħafna għar-rappreżentazzjoni tal-pjaneti u l-mogħdijiet tat-titjira. Irrid inkun nista’ ninteraġixxi mar-rendering 3D. Żgura li jkollha mekkanika orbitali realistika.

Apparti l-benchmarks, testers bikrin qalu li GPT‑5.5 juri abilità aktar b’saħħitha li jifhem il-forma ta’ sistema: għaliex xi ħaġa qed tfalli, fejn trid tinżel is-soluzzjoni, u x’iktar fil-codebase jkun affettwat.

“L-ewwel mudell ta’ kodifikazzjoni li użajt li għandu ċarezza kunċettwali serja.”

Dan Shipper, Fundatur u CEO ta’ Every, iddeskriva GPT‑5.5 bħala “l-ewwel mudell ta’ kodifikazzjoni li użajt li għandu ċarezza kunċettwali serja.”

Wara li nieda app, qatta’ jiem jagħmel debugging ta’ problema wara t-tnedija qabel ma daħħal wieħed mill-aqwa inġiniera tiegħu biex jerġa’ jikteb parti mis-sistema. Biex jittestja GPT‑5.5, effettivament reġa’ dawwar l-arloġġ lura: seta’ l-mudell iħares lejn l-istat miksur u jipproduċi l-istess tip ta’ kitba mill-ġdid li fuqha l-inġinier eventwalment iddeċieda? GPT‑5.4 ma setax. GPT‑5.5 seta’.

“Onestament inħossni bħallikieku qed naħdem ma’ intelliġenza ogħla, u kważi hemm sens ta’ rispett.”

Pietro Schirano, CEO ta’ MagicPath, ra bidla pass pass simili meta GPT‑5.5 għaqqad branch b’mijiet ta’ bidliet fil-frontend u refactor ma’ main branch li kienet ukoll inbidlet sostanzjalment, u solva x-xogħol f’daqqa waħda f’madwar 20 minuta.

Inġiniera anzjani li ttestjaw il-mudell qalu li GPT‑5.5 kien notevolment aktar b’saħħtu minn GPT‑5.4 u Claude Opus 4.7 fir-raġunament u fl-awtonomija, billi jaqbad kwistjonijiet minn qabel u jbassar il-ħtiġijiet tal-ittestjar u r-reviżjoni mingħajr prompt espliċitu. F’każ wieħed, inġinier talbu jerġa’ jiddisinja l-arkitettura ta’ sistema ta’ kummenti f’editur kollaborattiv tal-markdown u meta rritorna sab stack ta’ 12-il diff kważi komplut. Oħrajn qalu li kellhom bżonn sorprendentement ftit korrezzjoni fl-implimentazzjoni u ħassewhom aktar kunfidenti fil-pjanijiet ta’ GPT‑5.5 meta mqabbel ma’ GPT‑5.4.

Inġinier wieħed ta’ NVIDIA li kellu aċċess bikri għall-mudell wasal sa qal: “Li nitlef l-aċċess għal GPT‑5.5 inħossu qisu qatgħuli parti minn ġismi.”

“GPT-5.5 huwa notevolment aktar intelliġenti u aktar persistenti minn GPT-5.4, b’prestazzjoni ta’ kodifikazzjoni aktar qawwija u użu tal-għodod aktar affidabbli. Jibqa’ fuq il-kompitu għal ħafna aktar żmien mingħajr ma jieqaf kmieni, li huwa l-aktar importanti għax-xogħol kumpless u fit-tul li l-utenti tagħna jiddelegaw lil Cursor.”

— Michael Truell, Ko-Fundatur u CEO ta’ Cursor

Xogħol tal-għarfien

L-istess saħħiet li jagħmlu lil GPT‑5.5 eċċellenti għall-coding jagħmluh ukoll qawwi għax-xogħol ta’ kuljum fuq kompjuter. Minħabba li l-mudell huwa aħjar biex jifhem l-intenzjoni, jista’ jimxi b’mod aktar naturali tul iċ-ċiklu sħiħ tax-xogħol tal-għarfien: isib informazzjoni, jifhem x’inhu importanti, juża l-għodod, jiċċekkja l-output, u jibdel materjal mhux maħdum f’xi ħaġa utli.

F’Codex, GPT‑5.5 huwa aħjar minn GPT‑5.4 fil-ġenerazzjoni ta’ dokumenti, spreadsheets, u preżentazzjonijiet bi slides. Alpha testers qalu li qabeż mudelli tal-passat f’xogħol bħal riċerka operazzjonali, mudellar ta’ spreadsheets, u fil-bdil ta’ inputs tan-negozju imħawda fi pjanijiet. Meta kkombinat mal-ħiliet ta’ Codex fl-użu tal-kompjuter, GPT‑5.5 iqarribna aktar lejn is-sensazzjoni li l-mudell jista’ verament juża l-kompjuter miegħek: jara x’hemm fuq l-iskrin, jikklikkja, jikteb, jinnaviga interfaces, u jimxi bejn għodod bi preċiżjoni.

It-timijiet f’OpenAI diġà qed jużaw dawn is-saħħiet fi flussi ta’ xogħol reali. Illum, aktar minn 85% tal-kumpanija tuża Codex kull ġimgħa f’funzjonijiet li jinkludu l-inġinerija tas-software, il-finanzi, il-komunikazzjonijiet, il-marketing, ix-xjenza tad-data, u l-ġestjoni tal-prodott. F’Comms, it-tim uża GPT‑5.5 f’Codex biex janalizza sitt xhur ta’ data ta’ talbiet għal taħditiet, jibni qafas ta’ punteġġ u riskju, u jivvalida aġent awtomatizzat ta’ Slack biex talbiet ta’ riskju baxx ikunu jistgħu jiġu ttrattati awtomatikament filwaqt li talbiet ta’ riskju ogħla xorta jintbagħtu għal reviżjoni umana. Fil-Finanzi, it-tim uża Codex biex jirrevedi 24,771 formola tat-taxxa K-1 li b’kollox kellhom 71,637 paġna, billi uża fluss ta’ xogħol li eskluda informazzjoni personali u għen lit-tim iħaffef il-kompitu b’ġimagħtejn meta mqabbel mas-sena ta’ qabel. Fit-tim Go-to-Market, impjegat awtomatizza l-ġenerazzjoni ta’ rapporti tan-negozju ta’ kull ġimgħa, u ffranka 5-10 sigħat fil-ġimgħa.

F’ChatGPT, GPT‑5.5 Thinking jiftaħ għajnuna aktar rapida għal problemi aktar diffiċli, b’tweġibiet aktar intelliġenti u aktar konċiżi biex jgħinuk timxi fix-xogħol kumpless b’mod aktar effiċjenti. Huwa eċċellenti f’xogħol professjonali bħall-coding, ir-riċerka, is-sinteżi u l-analiżi tal-informazzjoni, u kompiti tqal fid-dokumenti, speċjalment meta juża plugins.

F’GPT‑5.5 Pro, testers bikrin qed jaraw pass ’il fuq sinifikanti kemm fid-diffikultà kif ukoll fil-kwalità tax-xogħol li ChatGPT jista’ jieħu fuqu, b’titjib fil-latency li jagħmlu dan ferm aktar prattiku għal kompiti impenjattivi. Meta mqabbel ma’ GPT‑5.4 Pro, it-testers sabu li t-tweġibiet ta’ GPT‑5.5 Pro kienu ferm aktar komprensivi, strutturati tajjeb, preċiżi, rilevanti, u utli, b’prestazzjoni partikolarment b’saħħitha fin-negozju, fil-liġi, fl-edukazzjoni, u fix-xjenza tad-data.

GPT‑5.5 jilħaq prestazzjoni state-of-the-art fuq diversi benchmarks li jirriflettu dan it-tip ta’ xogħol. Fuq GDPval⁠⁠, li jittestja l-kapaċitajiet tal-aġenti li jipproduċu xogħol tal-għarfien speċifikat tajjeb f’44 okkupazzjoni, GPT‑5.5 jikseb 84.9%. Fuq OSWorld-Verified, li jkejjel jekk mudell jistax iħaddem ambjenti reali tal-kompjuter waħdu, jilħaq 78.7%. U fuq Tau2-bench Telecom, li jittestja flussi ta’ xogħol kumplessi tas-servizz tal-klijent, jilħaq 98.0% mingħajr prompt tuning. GPT‑5.5 ukoll jagħti prestazzjoni b’saħħitha fuq benchmarks oħra tax-xogħol tal-għarfien: 60.0% fuq FinanceAgent, 88.5% fuq kompiti interni ta’ mudellar tal-investment banking, u 54.1% fuq OfficeQA Pro.

Tau2-bench Telecom tħaddem mingħajr prompt tuning (u b’GPT‑4.1 bħala mudell tal-utent). GPT‑5.5 jifhem aħjar l-intenzjoni tal-kompitu u huwa aktar effiċjenti fit-tokens mill-predeċessuri tiegħu.

“GPT-5.5 jagħti l-prestazzjoni sostnuta meħtieġa għal xogħol tqil fl-eżekuzzjoni. Mibni u servut fuq sistemi NVIDIA GB200 NVL72, il-mudell jippermetti lit-timijiet tagħna jwasslu features end-to-end minn prompts bil-lingwa naturali, inaqqsu l-ħin tad-debug minn jiem għal sigħat, u jbiddlu ġimgħat ta’ esperimentazzjoni fi progress matul il-lejl f’codebases kumplessi. Huwa aktar minn kodifikazzjoni aktar mgħaġġla—huwa mod ġdid ta’ kif taħdem li jgħin lin-nies joperaw b’veloċità fundamentalment differenti.”

— Justin Boitano, VP ta’ Enterprise AI f’NVIDIA

Riċerka xjentifika

GPT‑5.5 juri wkoll titjib fuq flussi ta’ xogħol ta’ riċerka xjentifika u teknika, li jeħtieġu aktar milli sempliċement twieġeb mistoqsija diffiċli. Ir-riċerkaturi għandhom bżonn jesploraw idea, jiġbru evidenza, jittestjaw assunzjonijiet, jinterpretaw ir-riżultati, u jiddeċiedu x’għandhom jippruvaw wara. GPT‑5.5 huwa aħjar minn mudelli oħra biex jippersisti tul dan iċ-ċiklu.

B’mod notevoli, GPT‑5.5 juri titjib ċar fuq GPT‑5.4 fuq GeneBench⁠(jinfetaħ f’tieqa ġdida), eval ġdid iffukat fuq analiżi xjentifika tad-data f’diversi stadji fil-ġenetika u fil-bijoloġija kwantitattiva. Dawn il-problemi jeħtieġu li l-mudelli jirraġunaw fuq data potenzjalment ambigwa jew żbaljata b’gwida superviżorja minima, jindirizzaw ostakli realistiċi bħal confounders moħbija jew fallimenti tal-QC, u jimplimentaw u jinterpretaw b’mod korrett metodi statistiċi moderni. Il-prestazzjoni tal-mudell hija impressjonanti fid-dawl tal-fatt li l-kompiti hawn spiss jikkorrispondu għal proġetti ta’ diversi jiem għal esperti xjentifiċi.

Bl-istess mod, fuq BixBench⁠(jinfetaħ f’tieqa ġdida), benchmark iddisinjat madwar bijoinformatika u analiżi tad-data tad-dinja reali, GPT‑5.5 kiseb prestazzjoni ta’ quddiem fost mudelli b’punteġġi ppubblikati. Il-kapaċitajiet xjentifiċi tal-mudell issa huma b’saħħithom biżżejjed biex iħaffu b’mod sinifikanti l-progress fil-fruntieri tar-riċerka bijomedika bħala ko-xjenzjat ġenwin.

F’eżempju ieħor, verżjoni interna ta’ GPT‑5.5 b’harness personalizzat għenet biex tiskopri prova ġdida⁠(jinfetaħ f’tieqa ġdida) dwar in-numri ta’ Ramsey, wieħed mill-oġġetti ċentrali fil-kombinatorika. Il-kombinatorika tistudja kif oġġetti diskreti joqogħdu flimkien: graffs, netwerks, settijiet, u mudelli. In-numri ta’ Ramsey jistaqsu, bejn wieħed u ieħor, kemm netwerk irid ikun kbir qabel ma xi tip ta’ ordni jkun garantit li jidher. Riżultati f’dan il-qasam huma rari u spiss teknikament diffiċli. Hawnhekk, GPT‑5.5 sab prova ta’ fatt asintotiku li ilu magħruf dwar in-numri ta’ Ramsey off-diagonal, li aktar tard ġiet ivverifikata f’Lean. Ir-riżultat huwa eżempju konkret ta’ GPT‑5.5 li jikkontribwixxi mhux biss kodiċi jew spjegazzjoni, iżda argument matematiku sorprendenti u utli f’qasam ewlieni tar-riċerka.

Testers bikrin użaw GPT‑5.5 Pro f’ChatGPT inqas bħal magna ta’ tweġibiet one-shot u aktar bħal sieħeb fir-riċerka: jikkritika manuskritti fuq diversi passaggi, jittestja l-qawwa ta’ argumenti tekniċi, jipproponi analiżijiet, u jaħdem ma’ kodiċi, noti, u kuntest minn PDFs. Il-ħajta komuni hija li GPT‑5.5 huwa aħjar biex jgħin lir-riċerkaturi jimxu minn mistoqsija għal esperiment għal output.

Derya Unutmaz, professur u riċerkatur tal-immunoloġija fil-Jackson Laboratory for Genomic Medicine, uża GPT‑5.5 Pro biex janalizza dataset ta’ espressjoni tal-ġeni b’62 kampjun u kważi 28,000 ġene, u pproduċa rapport ta’ riċerka dettaljat li mhux biss ġabar fil-qosor is-sejbiet iżda wkoll ħareġ mistoqsijiet u insights ewlenin—xogħol li qal li kien jieħu lit-tim tiegħu xhur.

Bartosz Naskręcki, assistant professor tal-matematika fl-Università Adam Mickiewicz f’Poznań, il-Polonja, uża GPT‑5.5 f’Codex biex jibni app ta’ ġeometrija alġebrika minn prompt wieħed fi 11-il minuta, li viżwalizzat l-intersezzjoni ta’ superfiċji kwadratiċi u kkonvertiet il-kurva li tirriżulta f’mudell ta’ Weierstrass.

Iktar tard estenda l-app b’viżwalizzazzjoni aktar stabbli tas-singolarità u koeffiċjenti eżatti li jistgħu jerġgħu jintużaw f’xogħol ieħor. Għalih, il-bidla akbar hija li Codex issa jista’ jgħin fl-implimentazzjoni ta’ workflows personalizzati ta’ viżwalizzazzjoni matematika u alġebra tal-kompjuter li qabel kienu jeħtieġu għodod dedikati. Flimkien, dawn l-eżempji juru GPT‑5.5 ibiddel l-intenzjoni tal-espert f’għodod ta’ riċerka u analiżijiet li jaħdmu.

Kreditu: Bartosz Naskręcki⁠(jinfetaħ f’tieqa ġdida)

Prompt: # Intersezzjoni ta’ superfiċji fil-ġeometrija alġebrika

Agħmel app li tiġbed żewġ superfiċji kwadratiċi u tikkolora bl-aħmar il-kurva tal-intersezzjoni. Uża t-teorema komputazzjonali ta’ Riemann-Roch biex tikkonverti dan f’kurva ta’ Weierstrass.

## Tieqa prinċipali

Żewġ superfiċji b’kulur ħafif u shading kemxejn trasparenti, rendering ta’ kwalità għolja li jinterseka tul kurva alġebrika ta’ kulur aħmar

Rotazzjoni bil-maws fiż-żewġ direzzjonijiet, mekkaniżmu sħiħ ta’ pinch għaż-zoom, pressjoni haptic biex jintwera l-menu żgħir bis-sliders għall-bidla tal-koeffiċjenti ta’ kull superfiċje; rilevament permezz tal-livell ta’ Z-buffor

## Tieqa tal-ġenb tal-lemin

Ekwazzjoni qasira ta’ Weierstrass (fuq Q jew estensjoni ta’ kamp kwadratiku) ikkalkulata fuq il-post permezz tal-formuli effettivi tat-teorema ta’ Riemann-Roch

## Modalità ambient fejn il-kontrolli kollha jkunu moħbija u l-utent jista’ jammira s-sbuħija tal-forom

## Specs

L-app taħdem fil-browser, implimentazzjoni ħafifa bl-aktar libreriji ġodda full stack, portabbli, tista’ tiġi deployjata

## Docs

Git repo, ġurnal, pjan (fajls Markdown)

“Huwa tassew enerġizzanti li nużaw il-mudell il-ġdid GPT-5.5 ta’ OpenAI fil-harness tagħna, inħalluh jagħmel raġunament fuq datasets bijokimiċi enormi biex ibassar ir-riżultati tal-mediċini fil-bnedmin, u mbagħad narawh iwassal għal żidiet sinifikanti fl-eżattezza fuq l-aktar evalwazzjonijiet diffiċli tagħna għall-iskoperta tal-mediċini. Jekk OpenAI tkompli taħdem hekk, il-pedamenti tal-iskoperta tal-mediċini se jinbidlu sal-aħħar tas-sena.”

— Brandon White, Ko-Fundatur u CEO ta’ Axiom Bio

Effiċjenza ta’ inferenza tal-ġenerazzjoni li jmiss

Li nqdu GPT‑5.5 bil-latency ta’ GPT‑5.4 kien jeħtieġ li nerġgħu naħsbu l-inferenza bħala sistema integrata, mhux bħala sett ta’ ottimizzazzjonijiet iżolati. GPT‑5.5 ġie ko-disinjat għal, imħarreġ ma’, u mqassam fuq sistemi NVIDIA GB200 u GB300 NVL72. Codex u GPT‑5.5 kienu strumentali għal kif ksibna l-miri tal-prestazzjoni tagħna. Codex għen lit-tim jimxi aktar malajr mill-idea għal implimentazzjoni li tista’ titkejjel fuq benchmark, billi abbozza approċċi, qabbad esperimenti, u għen jidentifika liema ottimizzazzjonijiet kienu jiswew investiment aktar profond. GPT‑5.5 għen biex jinstabu u jiġu implimentati titjibiet ewlenin fil-munzell innifsu. Fi kliem sempliċi, il-mudell għen biex itejjeb l-infrastruttura li taqdih.

Waħda minn dawn it-titjibiet kienet heuristics tal-load balancing u tal-partitioning. Qabel GPT‑5.5, konna naqsmu t-talbiet fuq aċċeleratur f’numru fiss ta’ biċċiet biex nibbilanċjaw ix-xogħol bejn il-cores tal-komputazzjoni, u b’hekk niżguraw li talbiet kbar u żgħar ikunu jistgħu jimxu fuq l-istess GPU. Madankollu, numru predeterminat ta’ biċċiet statiċi mhuwiex ottimali għall-forom kollha tat-traffiku. Biex nużaw aħjar il-GPUs, Codex analizza xejriet tat-traffiku tal-produzzjoni li jkopru ġimgħat u kiteb algoritmi heuristiċi personalizzati biex jaqsam u jibbilanċja x-xogħol bl-aħjar mod. Dan l-isforz kellu impatt sproporzjonat, u żied il-veloċitajiet tal-ġenerazzjoni tat-tokens b’aktar minn 20%.

Inwasslu ’l quddiem iċ-ċibersigurtà għas-sikurezza ta’ kulħadd

It-tħejjija tad-dinja għal mudelli li huma tajbin ħafna biex isibu u jġibu garżi għal vulnerabbiltajiet tas-sigurtà hija sport tat-tim u se teħtieġ li l-ekosistema kollha taħdem bis-sħiħ biex tibni reżiljenza, b’aċċess demokratizzat għall-mudelli u distribuzzjoni iterattiva għall-era li jmiss tad-difiża ċibernetika⁠.

Mudelli tal-fruntiera qed isiru dejjem aktar kapaċi fiċ-ċibersigurtà. Dawn il-kapaċitajiet se jsiru mifruxa b’mod wiesa’ u aħna nemmnu li l-aħjar triq ’il quddiem hija li niżguraw li jistgħu jintużaw biex jitħaffef id-difiża ċibernetika u jissaħħaħ l-ekosistema.

GPT‑5.5 huwa pass inkrementali iżda importanti lejn AI li tista’ ssolvi wħud mill-aktar sfidi iebsa tad-dinja bħaċ-ċibersigurtà. B’GPT‑5.2 f’Diċembru, qsamna b’mod proattiv is-salvagwardji ċibernetiċi⁠ meħtieġa biex nillimitaw l-abbuż ċibernetiku potenzjali bil-mudelli tagħna; issa b’GPT‑5.5, qed nużaw klassifikaturi aktar stretti għal riskju ċibernetiku potenzjali li xi utenti jistgħu jsibuhom tedjanti għall-bidu, hekk kif nirranġawhom maż-żmien.

Ilna snin nidentifikaw iċ-ċibersigurtà bħala kategorija fil-Qafas tat-Tħejjija⁠(jinfetaħ f’tieqa ġdida) tagħna hekk kif il-mudelli tagħna tjiebu b’mod inkrementali, waqt li niżviluppaw u nikkalibraw il-mitigazzjonijiet b’mod iterattiv, sabiex inkunu nistgħu nirrilaxxaw b’mod responsabbli mudelli b’kapaċitajiet sinifikanti taċ-ċibersigurtà.

Qed nużaw salvagwardji ta’ quddiem nett tal-industrija għal dan il-livell ta’ kapaċità ċibernetika. L-ewwel daħħalna salvagwardji speċifiċi għaċ-ċiber b’GPT‑5.2⁠(jinfetaħ f’tieqa ġdida) is-sena l-oħra, li komplejna nittestjaw, nirfinaw, u nibnu fuqhom f’distribuzzjonijiet sussegwenti. Għal GPT‑5.5, iddisinjajna kontrolli aktar stretti madwar attività ta’ riskju ogħla, talbiet ċibernetiċi sensittivi, u żidna protezzjonijiet għal użu ħażin ripetut. L-aċċess wiesa’ huwa possibbli permezz tal-investimenti tagħna fis-sikurezza tal-mudell, fl-użu awtentikat, u fil-monitoraġġ ta’ użu mhux permess. Ilna xhur naħdmu ma’ esperti esterni biex niżviluppaw, nittestjaw u niteraw fuq ir-robustezza ta’ dawn is-salvagwardji. B’GPT‑5.5, qed niżguraw li l-iżviluppaturi jkunu jistgħu jiżguraw il-kodiċi tagħhom b’faċilità, filwaqt li nqiegħdu kontrolli aktar b’saħħithom madwar il-flussi ta’ xogħol ċibernetiċi l-aktar probabbli li jikkawżaw ħsara minn atturi malizzjużi.
Qed nespandu l-aċċess biex inħaffu d-difiża ċibernetika f’kull livell. Qed nagħmlu l-mudelli permissivi għaċ-ċiber tagħna disponibbli permezz ta’ Trusted Access for Cyber⁠, nibdew b’Codex, li jinkludi aċċess estiż għall-kapaċitajiet avvanzati taċ-ċibersigurtà ta’ GPT‑5.5 b’inqas restrizzjonijiet għal utenti verifikati li jilħqu ċerti sinjali ta’ fiduċja⁠(jinfetaħ f’tieqa ġdida) mat-tnedija. Organizzazzjonijiet li huma responsabbli għad-difiża ta’ infrastruttura kritika⁠ jistgħu japplikaw biex jaċċessaw mudelli permissivi għaċ-ċiber bħal GPT‑5.4‑Cyber, filwaqt li jilħqu rekwiżiti stretti ta’ sigurtà biex jużaw dawn il-mudelli għas-sigurtà tas-sistemi interni tagħhom. Dan jagħti lil firxa wiesgħa ta’ difensuri verifikati għodod aktar kapaċi għal xogħol leġittimu ta’ sigurtà b’inqas frizzjoni mhux meħtieġa sabiex niżguraw li niddemokratizzaw l-aċċess għal kapaċitajiet difensivi importanti. L-utenti jistgħu japplikaw għal trusted access fuq chatgpt.com/cyber⁠(jinfetaħ f’tieqa ġdida) biex inaqqsu rifjuti mhux meħtieġa waqt li jużaw GPT‑5.5 għal xogħol difensiv ivverifikat.
Qed naħdmu ma’ sħab governattivi biex ngħinu nipproteġu infrastruttura kritika għall-pubbliku. Flimkien, qed nesploraw kif AI avvanzata tista’ tappoġġa x-xogħol difensiv ta’ uffiċjali fdati responsabbli għal sistemi li n-nies jiddependu fuqhom, mis-sistemi diġitali li jiżguraw data importanti ta’ min iħallas it-taxxa sal-grid tal-elettriku u l-provvisti tal-ilma fil-komunitajiet lokali.

Qed nittrattaw il-kapaċitajiet bijoloġiċi/kimiki u taċ-ċibersigurtà ta’ GPT‑5.5 bħala High taħt il-Qafas tat-Tħejjija⁠(jinfetaħ f’tieqa ġdida) tagħna. Filwaqt li GPT‑5.5 ma laħaqx il-livell ta’ kapaċità ċibernetika Critical, l-evalwazzjonijiet u t-testijiet tagħna wrew li l-kapaċitajiet taċ-ċibersigurtà tiegħu huma pass ’il fuq meta mqabbla ma’ GPT‑5.4.

Barra minn hekk, GPT‑5.5 għadda mill-proċess sħiħ tagħna ta’ sikurezza u governanza qabel ir-rilaxx, inklużi evalwazzjonijiet ta’ tħejjija, testijiet speċifiċi għad-dominju, evalwazzjonijiet immirati ġodda għal kapaċitajiet avvanzati tal-bijoloġija u taċ-ċibersigurtà, u testijiet robusti ma’ esperti esterni. Naqsmu aktar dettalji fil-kard tas-sistema⁠(jinfetaħ f’tieqa ġdida) ta’ GPT‑5.5.

Dan ix-xogħol jirrifletti l-approċċ usa’ tagħna għar-reżiljenza tal-AI, li nemmnu li hu meħtieġ hekk kif il-kapaċitajiet tal-mudelli javvanzaw. Irridu li AI qawwija tkun disponibbli għan-nies li qed jużawha biex jiddefendu sistemi, istituzzjonijiet, u lill-pubbliku. It-triq vijabbli hija aċċess fdat, salvagwardji robusti li jiskalaw mal-kapaċità, u kapaċità operattiva biex tiskopri u tirrispondi għal użu ħażin serju.

Disponibbiltà u prezzijiet

F’ChatGPT, GPT‑5.5 Thinking huwa disponibbli għall-utenti Plus, Pro, Business, u Enterprise. GPT‑5.5 Pro, iddisinjat għal mistoqsijiet saħansitra aktar diffiċli u xogħol ta’ preċiżjoni ogħla, huwa disponibbli għall-utenti Pro, Business, u Enterprise.

F’Codex, GPT‑5.5 huwa disponibbli għall-pjanijiet Plus, Pro, Business, Enterprise, Edu, u Go b’tieqa ta’ kuntest ta’ 400K. GPT‑5.5 huwa disponibbli wkoll fil-modalità Fast, li tiġġenera tokens 1.5x aktar malajr għal 2.5x l-ispiża.

Għall-iżviluppaturi tal-API, gpt-5.5 dalwaqt se jkun disponibbli fil-Responses API u l-API tat-tlestija taċ-chats bi prezz ta’ $5 għal kull 1M input tokens u $30 għal kull 1M output tokens, b’tieqa ta’ kuntest ta’ 1M. Il-prezzijiet Batch u Flex huma disponibbli b’nofs ir-rata standard tal-API, filwaqt li l-ipproċessar Priority huwa disponibbli b’2.5x ir-rata standard. Se nirrilaxxaw ukoll gpt-5.5-pro fl-API għal preċiżjoni saħansitra ogħla, bi prezz ta’ $30 għal kull 1M input tokens u $180 għal kull 1M output tokens. Ara l-paġna tal-prezzijiet⁠ għad-dettalji kollha.

Filwaqt li GPT‑5.5 huwa pprezzat ogħla minn GPT‑5.4, huwa kemm aktar intelliġenti kif ukoll ferm aktar effiċjenti fit-tokens. F’Codex, irfinajna b’attenzjoni l-esperjenza biex GPT‑5.5 jagħti riżultati aħjar b’inqas tokens minn GPT‑5.4 għall-biċċa l-kbira tal-utenti, filwaqt li nkomplu noffru użu ġeneruż fost il-livelli tal-abbonament.

Evalwazzjonijiet

Kodifikazzjoni

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (Pubbliku) *	58.6%	57.7%	-	-	64.3%	54.2%
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (Intern)	73.1%	68.5%	-	-	-	-

^*^{Il-laboratorji nnutaw}^{evidenza ta’ memorizzazzjoni}⁠(jinfetaħ f’tieqa ġdida)^{f’dan l-eval}

Professjonali

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (rebħiet jew draws)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
FinanceAgent v1.1	60.0%	56.0%	-	61.5%	64.4%	59.7%
Kompiti ta’ Mudellar tal-Investment Banking (Intern)	88.5%	87.3%	88.6%	83.6%	-	-
OfficeQA Pro	54.1%	53.2%	-	-	43.6%	18.1%

Użu tal-kompjuter u viżjoni

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld-Verified	78.7%	75.0%	-	-	78.0%	-
MMMU Pro (mingħajr għodod)	81.2%	81.2%	-	-	-	80.5%
MMMU Pro (bl-għodod)	83.2%	82.1%	-	-	-	-

Użu tal-għodod

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
MCP Atlas**	75.3%	70.6%	-	-	79.1%	78.2%
Toolathlon	55.6%	54.6%	-	-	-	48.8%
Tau2-bench Telecom*** (prompts oriġinali)	98.0%	92.8%	-	-	-	-

^{** MCP Atlas: riżultati minn Scale AI wara l-aħħar aġġornament ta’ April 2026.
*** Tau2-bench telecom: riżultati għal 5.5 u 5.4 bil-prompts oriġinali jiġifieri mingħajr aġġustament tal-prompt. Dan jeskludi riżultati minn labs oħra li ġew evalwati b’aġġustamenti tal-prompt.}

Akkademiku

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25.0%	19.0%	33.2%	25.6%	-	-
FrontierMath Livell 1–3	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
FrontierMath Livell 4	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
BixBench	80.5%	74.0%	-	-	-	-
GPQA Diamond	93.6%	92.8%	-	94.4%	94.2%	94.3%
Humanity's Last Exam (mingħajr għodod)	41.4%	39.8%	43.1%	42.7%	46.9%	44.4%
Humanity's Last Exam (bl-għodod)	52.2%	52.1%	57.2%	58.7%	54.7%	51.4%

Ċibersigurtà

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Kompiti ta’ sfida Capture-the-Flags (Intern)****	88.1%	83.7%	-	-	-	-
CyberGym	81.8%	79.0%	-	-	73.1%	-

^{**** Espansjoni tal-aktar CTFs diffiċli użati fil-kards tas-sistema b’sfidi diffiċli addizzjonali.}

Kuntest twil

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73.7%	62.5%	-	-	76.9%	-
Graphwalks BFS 1mil f1	45.4%	9.4%	-	-	41.2% (Opus 4.6)	-
Graphwalks parents 256k f1	90.1%	82.8%	-	-	93.6%	-
Graphwalks parents 1mil f1	58.5%	44.4%	-	-	72.0% (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98.1%	97.3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93.0%	91.4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96.5%	97.2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90.0%	90.5%	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83.1%	86.0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87.5%	79.3%	-	-	59.2%	-
OpenAI MRCR v2 8-needle 256K-512K	81.5%	57.5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74.0%	36.6%	-	-	32.2%	-

Raġunament astratt

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (Verifikat)	95.0%	93.7%	-	94.5%	93.5%	98.0%
ARC-AGI-2 (Verifikat)	85.0%	73.3%	-	83.3%	75.8%	77.1%

L-evals ta’ GPT tmexxew b’reasoning effort issettjat għal xhigh u twettqu f’ambjent ta’ riċerka, li f’xi każijiet jista’ jipprovdi output kemxejn differenti minn ChatGPT tal-produzzjoni.