Aqbeż għall-kontenut prinċipali
OpenAI

23 ta’ April 2026

ProdottRilaxx

Nintroduċu GPT‑5.5

Klassi ġdida ta’ intelliġenza għal xogħol reali

Qed jillowdja…

Aġġornament tal-24 ta’ April, 2026: GPT‑5.5 u GPT‑5.5 Pro issa huma disponibbli fl-API. Il-kard tas-sistema ġiet aġġornata wkoll biex tiddeskrivi s-salvagwardji addizzjonali li japplikaw.


Qed inħallu GPT‑5.5, l-aktar mudell intelliġenti u intuwittiv tagħna s’issa, u l-pass li jmiss lejn mod ġdid kif isir ix-xogħol fuq kompjuter.

GPT‑5.5 jifhem aktar malajr x’int qed tipprova tagħmel u jista’ jwettaq aktar mix-xogħol waħdu. Huwa eċċellenti fil-kitba u d-debugging tal-kodiċi, fir-riċerka online, fl-analiżi tad-data, fil-ħolqien ta’ dokumenti u spreadsheets, fl-operat ta’ software, u fil-mixi bejn għodod sakemm kompitu jitlesta. Minflok timmaniġġja bir-reqqa kull pass, tista’ tagħti lil GPT‑5.5 kompitu imħawwad u b’ħafna partijiet u tafdah jippjana, juża l-għodod, jiċċekkja x-xogħol tiegħu, jinnaviga l-ambigwità, u jkompli.

Il-qabżiet huma partikolarment b’saħħithom fil-coding aġentiku, fl-użu tal-kompjuter, fix-xogħol tal-għarfien, u fir-riċerka xjentifika bikrija—oqsma fejn il-progress jiddependi fuq raġunament fuq il-kuntest u fuq teħid ta’ azzjoni tul iż-żmien. GPT‑5.5 jagħti dan il-pass ’il fuq fl-intelliġenza mingħajr ma jikkomprometti l-veloċità: mudelli akbar u aktar kapaċi spiss ikunu aktar bil-mod biex jinqdew, iżda GPT‑5.5 jaqbel mal-latency għal kull token ta’ GPT‑5.4 fis-servizz tad-dinja reali, filwaqt li jwettaq f’livell ferm ogħla ta’ intelliġenza. Juża wkoll ferm inqas tokens biex itemm l-istess kompiti ta’ Codex, u b’hekk huwa aktar effiċjenti kif ukoll aktar kapaċi.

Qed inħallu GPT‑5.5 bl-aktar sett b’saħħtu ta’ salvagwardji tagħna sal-lum, iddisinjati biex inaqqsu l-użu ħażin filwaqt li jżommu l-aċċess għal xogħol ta’ benefiċċju. Ivvalutajna dan il-mudell fuq is-suite kollha tagħna ta’ oqfsa ta’ sikurezza u tħejjija, ħdimna ma’ redteamers interni u esterni, żidna testijiet immirati għal kapaċitajiet avvanzati taċ-ċibersigurtà u tal-bijoloġija, u ġbarna feedback fuq każijiet ta’ użu reali minn kważi 200 sieħeb ta’ aċċess bikri fdati qabel ir-rilaxx.

Illum, GPT‑5.5 qed jibda jitqassam lill-utenti Plus, Pro, Business, u Enterprise f’ChatGPT u Codex, u GPT‑5.5 Pro qed jibda jitqassam lill-utenti Pro, Business, u Enterprise f’ChatGPT. Id-distribuzzjonijiet tal-API jeħtieġu salvagwardji differenti u qed naħdmu mill-qrib ma’ sħab u klijenti fuq ir-rekwiżiti ta’ sikurezza u sigurtà biex dan jinqeda fuq skala kbira. Se nġibu GPT‑5.5 u GPT‑5.5 Pro fl-API dalwaqt ħafna.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82.7%

75.1%

-

-

69.4%

68.5%

Expert-SWE (Intern)

73.1%

68.5%

-

-

-

-

GDPval (rebħiet jew draws)

84.9%

83.0%

82.3%

82.0%

80.3%

67.3%

OSWorld-Verified

78.7%

75.0%

-

-

78.0%

-

Toolathlon

55.6%

54.6%

-

-

-

48.8%

BrowseComp

84.4%

82.7%

90.1%

89.3%

79.3%

85.9%

FrontierMath Livell 1–3

51.7%

47.6%

52.4%

50.0%

43.8%

36.9%

FrontierMath Livell 4

35.4%

27.1%

39.6%

38.0%

22.9%

16.7%

CyberGym

81.8%

79.0%

-

-

73.1%

-

Kapaċitajiet tal-mudell

OpenAI qed tibni l-infrastruttura globali għal AI aġentika, u tagħmilha possibbli għal nies u negozji madwar id-dinja li jwettqu xogħol bl-AI. Matul is-sena li għaddiet, rajna lill-AI tħaffef b’mod drammatiku l-inġinerija tas-software. B’GPT‑5.5 f’Codex u ChatGPT, dik l-istess trasformazzjoni qed tibda testendi ruħha għar-riċerka xjentifika u għax-xogħol usa’ li n-nies jagħmlu fuq il-kompjuters.

F’dawn id-dominji kollha, GPT‑5.5 mhux biss aktar intelliġenti; huwa wkoll aktar effiċjenti fil-mod kif jaħdem il-problemi, u ħafna drabi jilħaq outputs ta’ kwalità ogħla b’inqas tokens u b’inqas tentattivi mill-ġdid. Fuq il-Coding Index ta’ Artificial Analysis, GPT‑5.5 jagħti intelliġenza state-of-the-art b’nofs l-ispiża ta’ mudelli ta’ coding tal-fruntiera kompetittivi.

L-Indiċi tal-Intelliġenza ta’ Artificial Analysis(jinfetaħ f’tieqa ġdida) huwa medja peżata ta’ 10 evals immexxija minn parti esterna: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Coding aġentiku

GPT‑5.5 huwa l-aktar mudell tagħna b’saħħtu ta’ coding aġentiku sal-lum. Fuq Terminal-Bench 2.0, li jittestja flussi ta’ xogħol kumplessi tal-command line li jeħtieġu ppjanar, iterazzjoni, u koordinazzjoni ta’ għodod, jilħaq preċiżjoni state-of-the-art ta’ 82.7%. Fuq SWE-Bench Pro, li jevalwa s-soluzzjoni ta’ issues reali ta’ GitHub, jilħaq 58.6%, u jsolvi aktar kompiti end-to-end f’pass wieħed minn mudelli preċedenti. Fuq Expert-SWE, l-eval intern tagħna tal-fruntiera għal kompiti ta’ coding fit-tul b’ħin medjan stmat ta’ tlestija umana ta’ 20 siegħa, GPT‑5.5 ukoll jegħleb lil GPT‑5.4.

Fit-tliet evals kollha, GPT‑5.5 itejjeb il-punteġġi ta’ GPT‑5.4 waqt li juża inqas tokens.

Is-saħħiet tal-mudell fil-coding jidhru b’mod speċjali f’Codex fejn jista’ jieħu fuqu xogħol ta’ inġinerija li jvarja minn implimentazzjoni u refactors sa debugging, testing, u validazzjoni. Testijiet bikrin jissuġġerixxu li GPT‑5.5 huwa aħjar fl-imġibiet li jiddependi fuqhom xogħol inġineristiku reali, bħal iż-żamma tal-kuntest f’sistemi kbar, ir-raġunament fuq fallimenti ambigwi, il-verifika tal-assunzjonijiet b’għodod, u t-twettiq tal-bidliet fil-codebase ta’ madwarhom.

It-trajettorja rrendurjata tuża dejta vettorjali NASA/JPL Horizons għal Orion, il-Qamar u x-Xemx, bi skalar tal-wiri applikat għal qari aħjar.

Prompt: [immaġni mehmuża] Implimenta dan bħala app ġdida billi tuża webgl u vite b’dejta reali mill-missjoni Artemis II. Kun żgur li tittestja l-app bir-reqqa sakemm tkun kompletament funzjonali u tidher bħall-app fl-istampa. Oqgħod attent ħafna għar-rappreżentazzjoni tal-pjaneti u l-mogħdijiet tat-titjira. Irrid inkun nista’ ninteraġixxi mar-rendering 3D. Żgura li jkollha mekkanika orbitali realistika.

Apparti l-benchmarks, testers bikrin qalu li GPT‑5.5 juri abilità aktar b’saħħitha li jifhem il-forma ta’ sistema: għaliex xi ħaġa qed tfalli, fejn trid tinżel is-soluzzjoni, u x’iktar fil-codebase jkun affettwat.

alt

“L-ewwel mudell ta’ kodifikazzjoni li użajt li għandu ċarezza kunċettwali serja.”

Dan Shipper, Fundatur u CEO ta’ Every, iddeskriva GPT‑5.5 bħala “l-ewwel mudell ta’ kodifikazzjoni li użajt li għandu ċarezza kunċettwali serja.”

Wara li nieda app, qatta’ jiem jagħmel debugging ta’ problema wara t-tnedija qabel ma daħħal wieħed mill-aqwa inġiniera tiegħu biex jerġa’ jikteb parti mis-sistema. Biex jittestja GPT‑5.5, effettivament reġa’ dawwar l-arloġġ lura: seta’ l-mudell iħares lejn l-istat miksur u jipproduċi l-istess tip ta’ kitba mill-ġdid li fuqha l-inġinier eventwalment iddeċieda? GPT‑5.4 ma setax. GPT‑5.5 seta’.

alt

“Onestament inħossni bħallikieku qed naħdem ma’ intelliġenza ogħla, u kważi hemm sens ta’ rispett.”

Pietro Schirano, CEO ta’ MagicPath, ra bidla pass pass simili meta GPT‑5.5 għaqqad branch b’mijiet ta’ bidliet fil-frontend u refactor ma’ main branch li kienet ukoll inbidlet sostanzjalment, u solva x-xogħol f’daqqa waħda f’madwar 20 minuta.

Inġiniera anzjani li ttestjaw il-mudell qalu li GPT‑5.5 kien notevolment aktar b’saħħtu minn GPT‑5.4 u Claude Opus 4.7 fir-raġunament u fl-awtonomija, billi jaqbad kwistjonijiet minn qabel u jbassar il-ħtiġijiet tal-ittestjar u r-reviżjoni mingħajr prompt espliċitu. F’każ wieħed, inġinier talbu jerġa’ jiddisinja l-arkitettura ta’ sistema ta’ kummenti f’editur kollaborattiv tal-markdown u meta rritorna sab stack ta’ 12-il diff kważi komplut. Oħrajn qalu li kellhom bżonn sorprendentement ftit korrezzjoni fl-implimentazzjoni u ħassewhom aktar kunfidenti fil-pjanijiet ta’ GPT‑5.5 meta mqabbel ma’ GPT‑5.4.

Inġinier wieħed ta’ NVIDIA li kellu aċċess bikri għall-mudell wasal sa qal: “Li nitlef l-aċċess għal GPT‑5.5 inħossu qisu qatgħuli parti minn ġismi.”

“GPT-5.5 huwa notevolment aktar intelliġenti u aktar persistenti minn GPT-5.4, b’prestazzjoni ta’ kodifikazzjoni aktar qawwija u użu tal-għodod aktar affidabbli. Jibqa’ fuq il-kompitu għal ħafna aktar żmien mingħajr ma jieqaf kmieni, li huwa l-aktar importanti għax-xogħol kumpless u fit-tul li l-utenti tagħna jiddelegaw lil Cursor.”
— Michael Truell, Ko-Fundatur u CEO ta’ Cursor

Xogħol tal-għarfien

L-istess saħħiet li jagħmlu lil GPT‑5.5 eċċellenti għall-coding jagħmluh ukoll qawwi għax-xogħol ta’ kuljum fuq kompjuter. Minħabba li l-mudell huwa aħjar biex jifhem l-intenzjoni, jista’ jimxi b’mod aktar naturali tul iċ-ċiklu sħiħ tax-xogħol tal-għarfien: isib informazzjoni, jifhem x’inhu importanti, juża l-għodod, jiċċekkja l-output, u jibdel materjal mhux maħdum f’xi ħaġa utli.

F’Codex, GPT‑5.5 huwa aħjar minn GPT‑5.4 fil-ġenerazzjoni ta’ dokumenti, spreadsheets, u preżentazzjonijiet bi slides. Alpha testers qalu li qabeż mudelli tal-passat f’xogħol bħal riċerka operazzjonali, mudellar ta’ spreadsheets, u fil-bdil ta’ inputs tan-negozju imħawda fi pjanijiet. Meta kkombinat mal-ħiliet ta’ Codex fl-użu tal-kompjuter, GPT‑5.5 iqarribna aktar lejn is-sensazzjoni li l-mudell jista’ verament juża l-kompjuter miegħek: jara x’hemm fuq l-iskrin, jikklikkja, jikteb, jinnaviga interfaces, u jimxi bejn għodod bi preċiżjoni.

It-timijiet f’OpenAI diġà qed jużaw dawn is-saħħiet fi flussi ta’ xogħol reali. Illum, aktar minn 85% tal-kumpanija tuża Codex kull ġimgħa f’funzjonijiet li jinkludu l-inġinerija tas-software, il-finanzi, il-komunikazzjonijiet, il-marketing, ix-xjenza tad-data, u l-ġestjoni tal-prodott. F’Comms, it-tim uża GPT‑5.5 f’Codex biex janalizza sitt xhur ta’ data ta’ talbiet għal taħditiet, jibni qafas ta’ punteġġ u riskju, u jivvalida aġent awtomatizzat ta’ Slack biex talbiet ta’ riskju baxx ikunu jistgħu jiġu ttrattati awtomatikament filwaqt li talbiet ta’ riskju ogħla xorta jintbagħtu għal reviżjoni umana. Fil-Finanzi, it-tim uża Codex biex jirrevedi 24,771 formola tat-taxxa K-1 li b’kollox kellhom 71,637 paġna, billi uża fluss ta’ xogħol li eskluda informazzjoni personali u għen lit-tim iħaffef il-kompitu b’ġimagħtejn meta mqabbel mas-sena ta’ qabel. Fit-tim Go-to-Market, impjegat awtomatizza l-ġenerazzjoni ta’ rapporti tan-negozju ta’ kull ġimgħa, u ffranka 5-10 sigħat fil-ġimgħa.

F’ChatGPT, GPT‑5.5 Thinking jiftaħ għajnuna aktar rapida għal problemi aktar diffiċli, b’tweġibiet aktar intelliġenti u aktar konċiżi biex jgħinuk timxi fix-xogħol kumpless b’mod aktar effiċjenti. Huwa eċċellenti f’xogħol professjonali bħall-coding, ir-riċerka, is-sinteżi u l-analiżi tal-informazzjoni, u kompiti tqal fid-dokumenti, speċjalment meta juża plugins.

F’GPT‑5.5 Pro, testers bikrin qed jaraw pass ’il fuq sinifikanti kemm fid-diffikultà kif ukoll fil-kwalità tax-xogħol li ChatGPT jista’ jieħu fuqu, b’titjib fil-latency li jagħmlu dan ferm aktar prattiku għal kompiti impenjattivi. Meta mqabbel ma’ GPT‑5.4 Pro, it-testers sabu li t-tweġibiet ta’ GPT‑5.5 Pro kienu ferm aktar komprensivi, strutturati tajjeb, preċiżi, rilevanti, u utli, b’prestazzjoni partikolarment b’saħħitha fin-negozju, fil-liġi, fl-edukazzjoni, u fix-xjenza tad-data.

GPT‑5.5 jilħaq prestazzjoni state-of-the-art fuq diversi benchmarks li jirriflettu dan it-tip ta’ xogħol. Fuq GDPval⁠, li jittestja l-kapaċitajiet tal-aġenti li jipproduċu xogħol tal-għarfien speċifikat tajjeb f’44 okkupazzjoni, GPT‑5.5 jikseb 84.9%. Fuq OSWorld-Verified, li jkejjel jekk mudell jistax iħaddem ambjenti reali tal-kompjuter waħdu, jilħaq 78.7%. U fuq Tau2-bench Telecom, li jittestja flussi ta’ xogħol kumplessi tas-servizz tal-klijent, jilħaq 98.0% mingħajr prompt tuning. GPT‑5.5 ukoll jagħti prestazzjoni b’saħħitha fuq benchmarks oħra tax-xogħol tal-għarfien: 60.0% fuq FinanceAgent, 88.5% fuq kompiti interni ta’ mudellar tal-investment banking, u 54.1% fuq OfficeQA Pro.

Tau2-bench Telecom tħaddem mingħajr prompt tuning (u b’GPT‑4.1 bħala mudell tal-utent). GPT‑5.5 jifhem aħjar l-intenzjoni tal-kompitu u huwa aktar effiċjenti fit-tokens mill-predeċessuri tiegħu.

“GPT-5.5 jagħti l-prestazzjoni sostnuta meħtieġa għal xogħol tqil fl-eżekuzzjoni. Mibni u servut fuq sistemi NVIDIA GB200 NVL72, il-mudell jippermetti lit-timijiet tagħna jwasslu features end-to-end minn prompts bil-lingwa naturali, inaqqsu l-ħin tad-debug minn jiem għal sigħat, u jbiddlu ġimgħat ta’ esperimentazzjoni fi progress matul il-lejl f’codebases kumplessi. Huwa aktar minn kodifikazzjoni aktar mgħaġġla—huwa mod ġdid ta’ kif taħdem li jgħin lin-nies joperaw b’veloċità fundamentalment differenti.”
— Justin Boitano, VP ta’ Enterprise AI f’NVIDIA

Riċerka xjentifika

GPT‑5.5 juri wkoll titjib fuq flussi ta’ xogħol ta’ riċerka xjentifika u teknika, li jeħtieġu aktar milli sempliċement twieġeb mistoqsija diffiċli. Ir-riċerkaturi għandhom bżonn jesploraw idea, jiġbru evidenza, jittestjaw assunzjonijiet, jinterpretaw ir-riżultati, u jiddeċiedu x’għandhom jippruvaw wara. GPT‑5.5 huwa aħjar minn mudelli oħra biex jippersisti tul dan iċ-ċiklu.

B’mod notevoli, GPT‑5.5 juri titjib ċar fuq GPT‑5.4 fuq GeneBench(jinfetaħ f’tieqa ġdida), eval ġdid iffukat fuq analiżi xjentifika tad-data f’diversi stadji fil-ġenetika u fil-bijoloġija kwantitattiva. Dawn il-problemi jeħtieġu li l-mudelli jirraġunaw fuq data potenzjalment ambigwa jew żbaljata b’gwida superviżorja minima, jindirizzaw ostakli realistiċi bħal confounders moħbija jew fallimenti tal-QC, u jimplimentaw u jinterpretaw b’mod korrett metodi statistiċi moderni. Il-prestazzjoni tal-mudell hija impressjonanti fid-dawl tal-fatt li l-kompiti hawn spiss jikkorrispondu għal proġetti ta’ diversi jiem għal esperti xjentifiċi.

Bl-istess mod, fuq BixBench(jinfetaħ f’tieqa ġdida), benchmark iddisinjat madwar bijoinformatika u analiżi tad-data tad-dinja reali, GPT‑5.5 kiseb prestazzjoni ta’ quddiem fost mudelli b’punteġġi ppubblikati. Il-kapaċitajiet xjentifiċi tal-mudell issa huma b’saħħithom biżżejjed biex iħaffu b’mod sinifikanti l-progress fil-fruntieri tar-riċerka bijomedika bħala ko-xjenzjat ġenwin.

F’eżempju ieħor, verżjoni interna ta’ GPT‑5.5 b’harness personalizzat għenet biex tiskopri prova ġdida(jinfetaħ f’tieqa ġdida) dwar in-numri ta’ Ramsey, wieħed mill-oġġetti ċentrali fil-kombinatorika. Il-kombinatorika tistudja kif oġġetti diskreti joqogħdu flimkien: graffs, netwerks, settijiet, u mudelli. In-numri ta’ Ramsey jistaqsu, bejn wieħed u ieħor, kemm netwerk irid ikun kbir qabel ma xi tip ta’ ordni jkun garantit li jidher. Riżultati f’dan il-qasam huma rari u spiss teknikament diffiċli. Hawnhekk, GPT‑5.5 sab prova ta’ fatt asintotiku li ilu magħruf dwar in-numri ta’ Ramsey off-diagonal, li aktar tard ġiet ivverifikata f’Lean. Ir-riżultat huwa eżempju konkret ta’ GPT‑5.5 li jikkontribwixxi mhux biss kodiċi jew spjegazzjoni, iżda argument matematiku sorprendenti u utli f’qasam ewlieni tar-riċerka.

Testers bikrin użaw GPT‑5.5 Pro f’ChatGPT inqas bħal magna ta’ tweġibiet one-shot u aktar bħal sieħeb fir-riċerka: jikkritika manuskritti fuq diversi passaggi, jittestja l-qawwa ta’ argumenti tekniċi, jipproponi analiżijiet, u jaħdem ma’ kodiċi, noti, u kuntest minn PDFs. Il-ħajta komuni hija li GPT‑5.5 huwa aħjar biex jgħin lir-riċerkaturi jimxu minn mistoqsija għal esperiment għal output.

Derya Unutmaz, professur u riċerkatur tal-immunoloġija fil-Jackson Laboratory for Genomic Medicine, uża GPT‑5.5 Pro biex janalizza dataset ta’ espressjoni tal-ġeni b’62 kampjun u kważi 28,000 ġene, u pproduċa rapport ta’ riċerka dettaljat li mhux biss ġabar fil-qosor is-sejbiet iżda wkoll ħareġ mistoqsijiet u insights ewlenin—xogħol li qal li kien jieħu lit-tim tiegħu xhur.

Bartosz Naskręcki, assistant professor tal-matematika fl-Università Adam Mickiewicz f’Poznań, il-Polonja, uża GPT‑5.5 f’Codex biex jibni app ta’ ġeometrija alġebrika minn prompt wieħed fi 11-il minuta, li viżwalizzat l-intersezzjoni ta’ superfiċji kwadratiċi u kkonvertiet il-kurva li tirriżulta f’mudell ta’ Weierstrass.

Iktar tard estenda l-app b’viżwalizzazzjoni aktar stabbli tas-singolarità u koeffiċjenti eżatti li jistgħu jerġgħu jintużaw f’xogħol ieħor. Għalih, il-bidla akbar hija li Codex issa jista’ jgħin fl-implimentazzjoni ta’ workflows personalizzati ta’ viżwalizzazzjoni matematika u alġebra tal-kompjuter li qabel kienu jeħtieġu għodod dedikati. Flimkien, dawn l-eżempji juru GPT‑5.5 ibiddel l-intenzjoni tal-espert f’għodod ta’ riċerka u analiżijiet li jaħdmu.

“”

Kreditu: Bartosz Naskręcki(jinfetaħ f’tieqa ġdida)

Prompt: # Intersezzjoni ta’ superfiċji fil-ġeometrija alġebrika

Agħmel app li tiġbed żewġ superfiċji kwadratiċi u tikkolora bl-aħmar il-kurva tal-intersezzjoni. Uża t-teorema komputazzjonali ta’ Riemann-Roch biex tikkonverti dan f’kurva ta’ Weierstrass.

## Tieqa prinċipali

Żewġ superfiċji b’kulur ħafif u shading kemxejn trasparenti, rendering ta’ kwalità għolja li jinterseka tul kurva alġebrika ta’ kulur aħmar

Rotazzjoni bil-maws fiż-żewġ direzzjonijiet, mekkaniżmu sħiħ ta’ pinch għaż-zoom, pressjoni haptic biex jintwera l-menu żgħir bis-sliders għall-bidla tal-koeffiċjenti ta’ kull superfiċje; rilevament permezz tal-livell ta’ Z-buffor

## Tieqa tal-ġenb tal-lemin

Ekwazzjoni qasira ta’ Weierstrass (fuq Q jew estensjoni ta’ kamp kwadratiku) ikkalkulata fuq il-post permezz tal-formuli effettivi tat-teorema ta’ Riemann-Roch

## Modalità ambient fejn il-kontrolli kollha jkunu moħbija u l-utent jista’ jammira s-sbuħija tal-forom

## Specs

L-app taħdem fil-browser, implimentazzjoni ħafifa bl-aktar libreriji ġodda full stack, portabbli, tista’ tiġi deployjata

## Docs

Git repo, ġurnal, pjan (fajls Markdown)

“Huwa tassew enerġizzanti li nużaw il-mudell il-ġdid GPT-5.5 ta’ OpenAI fil-harness tagħna, inħalluh jagħmel raġunament fuq datasets bijokimiċi enormi biex ibassar ir-riżultati tal-mediċini fil-bnedmin, u mbagħad narawh iwassal għal żidiet sinifikanti fl-eżattezza fuq l-aktar evalwazzjonijiet diffiċli tagħna għall-iskoperta tal-mediċini. Jekk OpenAI tkompli taħdem hekk, il-pedamenti tal-iskoperta tal-mediċini se jinbidlu sal-aħħar tas-sena.”
— Brandon White, Ko-Fundatur u CEO ta’ Axiom Bio

Effiċjenza ta’ inferenza tal-ġenerazzjoni li jmiss

Li nqdu GPT‑5.5 bil-latency ta’ GPT‑5.4 kien jeħtieġ li nerġgħu naħsbu l-inferenza bħala sistema integrata, mhux bħala sett ta’ ottimizzazzjonijiet iżolati. GPT‑5.5 ġie ko-disinjat għal, imħarreġ ma’, u mqassam fuq sistemi NVIDIA GB200 u GB300 NVL72. Codex u GPT‑5.5 kienu strumentali għal kif ksibna l-miri tal-prestazzjoni tagħna. Codex għen lit-tim jimxi aktar malajr mill-idea għal implimentazzjoni li tista’ titkejjel fuq benchmark, billi abbozza approċċi, qabbad esperimenti, u għen jidentifika liema ottimizzazzjonijiet kienu jiswew investiment aktar profond. GPT‑5.5 għen biex jinstabu u jiġu implimentati titjibiet ewlenin fil-munzell innifsu. Fi kliem sempliċi, il-mudell għen biex itejjeb l-infrastruttura li taqdih.

Waħda minn dawn it-titjibiet kienet heuristics tal-load balancing u tal-partitioning. Qabel GPT‑5.5, konna naqsmu t-talbiet fuq aċċeleratur f’numru fiss ta’ biċċiet biex nibbilanċjaw ix-xogħol bejn il-cores tal-komputazzjoni, u b’hekk niżguraw li talbiet kbar u żgħar ikunu jistgħu jimxu fuq l-istess GPU. Madankollu, numru predeterminat ta’ biċċiet statiċi mhuwiex ottimali għall-forom kollha tat-traffiku. Biex nużaw aħjar il-GPUs, Codex analizza xejriet tat-traffiku tal-produzzjoni li jkopru ġimgħat u kiteb algoritmi heuristiċi personalizzati biex jaqsam u jibbilanċja x-xogħol bl-aħjar mod. Dan l-isforz kellu impatt sproporzjonat, u żied il-veloċitajiet tal-ġenerazzjoni tat-tokens b’aktar minn 20%.

Inwasslu ’l quddiem iċ-ċibersigurtà għas-sikurezza ta’ kulħadd

It-tħejjija tad-dinja għal mudelli li huma tajbin ħafna biex isibu u jġibu garżi għal vulnerabbiltajiet tas-sigurtà hija sport tat-tim u se teħtieġ li l-ekosistema kollha taħdem bis-sħiħ biex tibni reżiljenza, b’aċċess demokratizzat għall-mudelli u distribuzzjoni iterattiva għall-era li jmiss tad-difiża ċibernetika.

Mudelli tal-fruntiera qed isiru dejjem aktar kapaċi fiċ-ċibersigurtà. Dawn il-kapaċitajiet se jsiru mifruxa b’mod wiesa’ u aħna nemmnu li l-aħjar triq ’il quddiem hija li niżguraw li jistgħu jintużaw biex jitħaffef id-difiża ċibernetika u jissaħħaħ l-ekosistema.

GPT‑5.5 huwa pass inkrementali iżda importanti lejn AI li tista’ ssolvi wħud mill-aktar sfidi iebsa tad-dinja bħaċ-ċibersigurtà. B’GPT‑5.2 f’Diċembru, qsamna b’mod proattiv is-salvagwardji ċibernetiċi meħtieġa biex nillimitaw l-abbuż ċibernetiku potenzjali bil-mudelli tagħna; issa b’GPT‑5.5, qed nużaw klassifikaturi aktar stretti għal riskju ċibernetiku potenzjali li xi utenti jistgħu jsibuhom tedjanti għall-bidu, hekk kif nirranġawhom maż-żmien.

Ilna snin nidentifikaw iċ-ċibersigurtà bħala kategorija fil-Qafas tat-Tħejjija(jinfetaħ f’tieqa ġdida) tagħna hekk kif il-mudelli tagħna tjiebu b’mod inkrementali, waqt li niżviluppaw u nikkalibraw il-mitigazzjonijiet b’mod iterattiv, sabiex inkunu nistgħu nirrilaxxaw b’mod responsabbli mudelli b’kapaċitajiet sinifikanti taċ-ċibersigurtà.

  • Qed nużaw salvagwardji ta’ quddiem nett tal-industrija għal dan il-livell ta’ kapaċità ċibernetika. L-ewwel daħħalna salvagwardji speċifiċi għaċ-ċiber b’GPT‑5.2(jinfetaħ f’tieqa ġdida) is-sena l-oħra, li komplejna nittestjaw, nirfinaw, u nibnu fuqhom f’distribuzzjonijiet sussegwenti. Għal GPT‑5.5, iddisinjajna kontrolli aktar stretti madwar attività ta’ riskju ogħla, talbiet ċibernetiċi sensittivi, u żidna protezzjonijiet għal użu ħażin ripetut. L-aċċess wiesa’ huwa possibbli permezz tal-investimenti tagħna fis-sikurezza tal-mudell, fl-użu awtentikat, u fil-monitoraġġ ta’ użu mhux permess. Ilna xhur naħdmu ma’ esperti esterni biex niżviluppaw, nittestjaw u niteraw fuq ir-robustezza ta’ dawn is-salvagwardji. B’GPT‑5.5, qed niżguraw li l-iżviluppaturi jkunu jistgħu jiżguraw il-kodiċi tagħhom b’faċilità, filwaqt li nqiegħdu kontrolli aktar b’saħħithom madwar il-flussi ta’ xogħol ċibernetiċi l-aktar probabbli li jikkawżaw ħsara minn atturi malizzjużi.
  • Qed nespandu l-aċċess biex inħaffu d-difiża ċibernetika f’kull livell. Qed nagħmlu l-mudelli permissivi għaċ-ċiber tagħna disponibbli permezz ta’ Trusted Access for Cyber, nibdew b’Codex, li jinkludi aċċess estiż għall-kapaċitajiet avvanzati taċ-ċibersigurtà ta’ GPT‑5.5 b’inqas restrizzjonijiet għal utenti verifikati li jilħqu ċerti sinjali ta’ fiduċja(jinfetaħ f’tieqa ġdida) mat-tnedija. Organizzazzjonijiet li huma responsabbli għad-difiża ta’ infrastruttura kritika jistgħu japplikaw biex jaċċessaw mudelli permissivi għaċ-ċiber bħal GPT‑5.4‑Cyber, filwaqt li jilħqu rekwiżiti stretti ta’ sigurtà biex jużaw dawn il-mudelli għas-sigurtà tas-sistemi interni tagħhom. Dan jagħti lil firxa wiesgħa ta’ difensuri verifikati għodod aktar kapaċi għal xogħol leġittimu ta’ sigurtà b’inqas frizzjoni mhux meħtieġa sabiex niżguraw li niddemokratizzaw l-aċċess għal kapaċitajiet difensivi importanti. L-utenti jistgħu japplikaw għal trusted access fuq chatgpt.com/cyber(jinfetaħ f’tieqa ġdida) biex inaqqsu rifjuti mhux meħtieġa waqt li jużaw GPT‑5.5 għal xogħol difensiv ivverifikat.
  • Qed naħdmu ma’ sħab governattivi biex ngħinu nipproteġu infrastruttura kritika għall-pubbliku. Flimkien, qed nesploraw kif AI avvanzata tista’ tappoġġa x-xogħol difensiv ta’ uffiċjali fdati responsabbli għal sistemi li n-nies jiddependu fuqhom, mis-sistemi diġitali li jiżguraw data importanti ta’ min iħallas it-taxxa sal-grid tal-elettriku u l-provvisti tal-ilma fil-komunitajiet lokali.

Qed nittrattaw il-kapaċitajiet bijoloġiċi/kimiki u taċ-ċibersigurtà ta’ GPT‑5.5 bħala High taħt il-Qafas tat-Tħejjija(jinfetaħ f’tieqa ġdida) tagħna. Filwaqt li GPT‑5.5 ma laħaqx il-livell ta’ kapaċità ċibernetika Critical, l-evalwazzjonijiet u t-testijiet tagħna wrew li l-kapaċitajiet taċ-ċibersigurtà tiegħu huma pass ’il fuq meta mqabbla ma’ GPT‑5.4.

Barra minn hekk, GPT‑5.5 għadda mill-proċess sħiħ tagħna ta’ sikurezza u governanza qabel ir-rilaxx, inklużi evalwazzjonijiet ta’ tħejjija, testijiet speċifiċi għad-dominju, evalwazzjonijiet immirati ġodda għal kapaċitajiet avvanzati tal-bijoloġija u taċ-ċibersigurtà, u testijiet robusti ma’ esperti esterni. Naqsmu aktar dettalji fil-kard tas-sistema(jinfetaħ f’tieqa ġdida) ta’ GPT‑5.5.

Dan ix-xogħol jirrifletti l-approċċ usa’ tagħna għar-reżiljenza tal-AI, li nemmnu li hu meħtieġ hekk kif il-kapaċitajiet tal-mudelli javvanzaw. Irridu li AI qawwija tkun disponibbli għan-nies li qed jużawha biex jiddefendu sistemi, istituzzjonijiet, u lill-pubbliku. It-triq vijabbli hija aċċess fdat, salvagwardji robusti li jiskalaw mal-kapaċità, u kapaċità operattiva biex tiskopri u tirrispondi għal użu ħażin serju.

Disponibbiltà u prezzijiet

Illum, GPT‑5.5 qed jibda jitqassam lill-utenti Plus, Pro, Business, u Enterprise f’ChatGPT u Codex, u GPT‑5.5 Pro qed jibda jitqassam lill-utenti Pro, Business, u Enterprise f’ChatGPT. Se nġibu GPT‑5.5 u GPT‑5.5 Pro fl-API dalwaqt ħafna.

F’ChatGPT, GPT‑5.5 Thinking huwa disponibbli għall-utenti Plus, Pro, Business, u Enterprise. GPT‑5.5 Pro, iddisinjat għal mistoqsijiet saħansitra aktar diffiċli u xogħol ta’ preċiżjoni ogħla, huwa disponibbli għall-utenti Pro, Business, u Enterprise.

F’Codex, GPT‑5.5 huwa disponibbli għall-pjanijiet Plus, Pro, Business, Enterprise, Edu, u Go b’tieqa ta’ kuntest ta’ 400K. GPT‑5.5 huwa disponibbli wkoll fil-modalità Fast, li tiġġenera tokens 1.5x aktar malajr għal 2.5x l-ispiża.

Għall-iżviluppaturi tal-API, gpt-5.5 dalwaqt se jkun disponibbli fil-Responses API u l-API tat-tlestija taċ-chats bi prezz ta’ $5 għal kull 1M input tokens u $30 għal kull 1M output tokens, b’tieqa ta’ kuntest ta’ 1M. Il-prezzijiet Batch u Flex huma disponibbli b’nofs ir-rata standard tal-API, filwaqt li l-ipproċessar Priority huwa disponibbli b’2.5x ir-rata standard. Se nirrilaxxaw ukoll gpt-5.5-pro fl-API għal preċiżjoni saħansitra ogħla, bi prezz ta’ $30 għal kull 1M input tokens u $180 għal kull 1M output tokens. Ara l-paġna tal-prezzijiet għad-dettalji kollha.

Filwaqt li GPT‑5.5 huwa pprezzat ogħla minn GPT‑5.4, huwa kemm aktar intelliġenti kif ukoll ferm aktar effiċjenti fit-tokens. F’Codex, irfinajna b’attenzjoni l-esperjenza biex GPT‑5.5 jagħti riżultati aħjar b’inqas tokens minn GPT‑5.4 għall-biċċa l-kbira tal-utenti, filwaqt li nkomplu noffru użu ġeneruż fost il-livelli tal-abbonament.

Evalwazzjonijiet

Kodifikazzjoni

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (Pubbliku) *

58.6%

57.7%

-

-

64.3%

54.2%

Terminal-Bench 2.0

82.7%

75.1%

-

-

69.4%

68.5%

Expert-SWE (Intern)

73.1%

68.5%

-

-

-

-

Professjonali

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (rebħiet jew draws)

84.9%

83.0%

82.3%

82.0%

80.3%

67.3%

FinanceAgent v1.1

60.0%

56.0%

-

61.5%

64.4%

59.7%

Kompiti ta’ Mudellar tal-Investment Banking (Intern)

88.5%

87.3%

88.6%

83.6%

-

-

OfficeQA Pro

54.1%

53.2%

-

-

43.6%

18.1%

Użu tal-kompjuter u viżjoni

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld-Verified

78.7%

75.0%

-

-

78.0%

-

MMMU Pro (mingħajr għodod)

81.2%

81.2%

-

-

-

80.5%

MMMU Pro (bl-għodod)

83.2%

82.1%

-

-

-

-

Użu tal-għodod

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84.4%

82.7%

90.1%

89.3%

79.3%

85.9%

MCP Atlas**

75.3%

70.6%

-

-

79.1%

78.2%

Toolathlon

55.6%

54.6%

-

-

-

48.8%

Tau2-bench Telecom***
(prompts oriġinali)

98.0%

92.8%

-

-

-

-

** MCP Atlas: riżultati minn Scale AI wara l-aħħar aġġornament ta’ April 2026.
*** Tau2-bench telecom: riżultati għal 5.5 u 5.4 bil-prompts oriġinali jiġifieri mingħajr aġġustament tal-prompt. Dan jeskludi riżultati minn labs oħra li ġew evalwati b’aġġustamenti tal-prompt.

Akkademiku

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25.0%

19.0%

33.2%

25.6%

-

-

FrontierMath Livell 1–3

51.7%

47.6%

52.4%

50.0%

43.8%

36.9%

FrontierMath Livell 4

35.4%

27.1%

39.6%

38.0%

22.9%

16.7%

BixBench

80.5%

74.0%

-

-

-

-

GPQA Diamond

93.6%

92.8%

-

94.4%

94.2%

94.3%

Humanity's Last Exam (mingħajr għodod)

41.4%

39.8%

43.1%

42.7%

46.9%

44.4%

Humanity's Last Exam (bl-għodod)

52.2%

52.1%

57.2%

58.7%

54.7%

51.4%

Ċibersigurtà

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Kompiti ta’ sfida Capture-the-Flags (Intern)****

88.1%

83.7%

-

-

-

-

CyberGym

81.8%

79.0%

-

-

73.1%

-

**** Espansjoni tal-aktar CTFs diffiċli użati fil-kards tas-sistema b’sfidi diffiċli addizzjonali.

Kuntest twil

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256k f1

73.7%

62.5%

-

-

76.9%

-

Graphwalks BFS 1mil f1

45.4%

9.4%

-

-

41.2% (Opus 4.6)

-

Graphwalks parents 256k f1

90.1%

82.8%

-

-

93.6%

-

Graphwalks parents 1mil f1

58.5%

44.4%

-

-

72.0% (Opus 4.6)

-

OpenAI MRCR v2 8-needle 4K-8K

98.1%

97.3%

-

-

-

-

OpenAI MRCR v2 8-needle 8K-16K

93.0%

91.4%

-

-

-

-

OpenAI MRCR v2 8-needle 16K-32K

96.5%

97.2%

-

-

-

-

OpenAI MRCR v2 8-needle 32K-64K

90.0%

90.5%

-

-

-

-

OpenAI MRCR v2 8-needle 64K-128K

83.1%

86.0%

-

-

-

-

OpenAI MRCR v2 8-needle 128K-256K

87.5%

79.3%

-

-

59.2%

-

OpenAI MRCR v2 8-needle 256K-512K

81.5%

57.5%

-

-

-

-

OpenAI MRCR v2 8-needle 512K-1M

74.0%

36.6%

-

-

32.2%

-

Raġunament astratt

Eval

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (Verifikat)

95.0%

93.7%

-

94.5%

93.5%

98.0%

ARC-AGI-2 (Verifikat)

85.0%

73.3%

-

83.3%

75.8%

77.1%

L-evals ta’ GPT tmexxew b’reasoning effort issettjat għal xhigh u twettqu f’ambjent ta’ riċerka, li f’xi każijiet jista’ jipprovdi output kemxejn differenti minn ChatGPT tal-produzzjoni.

Awtur

OpenAI