Qed nintroduċu mudell ġdid li jiftaħ saħansitra aktar minn dak li jista’ jagħmel Codex: GPT‑5.3‑Codex, l-aktar mudell ta’ coding aġentiku kapaċi sal-lum. Il-mudell javvanza kemm il-prestazzjoni tal-coding fuq il-fruntiera ta’ GPT‑5.2‑Codex kif ukoll il-kapaċitajiet ta’ raġunament u għarfien professjonali ta’ GPT‑5.2, flimkien f’mudell wieħed, li hu wkoll 25% aktar mgħaġġel. Dan jippermettilu jieħu fuqu kompiti fit-tul li jinvolvu riċerka, użu ta’ għodod, u eżekuzzjoni kumplessa. Bħal kollega, tista’ tiggwida u tinteraġixxi ma’ GPT‑5.3‑Codex waqt li jkun qed jaħdem, mingħajr ma jitlef il-kuntest.
GPT‑5.3‑Codex huwa l-ewwel mudell tagħna li kien strumentali fil-ħolqien tiegħu nnifsu. It-tim ta’ Codex uża verżjonijiet bikrin biex jiddibaggja t-taħriġ tiegħu stess, jimmaniġġja d-deployment tiegħu stess, u jiddijanjostika r-riżultati tat-testijiet u l-evalwazzjonijiet—it-tim tagħna stagħġeb b’kemm Codex seta’ jaċċellera l-iżvilupp tiegħu stess.
Bil-GPT‑5.3‑Codex, Codex jgħaddi minn aġent li jista’ jikteb u jirrevedi l-kodiċi għal aġent li jista’ jagħmel kważi kull ħaġa li l-iżviluppaturi u l-professjonisti jistgħu jagħmlu fuq kompjuter.
GPT‑5.3‑Codex jistabbilixxi livell għoli ġdid fl-industrija fuq SWE-Bench Pro u Terminal-Bench, u juri prestazzjoni qawwija fuq OSWorld u GDPval, erba’ benchmarks li nużaw biex inkejlu l-kapaċitajiet tal-coding, aġentiċi u tad-dinja reali.
GPT‑5.3‑Codex jikseb prestazzjoni state-of-the-art fuq SWE-Bench Pro, evalwazzjoni rigoruża tal-inġinerija tas-software fid-dinja reali. Fejn SWE‑bench Verified jittestja biss Python, SWE‑Bench Pro jkopri erba’ lingwi u huwa aktar reżistenti għall-kontaminazzjoni, aktar sfidanti, divers u rilevanti għall-industrija. Jaqbeż ukoll b’ħafna l-prestazzjoni state-of-the-art preċedenti fuq Terminal-Bench 2.0, li jkejjel il-ħiliet tat-terminal li jeħtieġ aġent tal-coding bħal Codex. B’mod notevoli, GPT‑5.3‑Codex jagħmel dan b’inqas tokens minn kwalunkwe mudell preċedenti, u jħalli lill-utenti jibnu aktar.
Il-kombinazzjoni ta’ kapaċitajiet ta’ coding tal-fruntiera, titjib fl-estetika, u compactness tirriżulta f’mudell li jista’ jagħmel xogħol impressjonanti, billi jibni logħob u apps kumplessi u funzjonali ħafna mill-bidu tul jiem sħaħ. Biex nittestjaw il-kapaċitajiet ta’ żvilupp tal-web u l-kapaċitajiet aġentiċi fit-tul tal-mudell, tlabna lil GPT‑5.3‑Codex jibnilna żewġ logħob: it-tieni verżjoni tal-logħba tat-tlielaq mit-tnedija tal-app Codex, u logħba tal-għadis. Bl-użu tal-ħila develop web game u prompts ta’ segwitu ġeneriċi u magħżula minn qabel bħal "irranġa l-bug" jew "tejbu l-logħba", GPT‑5.3‑Codex itera fuq il-logħob b’mod awtonomu tul miljuni ta’ tokens. Ara t-trailers u pprova l-logħob inti stess biex tara x’jista’ jagħmel Codex.
Logħba tat-tlielaq, kompluta b’sewwieqa differenti, tmien mapep, u anke oġġetti biex tużahom bil-space bar. Ippruvaha inti stess hawn(jinfetaħ f’tieqa ġdida)!
Logħba tal-għadis fejn tesplora diversi sikek, tiġborhom kollha biex tlesti l-codex tal-ħut tiegħek, waqt li timmaniġġja l-ossiġnu, il-pressjoni u l-perikli. Ippruvaha inti stess hawn(jinfetaħ f’tieqa ġdida)!
GPT‑5.3‑Codex jifhem ukoll aħjar l-intenzjoni tiegħek meta titolbu joħloq websajts ta’ kuljum, meta mqabbel ma’ GPT‑5.2‑Codex. Prompts sempliċi jew mhux speċifikati biżżejjed issa b’mod awtomatiku jwasslu għal siti b’aktar funzjonalità u defaults sensibbli, u jagħtuk punt tat-tluq aktar b’saħħtu biex tagħti l-ħajja lill-ideat tiegħek.
Pereżempju, tlabna lil GPT‑5.3‑Codex u GPT‑5.2‑Codex jibnu żewġ landing pages hawn taħt. GPT‑5.3‑Codex awtomatikament wera l-pjan annwali bħala prezz mensili skontat, u b’hekk l-iskont deher ċar u intenzjonat, minflok ma mmultiplika t-total annwali. Għamel ukoll carousel ta’ testimonials li jgħaddi awtomatikament bi tliet kwotazzjonijiet distinti ta’ utenti minflok waħda, u dan wassal għal paġna li tħossha aktar kompluta u lesta għall-produzzjoni b’mod awtomatiku.
Prompt: Ibni landing page għal Quiet KPI, diġest ta’ metriċi ta’ kull ġimgħa li jiffavorixxi lill-fundaturi. L-estetika għandha tkun soft SaaS, karti b’dehra tal-ħġieġ, gradjent minn lavanda għal blu, blur sottili. Taqsimiet, hero b’ġbir tal-email, grilja ta’ sample report cards, ringiela ta’ integrazzjonijiet, carousel ta’ testimonials, toggle tal-prezzijiet kull xahar/kull sena, FAQ, footer.
- Typeface Satoshi jew geometric sans simili.
- Buttons b’kantunieri rotob, radius ta’ 14px, stati ta’ focus qawwija.
- Żid reveal ibbażat fuq l-iscroll, b’togħma tajba.
L-inġiniera tas-software, id-disinjaturi, il-maniġers tal-prodott, u x-xjenzati tad-data jagħmlu ferm aktar milli jiġġeneraw kodiċi. GPT‑5.3‑Codex inbena biex jappoġġja x-xogħol kollu fiċ-ċiklu tal-ħajja tas-software—debugging, deployment, monitoraġġ, kitba ta’ PRDs, editjar tal-copy, riċerka mal-utenti, testijiet, metriċi, u aktar. Il-kapaċitajiet aġentiċi tiegħu jmorru lil hinn mis-software, u jgħinuk tibni kull ma trid tibni—kemm jekk huma slide decks jew analiżi ta’ data fi spreadsheets.
B’ħiliet personalizzati simili għal dawk li użajna għar-riżultati preċedenti tagħna ta’ GDPval, GPT‑5.3‑Codex juri wkoll prestazzjoni qawwija fuq xogħol professjonali ta’ għarfien kif imkejjel minn GDPval, u jaqbel ma’ GPT‑5.2. GDPval hija evalwazzjoni li OpenAI ħarġet fl-2025 li tkejjel il-prestazzjoni ta’ mudell fuq kompiti ta’ xogħol ta’ għarfien definiti tajjeb f’44 okkupazzjoni. Dawn il-kompiti jinkludu affarijiet bħal preżentazzjonijiet, spreadsheets, u prodotti oħra tax-xogħol.
Hawn taħt hemm ftit eżempji tax-xogħol li pproduċa l-aġent.
Prompt + kuntest tal-kompiti
GPT-5.3-Codex output

OSWorld huwa benchmark ta’ użu tal-kompjuter aġentiku fejn l-aġent irid itemm kompiti ta’ produttività f’ambjent viżiv ta’ desktop computer. GPT‑5.3‑Codex juri kapaċitajiet ferm aktar b’saħħithom fl-użu tal-kompjuter mill-mudelli GPT preċedenti.
F’OSWorld-Verified, il-mudelli jużaw il-vista biex itemmu diversi kompiti fuq il-kompjuter. Il-bnedmin jiskorjaw madwar 72%.
Flimkien, dawn ir-riżultati tul coding, frontend, u kompiti ta’ użu tal-kompjuter u tad-dinja reali juru li GPT‑5.3‑Codex mhux biss aħjar f’kompiti individwali, iżda jimmarka bidla kbira lejn aġent wieħed ta’ skop ġenerali li jista’ jagħmel raġunament, jibni, u jesegwixxi fuq l-ispettru sħiħ tax-xogħol tekniku tad-dinja reali.
Hekk kif il-kapaċitajiet tal-mudell isiru aktar qawwija, id-distakk jiċċaqlaq minn dak li l-aġenti huma kapaċi jagħmlu għal kemm il-bnedmin jistgħu faċilment jinteraġixxu ma’, jidderieġu u jissorveljaw ħafna minnhom jaħdmu b’mod parallel. L-app Codex tagħmel il-ġestjoni u d-direzzjoni tal-aġenti ħafna aktar faċli, u issa bil-GPT‑5.3‑Codex hija aktar interattiva. Bil-mudell il-ġdid, Codex jipprovdi aġġornamenti frekwenti sabiex tibqa’ infurmat bid-deċiżjonijiet ewlenin u l-progress waqt li jkun qed jaħdem. Minflok tistenna output finali, tista’ tinteraġixxi f’ħin reali—tistaqsi mistoqsijiet, tiddiskuti approċċi, u tiggwida lejn is-soluzzjoni. GPT‑5.3‑Codex jispjega x’inhu jagħmel, jirrispondi għall-feedback, u jżommok aġġornat mill-bidu sat-tmiem.
Ippermetti l-gwida waqt li l-mudell jaħdem fl-app f’Settings > General > Follow-up behavior.
It-titjib rapidu riċenti ta’ Codex jibni fuq il-frott ta’ proġetti ta’ riċerka li damu xhur jew snin madwar OpenAI kollu. Dawn il-proġetti ta’ riċerka qed jiġu aċċellerati minn Codex, b’ħafna riċerkaturi u inġiniera f’OpenAI jiddeskrivu x-xogħol tagħhom illum bħala fundamentalment differenti minn dak li kien biss xahrejn ilu. Anke verżjonijiet bikrin ta’ GPT‑5.3‑Codex urew kapaċitajiet eċċezzjonali, u ppermettew lit-tim tagħna jaħdem ma’ dawk il-verżjonijiet ta’ qabel biex itejjeb it-taħriġ u jappoġġja d-deployment ta’ verżjonijiet aktar tardivi.
Codex huwa utli għal firxa wiesgħa ħafna ta’ kompiti, u dan jagħmilha diffiċli biex wieħed jelenka kompletament il-modi kif jgħin lit-timijiet tagħna. Bħala xi eżempji, it-tim ta’ riċerka uża Codex biex jimmonitorja u jiddibaggja t-training run għal din ir-rilaxx. Aċċellera r-riċerka lil hinn minn debugging ta’ problemi fl-infrastruttura: għen biex jiġu ssorveljati xejriet matul it-taħriġ, ipprovda analiżi profonda tal-kwalità tal-interazzjoni, ippropona soluzzjonijiet u bena applikazzjonijiet sinjuri biex ir-riċerkaturi umani jifhmu b’mod preċiż kif l-imġiba tal-mudell kienet differenti meta mqabbla ma’ mudelli preċedenti.
It-tim tal-inġinerija uża Codex biex jottimizza u jadatta l-harness għal GPT‑5.3‑Codex. Meta bdejna naraw każijiet rari strambi li jaffettwaw lill-utenti, il-membri tat-tim użaw Codex biex jidentifikaw bugs fir-rendering tal-kuntest, u l-kawża ewlenija ta’ rati baxxi ta’ cache hit. GPT‑5.3‑Codex qed ikompli jgħin lit-tim matul it-tnedija billi jiskala b’mod dinamiku l-clusters tal-GPU biex jaġġusta għal żidiet fit-traffiku u jżomm il-latency stabbli.
Waqt it-testijiet alpha, riċerkatur wieħed ried jifhem kemm GPT‑5.3‑Codex kien qed iwettaq xogħol addizzjonali għal kull turn u d-differenza assoċjata fil-produttività. GPT‑5.3‑Codex ħareġ b’diversi klassifikaturi regex sempliċi biex jistima l-frekwenza ta’ kjarifiki, tweġibiet pożittivi u negattivi tal-utent, progress fuq il-kompitu, u mbagħad ħaddimhom b’mod skalabbli fuq il-logs kollha tas-sessjonijiet u pproduċa rapport bil-konklużjoni tiegħu. In-nies li kienu qed jibnu b’Codex kienu aktar kuntenti għax l-aġent kien qed jifhem aħjar l-intenzjoni tagħhom u jagħmel aktar progress għal kull turn, b’inqas mistoqsijiet ta’ kjarifika.
Minħabba li GPT‑5.3‑Codex huwa tant differenti mill-predeċessuri tiegħu, id-data mit-testijiet alpha uriet bosta riżultati mhux tas-soltu u kontra l-intwizzjoni. Xjenzat tad-data fit-tim ħadem ma’ GPT‑5.3‑Codex biex jibni pipelines ġodda tad-data u jivviżwalizza r-riżultati b’mod ħafna aktar sinjur milli ppermettew l-għodod standard tagħna tad-dashboarding. Ir-riżultati ġew koanalizzati ma’ Codex, li ġabar fil-qosor b’mod konċiż l-għarfien ewlieni fuq eluf ta’ punti tad-data f’inqas minn tliet minuti.
Individwalment, dawn il-kompiti kollha huma eżempji interessanti ta’ kif Codex jista’ jgħin lir-riċerkaturi u lil dawk li jibnu prodotti. Meħudin flimkien, sibna li dawn il-kapaċitajiet ġodda rriżultaw f’aċċellerazzjoni qawwija tat-timijiet tagħna tar-riċerka, l-inġinerija, u l-prodott.
Matul l-aħħar xhur, rajna titjib sinifikanti fil-prestazzjoni tal-mudell fuq kompiti taċ-ċibersigurtà, li jgawdu minnu kemm l-iżviluppaturi kif ukoll il-professjonisti tas-sigurtà. Fl-istess ħin, konna qegħdin nippreparaw safeguards ċibernetiċi msaħħa biex nappoġġjaw użu difensiv u reżiljenza usa’ tal-ekosistema.
GPT‑5.3‑Codex huwa l-ewwel mudell li nikklassifikaw bħala High capability għal kompiti relatati maċ-ċibersigurtà taħt il-Qafas tat-Tħejjija tagħna, u l-ewwel wieħed li ħarriġna direttament biex jidentifika vulnerabbiltajiet tas-software. Filwaqt li m’għandniex evidenza definittiva li jista’ jawtomatizza attakki ċibernetiċi minn tarf sa tarf, qed nieħdu approċċ prekawzjonarju u nħaddmu l-aktar safety stack komprensiv tagħna taċ-ċibersigurtà sal-lum. Il-mitigazzjonijiet tagħna jinkludu taħriġ tas-sigurtà, monitoraġġ awtomatizzat, aċċess ta’ fiduċja għal kapaċitajiet avvanzati, u pipelines ta’ infurzar inkluża intelligence dwar it-theddid.
Minħabba li ċ-ċibersigurtà hija intrinsikament dual-use, qed nieħdu approċċ iterattiv ibbażat fuq l-evidenza li jaċċellera l-kapaċità tad-difensuri biex isibu u jirranġaw vulnerabbiltajiet waqt li jnaqqas l-użu ħażin. Bħala parti minn dan, qed inniedu Trusted Access for Cyber, programm pilota biex jaċċellera r-riċerka dwar id-difiża ċibernetika.
Biex ngħinu nipprevjenu l-użu ħażin, xi talbiet li s-sistemi tagħna jindividwaw bħala li għandhom riskju ċibernetiku elevat jistgħu jiġu rrutati awtomatikament minn GPT‑5.3‑Codex għal GPT‑5.2. Qegħdin inkomplu nirfinaw dawn is-safeguards. L-iżviluppaturi li jwettqu riċerka ta’ sigurtà jew li jemmnu li t-talbiet tagħhom ġew ikklassifikati ħażin jistgħu japplikaw għal aċċess sħiħ permezz tal-programm tagħna Trusted Access for Cyber jew jirrappurtaw il-kwistjoni bl-użu tal-kmand /feedback.
Qed ninvestu f’safeguards tal-ekosistema bħal espansjoni tal-private beta ta’ Aardvark, l-aġent tagħna għar-riċerka tas-sigurtà, bħala l-ewwel offerta fil-firxa tagħna ta’ prodotti u għodod Codex Security, u nissieħbu ma’ maintainers open-source biex nipprovdu scanning tal-codebase bla ħlas għal proġetti użati b’mod mifrux bħal Next.js—fejn riċerkatur tas-sigurtà uża Codex biex isib vulnerabbiltajiet żvelati(jinfetaħ f’tieqa ġdida) il-ġimgħa li għaddiet.
Nibnu fuq il-Programm ta’ Għotjiet għaċ-Ċibersigurtà ta’ $1M tagħna mniedi fl-2023, qed nimpenjaw ukoll $10M f’krediti API biex naċċelleraw id-difiża ċibernetika bl-aktar mudelli kapaċi tagħna, speċjalment għal software open source u sistemi ta’ infrastruttura kritika. Organizzazzjonijiet involuti f’riċerka tas-sigurtà in bona fide jistgħu japplikaw għal krediti API u appoġġ permezz tal-Programm ta’ Għotjiet għaċ-Ċibersigurtà tagħna.
GPT‑5.3‑Codex huwa disponibbli bi pjanijiet imħallsa ta’ ChatGPT, kull fejn tista’ tuża Codex: l-app, CLI, estensjoni tal-IDE u l-web. Qegħdin naħdmu biex dalwaqt inippermettu aċċess API b’mod sigur.
B’dan l-aġġornament, issa qed inħaddmu wkoll GPT‑5.3‑Codex 25% aktar malajr għall-utenti ta’ Codex, grazzi għal titjib fl-infrastruttura tagħna u fl-inference stack, li jwassal għal interazzjonijiet aktar mgħaġġla u riżultati aktar malajr.
GPT‑5.3‑Codex ġie koiddisinjat għal, imħarreġ ma’, u servut fuq sistemi NVIDIA GB200 NVL72. Aħna grati lejn NVIDIA għas-sħubija tagħhom.
Bil-GPT‑5.3‑Codex, Codex qed imur lil hinn mill-kitba tal-kodiċi biex jużah bħala għodda biex iħaddem kompjuter u jlesti xogħol minn tarf sa tarf. Billi nimbuttaw il-fruntiera ta’ dak li jista’ jagħmel aġent tal-coding, qed niftħu wkoll klassi usa’ ta’ xogħol ta’ għarfien—mill-bini u deployment tas-software għar-riċerka, l-analiżi, u l-eżekuzzjoni ta’ kompiti kumplessi. Dak li beda bħala fokus fuq li nkunu l-aqwa aġent tal-coding sar il-pedament għal kollaboratur aktar ġenerali fuq il-kompjuter, u jwessa’ kemm min jista’ jibni kif ukoll x’inhu possibbli b’Codex.
GPT‑5.3‑Codex (xhigh) | GPT‑5.2‑Codex (xhigh) | GPT‑5.2 (xhigh) | |
SWE-Bench Pro (Pubbliku) | 56.8% | 56.4% | 55.6% |
Terminal-Bench 2.0 | 77.3% | 64.0% | 62.2% |
OSWorld-Verified | 64.7% | 38.2% | 37.9% |
GDPval (rebħiet jew draws) | 70.9% | - | 70.9% (high) |
Cybersecurity Capture The Flag Challenges | 77.6% | 67.4% | 67.7% |
SWE-Lancer IC Diamond | 81.4% | 76.0% | 74.6% |


