Aqbeż għall-kontenut prinċipali
OpenAI

19 ta’ Novembru 2025

ProdottRilaxx

Nibnu aktar b’GPT‑5.1‑Codex‑Max

Qed jillowdja…

Introduzzjoni

Qed nintroduċu GPT‑5.1‑Codex‑Max, il-mudell ġdid tagħna ta’ kodifikar aġentiku tal-fruntiera, disponibbli f’Codex illum. GPT‑5.1‑Codex‑Max huwa mibni fuq aġġornament tal-mudell fundamentali tagħna tar-raġunament, li huwa mħarreġ fuq kompiti aġentiċi fl-inġinerija tas-software, il-matematika, ir-riċerka, u aktar. GPT‑5.1‑Codex‑Max huwa aktar veloċi, aktar intelliġenti, u aktar effiċjenti fit-token f’kull stadju taċ-ċiklu tal-iżvilupp—u pass ġdid lejn li jsir sieħeb tal-kodifikar affidabbli.

GPT‑5.1‑Codex‑Max huwa mibni għal xogħol fit-tul u dettaljat. Huwa l-ewwel mudell tagħna mħarreġ b’mod nattiv biex jopera fuq bosta twieqi tal-kuntest permezz ta’ proċess imsejjaħ compaction, u jaħdem b’mod koerenti fuq miljuni ta’ tokens f’kompitu wieħed. Dan jiftaħ rifattorizzazzjonijiet fuq skala ta’ proġett, sessjonijiet profondi ta’ debugging, u loops ta’ aġent ta’ ħafna sigħat.

GPT‑5.1‑Codex‑Max huwa disponibbli f’Codex illum għall-użu fil-CLI, l-estensjoni tal-IDE, il-cloud, u r-reviżjoni tal-kodiċi, u l-aċċess għall-API dalwaqt ġej.

Kapaċitajiet tal-fruntiera fil-kodifikar

GPT‑5.1‑Codex‑Max ġie mħarreġ fuq kompiti reali tal-inġinerija tas-software, bħall-ħolqien ta’ PRs, ir-reviżjoni tal-kodiċi, il-kodifikar frontend, u mistoqsijiet u tweġibiet, u jaqbeż il-mudelli preċedenti tagħna f’ħafna evalwazzjonijiet tal-fruntiera fil-kodifikar. Il-kisbiet tal-mudell fil-benchmarks jiġu wkoll ma’ titjib fl-użu fid-dinja reali: GPT‑5.1‑Codex‑Max huwa l-ewwel mudell li ħarriġna biex jopera f’ambjenti Windows, u t-taħriġ tal-mudell issa jinkludi kompiti mfassla biex jagħmluh kollaboratur aħjar fil-Codex CLI.

* L-evals kollha saru b’compaction attivat fuq sforz ta’ raġunament Extra High
* Terminal-Bench2.0 mexa b’Codex CLI fil-
Laude Institute Harbor harness(jinfetaħ f’tieqa ġdida)

Veloċità u spiża

GPT‑5.1‑Codex‑Max juri titjib sinifikanti fl-effiċjenza tat-token minħabba raġunament aktar effettiv. Fuq SWE-bench Verified, GPT‑5.1‑Codex‑Max bi sforz ta’ raġunament ‘medium’ jikseb prestazzjoni aħjar minn GPT‑5.1‑Codex bl-istess sforz ta’ raġunament, filwaqt li juża 30% inqas thinking tokens. Għal kompiti mhux sensittivi għal-latenza, qed nintroduċu wkoll sforz ġdid ta’ raġunament Extra High (‘xhigh’), li jaħseb għal perjodu saħansitra itwal għal tweġiba aħjar. Xorta nirrakkomandaw medium bħala l-għażla ta’ kuljum għall-biċċa l-kbira tal-kompiti.

Nistennew li t-titjib fl-effiċjenza tat-token jissarraf fi ffrankar fid-dinja reali għall-iżviluppaturi.

Pereżempju, GPT‑5.1‑Codex‑Max kapaċi jipproduċi disinji frontend ta’ kwalità għolja b’funzjonalità u estetika simili, iżda bi spiża ferm aktar baxxa minn GPT‑5.1‑Codex.

Prompt: Ġġenera app waħda tal-browser, awtonoma, li tirrendi sandbox interattiv ta’ CartPole RL bi grafika canvas, kontrollur żgħir policy-gradient, metriċi, u viżwalizzatur tan-network SVG.

Karatteristiċi

  • Għandu jkun kapaċi tassew iħarreġ policy biex jagħmel il-mudell aħjar fil-cart pole
  • Viżwalizzatur għall-attivazzjonijiet/piżijiet meta l-mudell ikun qed jitħarreġ jew waqt l-inferenza
  • Passi fl-episodju, premjijiet f’dan l-episodju
  • L-aħħar ħin ta’ sopravivenza u l-aħjar ħin ta’ sopravivenza f’passi

Issejvja f’index.html

Kompiti fit-tul

Compaction jippermetti lil GPT‑5.1‑Codex‑Max itemm kompiti li qabel kienu jfallu minħabba limiti tat-tieqa tal-kuntest, bħal rifattorizzazzjonijiet kumplessi u loops ta’ aġent li jdumu fit-tul, billi jnaqqas l-istorja tiegħu waqt li jżomm l-aktar kuntest importanti fuq perjodi twal. Fl-applikazzjonijiet Codex, GPT‑5.1‑Codex‑Max awtomatikament jikkompatta s-sessjoni tiegħu meta joqrob lejn il-limitu tat-tieqa tal-kuntest tiegħu, u b’hekk jingħata tieqa ġdida tal-kuntest. Huwa jirrepeti dan il-proċess sakemm il-kompitu jitlesta.

Il-kapaċità li jżomm xogħol koerenti fuq meded twal hija kapaċità fundamentali fit-triq lejn sistemi tal-IA aktar ġenerali u affidabbli. GPT‑5.1‑Codex‑Max jista’ jaħdem b’mod indipendenti għal sigħat sħaħ. Fl-evalwazzjonijiet interni tagħna, osservajna lil GPT‑5.1‑Codex‑Max jaħdem fuq kompiti għal aktar minn 24 siegħa. Jibqa’ jtenni l-implimentazzjoni tiegħu b’mod persistenti, jirranġa fallimenti fit-testijiet, u fl-aħħar iwassal riżultat ta’ suċċess.

F’dan l-eżempju, GPT‑5.1‑Codex‑Max qed jirrifattorizza b’mod indipendenti r-repożitorju open source Codex CLI.

Hekk kif it-tul tas-sessjoni jersaq lejn it-tieqa tal-kuntest tal-mudell, awtomatikament jikkompatta s-sessjoni biex jeħles spazju u jkompli l-kompitu mingħajr ma jitlef il-progress.

Il-vidjo ġie mqassar u aċċellerat għaċ-ċarezza.

Bini ta’ aġenti tal-IA siguri u affidabbli

GPT‑5.1‑Codex‑Max jaħdem ferm aħjar fuq evalwazzjonijiet li jeħtieġu raġunament sostnut fuq meded twal. Minħabba li jista’ jaħdem b’mod koerenti fuq bosta twieqi tal-kuntest billi juża compaction, il-mudell jagħti riżultati mtejba fuq sfidi f’oqsma bħall-kodifikar fuq meded twal u ċ-ċibersigurtà. Analizzajna r-riżultati tal-prestazzjoni ta’ dan il-mudell fuq evalwazzjonijiet ta’ first- u third-party fil-kard tas-sistema ta’ GPT‑5.1‑Codex‑Max.

GPT‑5.1‑Codex‑Max ma jilħaqx kapaċità High fiċ-Ċibersigurtà taħt il-Qafas tat-Tħejjija tagħna iżda huwa l-aktar mudell taċ-ċibersigurtà kapaċi li implimentajna sal-lum u l-kapaċitajiet aġentiċi taċ-ċibersigurtà qed jevolvu malajr. B’riżultat ta’ dan, qed nieħdu passi biex nippreparaw għal kapaċità High fiċ-Ċibersigurtà u qed intejbu s-salvagwardji tagħna fid-dominju ċibernetiku u naħdmu biex niżguraw li d-difensuri jkunu jistgħu jibbenefikaw minn dawn il-kapaċitajiet imtejba permezz ta’ programmi bħal Aardvark.

Meta nedejna GPT‑5‑Codex, implimentajna monitoraġġ dedikat speċifiku għaċ-ċibersigurtà biex nidentifikaw u nfixklu attività malizzjuża. Filwaqt li ma osservajniex żieda sinifikanti f’abbuż fuq skala, qed nippreparaw mitigazzjonijiet addizzjonali għal kapaċitajiet avvanzati. It-timijiet tagħna diġà fixklu operazzjonijiet ċibernetiċi li kienu qed jippruvaw jużaw ħażin il-mudelli tagħna, u attività suspettuża tintbagħat għar-reviżjoni permezz tas-sistemi tagħna ta’ monitoraġġ tal-politiki.

Codex huwa mfassal biex jaħdem f’sandbox sigur awtomatikament: il-kitba tal-fajls hija limitata għall-workspace tiegħu, u l-aċċess għan-network huwa diżattivat sakemm żviluppatur ma jixgħelux. Nirrakkomandaw li Codex jinżamm f’dan il-mod ta’ aċċess ristrett, billi l-attivazzjoni tal-internet jew tat-tiftix fuq il-web tista’ tintroduċi riskji ta’ prompt-injection minn kontenut mhux affidabbli.

Hekk kif Codex isir aktar kapaċi f’kompiti fit-tul, isir dejjem aktar importanti li l-iżviluppaturi jirrevedu x-xogħol tal-aġent qabel jagħmlu bidliet jew jimplimentaw fil-produzzjoni. Biex jgħin f’dan, Codex jipproduċi logs tat-terminal u jiċċita s-sejħiet tal-għodod u r-riżultati tat-testijiet tiegħu. Filwaqt li r-reviżjonijiet tal-kodiċi tiegħu jnaqqsu r-riskju li bugs prodotti mill-mudell jew mill-bniedem jiġu implimentati fil-produzzjoni, Codex għandu jiġi trattat bħala reviżur addizzjonali u mhux sostitut għar-reviżjonijiet umani.

Il-kapaċitajiet taċ-ċibersigurtà jistgħu jintużaw kemm għad-difiża kif ukoll għall-attakk, għalhekk nieħdu approċċ ta’ implimentazzjoni iterattiv: nitgħallmu mill-użu fid-dinja reali, naġġornaw is-salvagwardji, u nippreservaw għodod difensivi importanti bħall-iskannjar awtomatizzat tal-vulnerabbiltajiet u assistenza fir-rimedjazzjoni.

Disponibbiltà

GPT‑5.1‑Codex‑Max huwa disponibbli f’Codex ma’ pjanijiet ChatGPT Plus, Pro, Business, Edu, u Enterprise. Għad-dettalji dwar kif jaħdmu l-limiti tal-użu għall-pjan tiegħek, jekk jogħġbok ara d-docs(jinfetaħ f’tieqa ġdida) tagħna.

Għall-iżviluppaturi li jużaw Codex CLI permezz ta’ API key, qed nippjanaw li dalwaqt nagħmlu GPT‑5.1‑Codex‑Max disponibbli fl-API.

Mill-lum, GPT‑5.1‑Codex‑Max se jieħu post GPT‑5.1‑Codex bħala l-mudell awtomatiku fl-uċuħ ta’ Codex. B’differenza minn GPT‑5.1, li huwa mudell għal skop ġenerali, nirrakkomandaw li GPT‑5.1‑Codex‑Max u l-familja Codex ta’ mudelli jintużaw biss għal kompiti ta’ kodifikar aġentiku f’Codex jew f’ambjenti simili għal Codex.

Konklużjoni

GPT‑5.1‑Codex‑Max juri kemm il-mudelli avvanzaw biex iżommu kompiti ta’ kodifikar fuq meded twal, jimmaniġġjaw flussi tax-xogħol kumplessi, u jipproduċu implimentazzjonijiet ta’ kwalità għolja b’ħafna inqas tokens. Rajna l-mudell flimkien ma’ titjib kostanti fil-CLI tagħna, l-estensjoni tal-IDE, l-integrazzjoni mal-cloud, u l-għodod għar-reviżjoni tal-kodiċi jwasslu għal produttività fl-inġinerija mtejba ferm: internament, 95% tal-inġiniera ta’ OpenAI jużaw Codex kull ġimgħa, u dawn l-inġiniera jibagħtu madwar 70% aktar talbiet ta' pull minn meta adottaw Codex. Hekk kif inkomplu nimbuttaw il-fruntiera ta’ dak li l-aġenti jistgħu jagħmlu, aħna eċċitati naraw x’se tibnu bihom.

Appendiċi: Evalwazzjonijiet tal-mudell

GPT‑5.1‑Codex (high)

GPT‑5.1‑Codex‑Max (xhigh)

SWE-bench Verified (n=500)

73.7%

77.9%

SWE-Lancer IC SWE

66.3%

79.9%

Terminal-Bench 2.0

52.8%

58.1%

Awtur

OpenAI