Aqbeż għall-kontenut prinċipali
OpenAI

12 ta’ Frar 2026

ProdottRilaxxKumpanija

Nintroduċu GPT‑5.3‑Codex‑Spark

Mudell ultra-veloċi għall-kodifikazzjoni f’ħin reali f’Codex.

Qed jillowdja…

Illum, qed noħorġu research preview ta’ GPT‑5.3‑Codex‑Spark, verżjoni iżgħar ta’ GPT‑5.3‑Codex, u l-ewwel mudell tagħna mfassal għall-kodifikazzjoni f’ħin reali. Codex-Spark jimmarka l-ewwel pass ewlieni fis-sħubija tagħna ma’ Cerebras, li ħabbarna f’Jannar. Codex-Spark huwa ottimizzat biex iħossu kważi istantanji meta jiġi servut fuq ħardwer b’latenza ultra-baxxa—u jwassal aktar minn 1000 token kull sekonda filwaqt li jibqa’ kapaċi ħafna għal kompiti ta’ kodifikazzjoni fid-dinja reali.

Qegħdin naqsmu Codex-Spark fuq Cerebras bħala research preview għall-utenti ta’ ChatGPT Pro sabiex l-iżviluppaturi jkunu jistgħu jibdew jesperimentaw kmieni waqt li naħdmu ma’ Cerebras biex inżidu l-kapaċità tad-datacenter, insaħħu l-esperjenza tal-utent minn tarf sa tarf, u nħaddmu l-mudelli fruntiera akbar tagħna.

L-aktar mudelli fruntiera reċenti tagħna wrew saħħiet partikolari fil-kapaċità tagħhom li jwettqu kompiti fit-tul, jaħdmu b’mod awtonomu għal sigħat, jiem jew ġimgħat mingħajr intervent. Codex-Spark huwa l-ewwel mudell tagħna mfassal speċifikament biex jaħdem ma’ Codex f’ħin reali—jagħmel edits immirati, jibdel il-loġika, jew jirfina interfaces u jara r-riżultati minnufih. B’Codex-Spark, Codex issa jappoġġa kemm kompiti ambizzjużi u fit-tul kif ukoll li twettaq ix-xogħol fil-mument. Nittamaw li nitgħallmu minn kif l-iżviluppaturi jużawh u ninkorporaw il-feedback hekk kif inkomplu nespandu l-aċċess.

Mat-tnedija, Codex-Spark għandu tieqa ta’ kuntest ta’ 128k u huwa test-only. Matul ir-research preview, Codex-Spark se jkollu l-limiti tar-rata tiegħu stess u l-użu mhux se jingħadd mal-limiti standard tar-rata. Madankollu, meta d-domanda tkun għolja, tista’ tara aċċess limitat jew kju temporanju waqt li nibbilanċjaw l-affidabbiltà bejn l-utenti.

Veloċità u intelliġenza

Codex-Spark huwa ottimizzat għal xogħol interattiv fejn il-latenza tgħodd daqs l-intelliġenza. Tista’ tikkollabora mal-mudell f’ħin reali, twaqqfu jew tidderiġih mill-ġdid waqt li jkun qed jaħdem, u ttenni malajr b’tweġibiet kważi istantanji. Minħabba li huwa rfinat għall-veloċità, Codex-Spark iżomm l-istil tax-xogħol awtomatiku tiegħu ħafif: jagħmel edits minimi u mmirati u ma jħaddimx testijiet awtomatikament sakemm ma titolbux.

Kodifikazzjoni

Codex-Spark huwa mudell żgħir kapaċi ħafna u ottimizzat għal inferenza veloċi. Fuq SWE-Bench Pro u Terminal-Bench 2.0, żewġ benchmarks li jevalwaw il-kapaċità ta’ inġinerija tas-software aġentika, GPT‑5.3‑Codex‑Spark juri prestazzjoni qawwija filwaqt li jwettaq il-kompiti f’frazzjoni tal-ħin meta mqabbel ma’ GPT‑5.3‑Codex.

It-tul huwa stmat bħala s-somma ta’ (1) il-ħin tal-ġenerazzjoni tal-output (tokens tal-output ÷ veloċità tal-kampjunar), (2) il-ħin tal-prefill (tokens tal-prefill ÷ veloċità tal-prefill), (3) il-ħin totali tal-eżekuzzjoni tal-għodod, u (4) l-overhead totali tan-netwerk.

Titjib fil-latenza għall-mudelli kollha

Hekk kif ħarriġna Codex-Spark, sar evidenti li l-veloċità tal-mudell kienet biss parti mill-ekwazzjoni għall-kollaborazzjoni f’ħin reali—kellna bżonn innaqqsu wkoll il-latenza tul il-pipeline kollu tat-talba u t-tweġiba. Implimentajna titjib fil-latenza minn tarf sa tarf fil-harness tagħna li se jibbenefika lill-mudelli kollha. Fil-qalba tas-sistema, issimplifikajna kif it-tweġibiet jixxandru mill-klijent għas-server u lura, ktibna mill-ġdid partijiet ewlenin tal-inference stack tagħna, u erġajna ħdimna kif jiġu inizjalizzati s-sessjonijiet biex l-ewwel token viżibbli jidher aktar kmieni u Codex jibqa’ reattiv hekk kif ttenni. Permezz tal-introduzzjoni ta’ konnessjoni WebSocket persistenti u ottimizzazzjonijiet immirati ġewwa Responses API, naqqasna l-overhead għal kull roundtrip bejn klijent u server b’80%, l-overhead għal kull token b’30%, u l-ħin sal-ewwel token b’50%. Il-passaġġ WebSocket huwa attivat għal Codex-Spark awtomatikament u dalwaqt se jsir l-awtomatiku għall-mudelli kollha.

Imħaddem minn Cerebras

Codex-Spark jaħdem fuq Wafer Scale Engine 3(jinfetaħ f’tieqa ġdida) ta’ Cerebras—accelerator tal-IA mibni apposta għal inferenza b’veloċità għolja li jagħti lil Codex livell ta’ servizz iffukat fuq il-latenza. Aħna ssieħebna ma’ Cerebras biex inżidu dan il-passaġġ b’latenza baxxa mal-istess production serving stack bħall-bqija tal-flotta tagħna, sabiex jaħdem bla xkiel f’Codex kollu u jħejjina biex nappoġġaw mudelli futuri.

“Dak li jqanqalna l-aktar dwar GPT-5.3-Codex-Spark huwa li nissieħbu ma’ OpenAI u mal-komunità tal-iżviluppaturi biex niskopru x’jagħmel possibbli inferenza veloċi—mudelli ġodda ta’ interazzjoni, każijiet ta’ użu ġodda, u esperjenza tal-mudell fundamentalment differenti. Din il-preview hija biss il-bidu.”
— Sean Lie, CTO u Ko-Fundatur ta’ Cerebras

Il-GPUs jibqgħu fundamentali tul il-pipelines tagħna tat-taħriġ u tal-inferenza u jwasslu l-aktar tokens kosteffettivi għal użu wiesa’. Cerebras jikkumplimenta dik il-bażi billi jeċċella f’workflows li jeħtieġu latenza estremament baxxa, u jissikka ċ-ċiklu minn tarf sa tarf biex Codex iħossu aktar reattiv hekk kif ttenni. GPUs u Cerebras jistgħu jingħaqdu għal workloads singoli biex tintlaħaq l-aħjar prestazzjoni.

Disponibbiltà u dettalji

Codex-Spark qed jibda joħroġ illum bħala research preview għall-utenti ta’ ChatGPT Pro fl-aħħar verżjonijiet tal-app Codex, CLI, u l-estensjoni ta’ VS Code. Minħabba li jaħdem fuq ħardwer speċjalizzat b’latenza baxxa, l-użu huwa regolat minn limitu separat tar-rata li jista’ jiġi aġġustat skont id-domanda matul ir-research preview. Barra minn hekk, qegħdin nagħmlu Codex-Spark disponibbli fl-API għal grupp żgħir ta’ sħab tad-disinn biex nifhmu kif l-iżviluppaturi jridu jintegraw Codex-Spark fil-prodotti tagħhom. Se nespandu l-aċċess fil-ġimgħat li ġejjin hekk kif inkomplu nirfinaw l-integrazzjoni tagħna taħt workloads reali.

Codex-Spark bħalissa huwa test-only b’tieqa ta’ kuntest ta’ 128k u huwa l-ewwel minn familja ta’ mudelli ultra-veloċi. Hekk kif nitgħallmu aktar mal-komunità tal-iżviluppaturi dwar fejn mudelli veloċi jispikkaw għall-kodifikazzjoni, se nintroduċu saħansitra aktar kapaċitajiet–inklużi mudelli akbar, tulijiet ta’ kuntest itwal, u input multimodali.

Codex-Spark jinkludi l-istess taħriġ tas-sikurezza bħall-mudelli ewlenin tagħna, inkluż taħriġ rilevanti għaċ-ċibersigurtà. Evalwajna Codex-Spark bħala parti mill-proċess standard tagħna ta’ deployment, li jinkludi evalwazzjonijiet bażiċi għaċ-ċibersigurtà u kapaċitajiet oħra, u ddeterminajna li m’għandux ċans plawsibbli li jilħaq il-limitu tal-Qafas tat-Tħejjija tagħna għal kapaċità għolja fiċ-ċibersigurtà jew fil-bijoloġija.

X’hemm imiss

Codex-Spark huwa l-ewwel pass lejn Codex b’żewġ modi komplementari: raġunament u eżekuzzjoni fuq orizzont itwal, u kollaborazzjoni f’ħin reali għal iterazzjoni rapida. Maż-żmien, il-modi se jitħalltu—Codex jista’ jżommok f’ċiklu interattiv strett filwaqt li jiddelega xogħol itwal lil sotto-aġenti fl-isfond, jew iqassam il-kompiti lil ħafna mudelli b’mod parallel meta trid firxa u veloċità, sabiex ma jkollokx għalfejn tagħżel mod wieħed mill-bidu.

Hekk kif il-mudelli jsiru aktar kapaċi, il-veloċità tal-interazzjoni ssir ostaklu ċar. Inferenza ultra-veloċi tissikka dak iċ-ċiklu, u tagħmel lil Codex iħossu aktar naturali biex tużah u tespandi dak li hu possibbli għal kull min ibiddel idea f’software li jaħdem.

Awtur

OpenAI