Preskočite na glavno vsebino
OpenAI

12. februar 2026

IzdelekIzdajaPodjetje

Predstavljamo GPT‑5.3‑Codex‑Spark

Izjemno hiter model za kodiranje v realnem času v Codexu.

Nalaganje …

Danes objavljamo raziskovalni predogled modela GPT‑5.3‑Codex‑Spark, manjše različice GPT‑5.3‑Codex, in našega prvega modela, zasnovanega za kodiranje v realnem času. Codex-Spark predstavlja prvi mejnik v našem partnerstvu s Cerebrasom, ki smo ga napovedali januarja. Codex-Spark je optimiziran tako, da deluje skoraj takoj, kadar se izvaja na strojni opremi z izjemno nizko zakasnitvijo, saj zagotavlja več kot 1000 žetonov na sekundo, hkrati pa ostaja zelo zmogljiv za dejanske naloge kodiranja.

Codex-Spark na Cerebrasu delimo kot raziskovalni predogled uporabnikom ChatGPT Pro, da lahko razvijalci začnejo zgodaj eksperimentirati, medtem ko z družbo Cerebras sodelujemo pri povečevanju zmogljivosti podatkovnih centrov, utrjevanju uporabniške izkušnje od začetka do konca in uvajanju naših večjih naprednih modelov.

Naši najnovejši napredni modeli so pokazali posebne prednosti pri sposobnosti izvajanja dolgotrajnih nalog, saj lahko delujejo avtonomno več ur, dni ali tednov brez posredovanja. Codex-Spark je naš prvi model, zasnovan posebej za delo s Codexom v realnem času, saj omogoča ciljno urejanje, preoblikovanje logike ali izpopolnjevanje uporabniških vmesnikov ter takojšnje prikazovanje rezultatov. S Codex-Sparkom bo Codex podpiral tako dolgotrajne, ambiciozne naloge kot tudi opravljanje dela v trenutku. Upamo, da se bomo iz tega, kako ga razvijalci uporabljajo, učili in vključili povratne informacije, medtem ko še naprej širimo dostop.

Ob lansiranju ima Codex-Spark kontekstno okno 128k in je samo besedilo. Med raziskovalnim predogledom bo imel Codex-Spark svoje omejitve hitrosti, uporaba pa se ne bo štela v standardne omejitve hitrosti. Vendar pa lahko ob velikem povpraševanju opazite omejen dostop ali začasno čakanje v vrsti, ko uravnotežujemo zanesljivost med uporabniki.

Hitrost in inteligenca

Codex-Spark je optimiziran za interaktivno delo, pri katerem je zakasnitev enako pomembna kot inteligenca. Z modelom lahko sodelujete v realnem času, ga med delom prekinjate ali preusmerjate ter hitro iterirate s skoraj takojšnjimi odgovori. Ker je prilagojen za hitrost, Codex-Spark ohranja svoj privzeti delovni slog lahek: izvaja minimalne, ciljno usmerjene popravke in samodejno ne izvaja testov, razen če to od njega zahtevate.

Programiranje

Codex-Spark je zelo zmogljiv majhen model, optimiziran za hitro sklepanje. Na merilih SWE-Bench Pro in Terminal-Bench 2.0 za ocenjevanje agentskih zmožnosti programskega inženirstva, GPT‑5.3‑Codex‑Spark izkazuje močno zmogljivost, hkrati pa opravi naloge v delčku časa v primerjavi z GPT‑5.3‑Codex.

Trajanje je ocenjeno kot vsota (1) časa generiranja izhoda (izhodiščni žetoni ÷ hitrost vzorčenja), (2) časa predizpolnjevanja (predizpolnjevalni žetoni ÷ hitrost predizpolnjevanja), (3) skupnega časa izvajanja orodij in (4) skupnega omrežnega režijskega časa.

Izboljšave latentnosti za vse modele

Med učenjem Codex-Sparka se je pokazalo, da je hitrost modela le del enačbe za sodelovanje v realnem času, potrebovali smo tudi zmanjšanje zakasnitve v celotnem cevovodu zahtevka in odziva. V našem ogrodju smo uvedli izboljšave zakasnitve od začetka do konca, ki bodo koristile vsem modelom. V ozadju smo poenostavili, kako se odzivi pretočno prenašajo od odjemalca do strežnika in nazaj, prepisali ključne dele našega sklada za inferenco in prenovili način inicializacije sej, tako da se prvi vidni žeton prikaže prej in Codex ostane odziven, ko iterirate. Z uvedbo trajne povezave WebSocket in ciljnimi optimizacijami znotraj Responses API smo zmanjšali režijo na povratno pot odjemalec/strežnik za 80 %, režijo na žeton za 30 % in čas do prvega žetona za 50 %. Pot WebSocket je za Codex-Spark privzeto omogočena in bo kmalu postala privzeta za vse modele.

Poganja ga Cerebras

Codex-Spark deluje na Cerebrasovem Wafer Scale Engine 3(odpre se v novem oknu)—namensko zasnovanem pospeševalniku umetne inteligence za visokohitrostno sklepanje, ki Codexu zagotavlja strežniški sloj, osredotočen na nizko zakasnitev. Vzpostavili smo partnerstvo s podjetjem Cerebras, da bi to pot z nizko zakasnitvijo dodali v isti produkcijski strežniški sklad kot preostali del našega sistema, tako da deluje brezhibno v Codexu in nas pripravi na podporo prihodnjim modelom.

"Kar nas pri GPT-5.3-Codex-Spark najbolj navdušuje, je partnerstvo z OpenAI in skupnostjo razvijalcev, da odkrijemo, kaj omogoča hitro sklepanje—nove vzorce interakcije, nove primere uporabe in temeljno drugačno izkušnjo z modelom. Ta predogled je šele začetek."
— Sean Lie, glavni tehnološki direktor in soustanovitelj podjetja Cerebras

Grafične procesne enote (GPU-ji) ostajajo temeljne v naših cevovodih učenja in inference ter zagotavljajo stroškovno najučinkovitejše žetone za široko uporabo. Cerebras dopolnjuje to osnovo, saj se odlikuje pri delovnih tokovih, ki zahtevajo izjemno nizko zakasnitev, in skrajšuje zanko od začetka do konca, tako da je Codex pri iteriranju bolj odziven. Grafične procesne enote in Cerebras se lahko za posamezne delovne obremenitve kombinirajo, da se doseže najboljše delovanje.

Razpoložljivost in podrobnosti

Codex-Spark se danes uvaja kot raziskovalni predogled za uporabnike ChatGPT Pro v najnovejših različicah aplikacije Codex, vmesnika z ukazno vrstico (CLI) in razširitve za VS Code. Ker deluje na specializirani strojni opremi z nizko zakasnitvijo, njegovo uporabo ureja ločena omejitev hitrosti, ki se lahko med raziskovalnim predogledom prilagaja glede na povpraševanje. Poleg tega Codex-Spark dajemo na voljo v aplikacijskem programskem vmesniku (API) za manjšo skupino oblikovalskih partnerjev, da bi razumeli, kako želijo razvijalci Codex-Spark vključiti v svoje produkte. Dostop bomo v prihodnjih tednih širili, medtem ko bomo še naprej prilagajali našo integracijo pri dejanskih delovnih obremenitvah.

Codex-Spark je trenutno samo besedilni pri 128k oknu za kontekst in je prvi v družini izjemno hitrih modelov. Ko bomo skupaj s skupnostjo razvijalcev izvedeli več o tem, kje hitri modeli izstopajo pri kodiranju, bomo uvedli še več zmogljivosti–vključno z večjimi modeli, daljšimi dolžinami sobesedila in multimodalnim vnosom.

Codex-Spark vključuje enako varnostno učenje kot naši osrednji modeli, vključno z učenjem, ki je povezano s kibernetsko varnostjo. Codex-Spark smo evalvirali kot del našega standardnega postopka uvajanja, ki vključuje izhodiščne evalvacije za kibernetsko varnost in druge zmožnosti, ter ugotovili, da nima verjetne možnosti doseči praga Okvira pripravljenosti za visoko stopnjo zmogljivosti na področju kibernetske varnosti ali biologije.

Kaj naprej

Codex-Spark je prvi korak k Codexu z dvema komplementarnima načinoma: dolgoročnejše sklepanje in izvajanje ter sodelovanje v realnem času za hitro ponovitev. Sčasoma se bodo načini prepletli—Codex vas lahko ohranja v tesnem interaktivnem krogu, medtem ko daljše delo delegira pod-agentom v ozadju, ali pa razprši naloge na številne modele vzporedno, ko želite širino in hitrost, tako da vam ni treba vnaprej izbrati enega samega načina.

Ko modeli postajajo vse bolj sposobni, postaja hitrost interakcije očitno ozko grlo. Izjemno hitro sklepanje zategne to zanko, zaradi česar je Codex bolj naraven za uporabo in širi meje mogočega za vsakogar, ki zamisel spreminja v delujočo programsko opremo.

Avtor

OpenAI