12. veebruar 2026

Tutvustame GPT‑5.3‑Codex‑Spark

Ülikiire mudel reaalajas kodeerimiseks Codexis.

Laadimine…

Täna avaldame uurimiseelvaate GPT‑5.3‑Codex‑Sparkist, mis on väiksem versioon GPT‑5.3‑Codexist ja meie esimene mudel, mis on loodud reaalajas kodeerimiseks. Codex-Spark on optimeeritud tunduma peaaegu hetkega—pakkudes 15x kiiremat genereerimiskiirust, olles samal ajal väga võimekas reaalmaailma kodeerimisülesannete jaoks.

Codex-Spark tähistab esimest verstaposti meie partnerluses Cerebrasega, mille teatasime jaanuaris. Jagame Codex-Spark'i ChatGPT Pro kasutajatele uurimiseelvaatena, et arendajad saaksid varakult katsetama hakata, samal ajal kui töötame koos Cerebrasega, et suurendada andmekeskuse võimekust, tugevdada terviklikku otsast lõpuni kogemust ja juurutada meie suuremat tipptasemel mudelit.

Meie uusimad tipptasemel mudelid on näidanud erilisi tugevusi oma võimes täita pikalt kestvaid ülesandeid, töötades autonoomselt tunde, päevi või nädalaid ilma sekkumiseta. Codex-Spark on meie esimene mudel, mis on loodud spetsiaalselt Codexiga reaalajas töötamiseks – tehes sihipäraseid muudatusi, loogikat ümber kujundades või liideseid viimistledes ning tulemusi kohe nähes. Codex-Sparkiga toetab Codexi perekond nüüd nii pikaajalisi, ambitsioonikaid ülesandeid kui ka töö tegemist hetkel. Loodame õppida sellest, kuidas arendajad seda kasutavad, ja kaasata tagasisidet, kui jätkame juurdepääsu laiendamist.

Käivitamisel on Codex-Sparkil 128k kontekstiaken ja see on ainult tekstipõhine. Uurimistöö eelvaate ajal on Codex-Sparkil omaenda kiiruspiirangud ja kasutus ei lähe standardsete kiiruspiirangute arvestusse. Kui nõudlus on aga suur, võid näha aeglasemat juurdepääsu või ajutist järjekorda, kuna tasakaalustame kasutajate vahel usaldusväärsust.

Kiirus ja intelligentsus

Codex-Spark on optimeeritud interaktiivseks tööks, kus viivitus on sama oluline kui intelligentsus. Saad mudeliga töötada nagu reaalajas koostööpartneriga – katkesta või suuna see ümber töötamise ajal ning itereeri kiiresti, ootamata, et juurutamine lõpule jõuaks. Kuna see on häälestatud kiirusele, hoiab Codex-Spark oma vaikimisi tööstiili kerge: see teeb minimaalseid, sihitud muudatusi ega käivita teste automaatselt, kui sa seda ei palu.

Kodeerimine

Codex-Spark on väga võimekas väike mudel, mis on optimeeritud kiireks järeldamiseks. SWE-Bench Pro ja Terminal-Bench 2.0, kaks agentse tarkvaratehnika võimekust hindavat võrdlusalust, GPT‑5.3‑Codex‑Spark jääb alla GPT‑5.3‑Codex, kuid suudab ülesande täita murdosa ajast.

Kestus on hinnanguliselt (1) väljundi genereerimise aja (väljundtokenid ÷ proovivõtukiirus), (2) eeltäitmise aja (eeltäitmistokenid ÷ eeltäitmiskiirus), (3) tööriistade kogukäitamisaja ja (4) võrgu kogukulu summa.

latentsuse parandused kõikidele mudelitele

Kui me treenisime Codex-Spark'i, sai selgeks, et mudeli kiirus oli reaalajas koostöö jaoks vaid osa võrrandist – meil oli vaja vähendada ka latentsust kogu päring-vastus torustikus. Rakendasime oma süsteemis otsast lõpuni latentsuse parandusi, millest saavad kasu kõik mudelid. Kapoti all lihtsustasime, kuidas vastused voogedastuvad kliendist serverisse ja tagasi, kirjutasime ümber oma järeldusvirna võtmeosad ning töötasime ümber selle, kuidas seansse initsialiseeritakse, et esimene nähtav token ilmuks varem ja Codex püsiks reageeriv, kui sa iteratsioonide käigus edasi arendad. Püsiva WebSocket-ühenduse kasutuselevõtu ja Responses API-s tehtud sihipäraste optimeerimiste abil vähendasime kliendi/serveri edasi-tagasi päringu kohta tekkivat lisakulu 80%, iga tokeni kohta tekkivat lisakulu 30% ja aega esimese tokenini 50%. Ükskõik millise mudeli sa valid, koged kogu Codexi kogemuse ulatuses tihedamat tsüklit.

Cerebras toetab

Codex-Spark töötab Cerebrasi Wafer Scale Engine 3⁠(avaneb uues aknas) – spetsiaalselt loodud tehisintellekti kiirendil kiireks järeldamiseks, mis annab Codexile latentsusajale keskenduva teeninduskihi. Tegime koostööd Cerebrasiga, et lisada see madala latentsusajaga tee samasse tootmiskasutuse teenindusvirna nagu ülejäänud meie pargis, nii et see töötab sujuvalt Codexi kaudu ja valmistab meid ette tulevaste mudelite toetamiseks.

„Mis meid kõige rohkem erutab GPT-5.3-Codex-Spark'i juures, on partnerlus OpenAI ja arendajate kogukonnaga, et avastada, mida kiire järeldamine võimalikuks teeb – uued suhtlusmustrid, uued kasutusjuhud ja põhimõtteliselt teistsugune mudelikogemus. See eelvaade on alles algus,“

Sean Lie, Cerebrase tehnoloogiajuht (CTO) ja kaasasutaja

GPU-d jäävad meie koolitus- ja järeldusprotsesside aluseks ning pakuvad laialdaseks kasutamiseks kõige kulutõhusamaid tokeneid. Cerebras täiendab seda alust, paistes silma töövoogudes, mis nõuavad ülimadalat latentsust, pingutades otsast lõpuni tsüklit, nii et Codex tundub iteratsioonide käigus vastuvõtlikum.

Kättesaadavus ja üksikasjad

Codex-Spark käivitatakse täna uurimiseelvaatena kõigile ChatGPT Pro kasutajatele Codexi rakenduse, CLI ja VS Code'i laienduse uusimates versioonides. Kuna see töötab spetsiaalsel madala latentsusega riistvaral, reguleerib kasutamist eraldi sageduspiirang, mis võib uurimisvaate eelvaate ajal nõudluse põhjal kohanduda. Lisaks teeme Codex-Sparki API-s kättesaadavaks väikesele hulgale disainipartneritele, et mõista, kuidas arendajad soovivad Codex-Sparki oma toodetesse integreerida. Me laiendame juurdepääsu lähinädalatel, kui jätkame oma integratsiooni häälestamist reaalsete töökoormuste all.

Codex-Spark on praegu ainult tekstipõhine 128k konteksti aknaga ja on esimene ülikiires mudelite perekonnas. Kui me arendajakogukonnaga rohkem teada saame, kus kiired mudelid kodeerimisel silma paistavad, tutvustame veelgi rohkem võimalusi – sealhulgas suuremaid mudeleid, pikemaid kontekstiaknaid ja multimodaalset sisendit.

Codex-Spark sisaldab sama ohutuskoolitust nagu meie põhimudelid, sealhulgas küberalast koolitust. Hindasime Codex-Spark'i osana meie standardsest juurutusprotsessist, mis hõlmab küberturvalisuse ja muude võimekuste baasjoone hindamisi, ning jõudsime järeldusele, et sellel ei ole usutavat võimalust jõuda meie Valmisoleku raamistiku künniseni, et saavutada küberturvalisuses kõrge võimekus.

Mis järgmiseks

Codex-Spark on esimene samm Codexi suunas, millel on kaks teineteist täiendavat režiimi: pikema horisondiga arutlus ja teostamine ning reaalajas koostöö kiireks iteratsiooniks. Aja jooksul sulanduvad režiimid – Codex võib hoida sind tihedas interaktiivses tsüklis, samal ajal delegeerides pikemalt kestva töö taustal alamagentidele või jagades ülesanded laiali paljudele mudelitele paralleelselt, kui soovid laia haaret ja kiirust, nii et sa ei pea kohe alguses valima üht kindlat režiimi.

Kui mudelid muutuvad võimekamaks, muutub suhtluse kiirus selgeks kitsaskohaks. Ülikiire järeldamine pingutab seda ahelat, muutes Codexi kasutamise loomulikumaks ja laiendades võimalusi kõigile, kes muudavad idee toimivaks tarkvaraks.