Ma elérhetővé tesszük a GPT‑5.3‑Codex‑Spark kutatási előzetesét, amely a GPT‑5.3‑Codex kisebb verziója, és az első modellünk, amelyet valós idejű kódoláshoz terveztünk. A Codex-Spark-ot úgy optimalizáltuk, hogy szinte azonnalinak tűnjön — 15-ször gyorsabb generálási sebességet biztosít, miközben továbbra is rendkívül jól használható a valós kódolási feladatokhoz.
A Codex-Spark jelenti a Cerebras-szal való partnerségünk első mérföldkövét, amelyet januárban jelentettünk be. A Codex-Spark-ot a ChatGPT Pro felhasználóival kutatási előnézetként osztjuk meg, hogy a fejlesztők már korán elkezdhessenek kísérletezni, miközben a Cerebras-szal együtt azon dolgozunk, hogy növeljük az adatközponti kapacitást, megerősítsük a végponttól végpontig tartó élményt, és üzembe helyezzük a nagyobb, élvonalbeli modellünket.
A legújabb, élvonalbeli modelljeink különösen erősek a hosszútávú feladatok elvégzésében, képesek órákon, napokon vagy heteken át önállóan dolgozni beavatkozás nélkül. A Codex-Spark az első modellünk, amelyet kifejezetten a Codex-szel való valós idejű munkára terveztünk—célzott szerkesztések végrehajtására, a logika átalakítására vagy a felületek finomítására, és az eredmények azonnali megtekintésére. A Codex-Spark segítségével a Codex-család most már támogatja mind a hosszútávú, ambiciózus feladatokat, mind a pillanatnyi munkavégzést. Reméljük, hogy tanulhatunk abból, hogyan használják a fejlesztők, és beépíthetjük a visszajelzéseket, miközben folyamatosan bővítjük a hozzáférést.
Az induláskor a Codex-Spark 128k kontextusablakkal rendelkezik, és csak szöveges formátumú. A kutatási előnézet esetén a Codex-Spark saját sebességkorlátokkal rendelkezik, és a használat nem számít bele a szokásos sebességkorlátokba. Azonban, amikor sokan keresik fel, előfordulhat, hogy lassabban fogsz hozzáférni vagy átmenetileg hosszabb lesz a várakozási idő, miközben a felhasználók között egyensúlyozzuk a megbízhatóságot.
A Codex-Spark-ot interaktív munkára optimalizáltuk, ahol a késleltetés ugyanolyan fontos, mint az intelligencia. A modellel úgy dolgozhatsz, mint egy valós idejű együttműködővel—munka közben megszakíthatod vagy más irányba terelheted, és gyorsan ismételhetsz anélkül, hogy meg kellene várnod a bevezetés befejezését. A Codex-Spark alapértelmezett munkastílusa - mivel a sebességre optimalizáltuk - könnyed marad: minimális, célzott szerkesztéseket végez, és nem futtat teszteket automatikusan, hacsak nem kéred.
A Codex-Spark egy rendkívül fejlett, kis modell, amelyet gyors következtetésre optimalizáltunk. A SWE-Bench Pro és a Terminal-Bench 2.0 a két mérce, amelyek az ügynöki szoftvermérnöki képességet értékelik, és a GPT‑5.3‑Codex‑Spark alulteljesít a GPT‑5.3‑Codex‑hez képest, de a feladatot az idő töredéke alatt is képes elvégezni.
Az időtartamot a következők összegével becsüljük meg: (1) kimenetgenerálási idő (kimeneti tokenek ÷ mintavételi sebesség), (2) előtöltési idő (előtöltési tokenek ÷ előtöltési sebesség), (3) az eszközök teljes végrehajtási ideje, és (4) a teljes hálózati többletterhelés.
Miközben betanítottuk a Codex-Spark-ot, nyilvánvalóvá vált, hogy a modell sebessége csak egy része az egyenletnek a valós idejű együttműködéshez—csökkentenünk kellett a késleltetést a teljes kérés-válasz folyamatláncban. Végponttól végpontig terjedő késleltetésjavításokat vezettünk be a rendszerünkben, amelyek mindegyik modell számára előnyösek. A rendszer tökéletesítése során leegyszerűsítettük a válaszok kliens és szerver közötti áramlását, átírtuk a következtetési verem kulcsfontosságú részeit, és átdolgoztuk a munkamenetek inicializálását, hogy az első látható token hamarabb jelenjen meg, és a Codex válaszra kész maradjon az ismétlés során. Egy tartós WebSocket-kapcsolat bevezetésével és a Responses API-n belüli célzott optimalizálásokkal 80%-kal csökkentettük a kliens/szerver körutankénti többletterhelést, 30%-kal a tokenenkénti többletterhelést, és 50%-kal a time-to-first-token idejét. Bármelyik modellt is választod, a Codex teljes használata során szorosabb integrációt fogsz tapasztalni.
A Codex-Spark a Cerebras Wafer Scale Engine 3(új ablakban nyílik meg) rendszerén fut—egy AI-gyorsító, amely célzottan nagy sebességű következtetést biztosít, és a Codex számára egy késleltetés-első kiszolgálási réteget nyújt. Együttműködünk a Cerebras-szal, hogy ezt az alacsony késleltetésű útvonalat ugyanabba az éles kiszolgálási környezetbe integráljuk, mint a flottánk többi részét, így zökkenőmentesen működik a Codex-szel, és felkészít minket a jövőbeli modellek támogatására.
"Ami a leginkább lelkesít minket a GPT-5.3-Codex-Spark kapcsán, az az OpenAI-val és a fejlesztői közösséggel való együttműködés, hogy felfedezzük, mit tesz lehetővé a gyors következtetés: új interakciós mintákat, új felhasználási eseteket és egy alapvetően különböző modellélményt. Ez az előnézet még csak a kezdet."
A GPU-k továbbra is alapvető szerepet játszanak a betanítási és következtetési folyamatainkban, és a legköltséghatékonyabb tokeneket biztosítják széles körű felhasználásra. A Cerebras kiegészíti ezt az alapot azzal, hogy kiemelkedően teljesít az extrém alacsony késleltetést igénylő munkafolyamatokban, szorosabbra fűzve a végponttól végpontig tartó ciklust, így a Codex válaszra készebbnek tűnik ismétléskor.
A Codex-Spark kutatási előnézetként ma válik elérhetővé a ChatGPT Pro felhasználói számára a Codex alkalmazás, a CLI és a VS Code bővítmény legújabb verzióiban. Mivel speciális, alacsony késleltetésű hardveren fut, a használatot egy külön kvótakorlát szabályozza, amely a kutatási előnézet esetén a kereslet függvényében módosulhat. Ezenkívül a Codex-Spark-ot elérhetővé tesszük az API-ban egy szűk körű dizájnpartner-csoport számára, hogy megértsük, hogyan szeretnék a fejlesztők integrálni a Codex-Spark-ot a termékeikbe. A következő hetekben bővíteni fogjuk a hozzáférést, miközben valós terhelések alatt tovább finomítjuk az integrációkat.
A Codex-Spark jelenleg csak szöveges formátumban érhető el egy 128k kontextusablakkal, és az első az ultragyors modellek családjában. Ahogy a fejlesztői közösséggel egyre többet megtudunk arról, hogy a gyors modellek melyik területeken teljesítenek kiemelkedően a kódolásban, még több funkciót fogunk bevezetni – beleértve a nagyobb modelleket, a hosszabb kontextusokat és a multimodális bemenetet.
A Codex-Spark ugyanazt a biztonsági képzést nyújtja, mint a fő modelljeink, beleértve az internettel kapcsolatos képzést is. A szokásos bevezetési folyamatunk részeként értékeltük a Codex-Spark-ot, az értékelés magában foglalja a kiberbiztonsági és egyéb képességek alapértékeléseit, és megállapítottuk, hogy nincs reális esélye elérni a Felkészültségi keretrendszerünk kiberbiztonságra vonatkozó magas képességi küszöbértékét.
A Codex-Spark az első lépés egy két, egymást kiegészítő móddal rendelkező Codex felé: hosszútávú érvelés és végrehajtás, valamint valós idejű együttműködés a gyors ismétlés érdekében. Idővel a módok össze fognak fonódni— a Codex szoros, interaktív körben tarthat, miközben a hosszabb ideig futó munkát a háttérben segédügynökre bízza, vagy a feladatokat több modellre osztja szét párhuzamosan, amikor szélességet és sebességet szeretnél, így nem kell előre egyetlen módot választanod.
Ahogy a modellek egyre fejlettebbé válnak, az interakció sebessége egyértelmű, szűk keresztmetszetté válik. Az ultragyors következtetés szorosabbra zárja ezt a kört, természetesebbé teszi a Codex használatát, és bővíti a lehetőségeket mindazok számára, akik egy ötletből egy működő szoftvert szeretnének létrehozni.


