Preskočite na glavni sadržaj
OpenAI

Predstavljamo GPT‑5.3‑Codex‑Spark

Ultra-brzi model za kodiranje u stvarnom vremenu u Codexu.

Učitavanje…

Danas objavljujemo istraživački pregled GPT‑5.3‑Codex‑Spark, manje verzije GPT‑5.3‑Codex, i naš prvi model dizajniran za kodiranje u stvarnom vremenu. Codex-Spark je optimiziran da djeluje gotovo trenutno—omogućavajući 15 puta brže generiranje, a pritom ostaje vrlo sposoban za zadatke kodiranja u stvarnom svijetu.

Codex-Spark označava prvu prekretnicu u našem partnerstvu s kompanijom Cerebras, koje smo najavili u januaru. Dijelimo Codex-Spark kao istraživački pregled korisnicima ChatGPT Pro kako bi programeri mogli rano početi eksperimentirati dok radimo s Cerebrasom na povećanju kapaciteta podatkovnog centra, učvršćivanju cjelokupnog iskustva i implementaciji našeg većeg graničnog modela.

Naši najnoviji granični modeli pokazali su posebne prednosti u svojoj sposobnosti da obavljaju dugotrajne zadatke, radeći autonomno satima, danima ili sedmicama bez intervencije. Codex-Spark je naš prvi model dizajniran posebno za rad s Codexom u stvarnom vremenu—omogućavajući ciljane izmjene, preoblikovanje logike ili usavršavanje sučelja i trenutno vidjeti rezultate. Uz Codex-Spark, porodica Codex sada podržava kako dugotrajne, ambiciozne zadatke, tako i obavljanje posla u trenutku. Nadamo se da ćemo naučiti kako programeri koriste ovaj alat i uključiti njihove povratne informacije dok nastavljamo širiti pristup.

Pri lansiranju, Codex-Spark ima kontekstualni prozor od 128k i podržava samo tekst. Tokom istraživačkog pregleda, Codex-Spark će imati svoja vlastita ograničenja brzine, a korištenje se neće računati prema standardnim ograničenjima brzine. Međutim, kada je potražnja velika, možete primijetiti sporiji pristup ili privremeno čekanje dok usklađujemo pouzdanost među korisnicima.

Brzina i inteligencija

Codex-Spark je optimiziran za interaktivan rad u kojem je kašnjenje jednako važno kao i inteligencija. Možeš raditi s modelom gotovo kao sa saradnikom u stvarnom vremenu—prekini ga ili preusmjeri dok radi i brzo iteriraj bez čekanja da se implementacija završi. Budući da je optimiziran za brzinu, Codex-Spark zadržava svoj radni stil laganim po zadanim postavkama: pravi minimalne i ciljane izmjene te ne pokreće automatski testove osim ako to ne zatražite.

Kodiranje

Codex-Spark je vrlo sposoban mali model optimiziran za brzo izvođenje zaključaka. Na SWE-Bench Pro i Terminal-Bench 2.0, dva mjerila koja procjenjuju sposobnosti agentnog softverskog inženjeringa, GPT‑5.3‑Codex‑Spark zaostaje za GPT‑5.3‑Codex, ali može izvršiti zadatak u djeliću vremena.

Trajanje se procjenjuje kao zbroj (1) vremena generiranja izlaza (izlazni tokeni ÷ brzina uzorkovanja), (2) vremena popunjavanja (tokeni za popunjavanje ÷ brzina popunjavanja), (3) ukupnog vremena izvršavanja alata i (4) ukupnog mrežnog opterećenja.

Poboljšanja latencije za sve modele

Dok smo trenirali Codex-Spark, postalo je jasno da brzina modela predstavlja samo dio jednačine za saradnju u stvarnom vremenu—također smo morali smanjiti kašnjenje kroz cijeli zahtjev-odgovorni proces. Implementirali smo poboljšanja latencije od kraja do kraja u našem sistemu koja koriste svim modelima. Ispod haube, optimizirali smo način na koji se odgovori prenose od klijenta do servera i nazad, prepravili ključne dijelove našeg inferencijskog steka i prilagodili način inicijalizacije sesija kako bi se prvi vidljivi token pojavio ranije i kako bi Codex ostao responzivan dok vi iterirate. Uvođenjem trajne WebSocket veze i ciljanih optimizacija unutar Responses API-ja, smanjili smo režijski trošak po klijent/server putovanju za 80%, režijski trošak po tokenu za 30% i vrijeme do prvog tokena za 50%. Bez obzira koji model odabereš, doživjet ćeš čvršću petlju kroz cijelo Codex iskustvo.

Pokreće Cerebras

Codex-Spark radi na Cerebrasovom Wafer Scale Engine 3(otvara se u novom prozoru)—namjenskom AI akceleratoru za inferencu velike brzine koji Codexu omogućava sloj posluživanja s fokusom na nisku latentnost. Udružili smo se s Cerebrasom kako bismo dodali ovaj put s niskom latentnošću u isti produkcijski serving stack kao i ostatak naše flote, tako da radi besprijekorno u okviru Codexa i priprema nas za podršku budućim modelima.

„Ono što nas najviše uzbuđuje kod GPT-5.3-Codex-Spark-a je partnerstvo s OpenAI-jem i zajednicom programera kako bismo otkrili šta brzo zaključivanje omogućava - nove obrasce interakcije, nove slučajeve upotrebe i fundamentalno drugačije iskustvo modela.“ Ovaj pregled je tek početak.
— Sean Lie, CTO i suosnivač Cerebras

Grafički procesori (GPU-ovi) ostaju temeljni u našim procesima obuke i inferencije te isporučuju najisplativije tokene za široku upotrebu. Cerebras nadopunjuje tu osnovu ističući se u radnim tokovima koji zahtijevaju izuzetno nisku latenciju, zatežući petlju od početka do kraja kako bi Codex bio responzivniji dok iterirate.

Dostupnost i detalji

Codex-Spark se danas pokreće kao istraživački pregled za sve korisnike ChatGPT Pro u najnovijim verzijama aplikacije Codex, CLI-ja i ekstenzije za VS Code. Budući da se koristi specijalizirani hardver s niskom latencijom, korištenje je regulisano posebnim ograničenjem brzine koje se može prilagoditi na osnovu potražnje tokom istraživačkog pregleda. Osim toga, činimo Codex-Spark dostupnim u API-ju za mali broj dizajnerskih partnera kako bismo razumjeli na koji način programeri žele integrirati Codex-Spark u svoje proizvode. Proširit ćemo pristup u narednim sedmicama dok nastavljamo prilagođavati našu integraciju stvarnim radnim opterećenjima.

Codex-Spark je trenutno dostupan samo u tekstualnom obliku sa kontekstualnim prozorom od 128k i prvi je u porodici ultra-brzih modela. Kako budemo učili više s razvojnom zajednicom o tome gdje brzi modeli najbolje dolaze do izražaja za kodiranje, uvest ćemo još više mogućnosti–uključujući veće modele, duže kontekste i multimodalni unos.

Codex-Spark uključuje istu obuku o sigurnosti kao i naši glavni modeli, uključujući obuku relevantnu za kibernetičku sigurnost. Procijenili smo Codex-Spark kao dio našeg standardnog procesa implementacije, koji uključuje osnovne procjene za kibernetičke i druge sposobnosti, i utvrdili da nema vjerovatnu šansu da dostigne prag našeg Okvira pripravnosti za visok nivo sposobnosti u kibernetičkoj sigurnosti.

Šta je sljedeće

Codex-Spark je prvi korak ka Codexu s dva komplementarna načina: dugoročno rezonovanje i izvršavanje, te saradnja u stvarnom vremenu za brzu iteraciju. S vremenom će se načini rada spojiti—Codex vas može držati u tijesnoj interaktivnoj petlji dok delegira dugotrajnije zadatke pod-agentima u pozadini ili raspodjeljuje zadatke na mnoge modele paralelno kada želite širinu i brzinu, tako da ne morate unaprijed birati jedan način rada.

Kako modeli postaju sposobniji, brzina interakcije postaje očito usko grlo. Ultra-brza inferencija zateže taj krug, čineći da se Codex koristi prirodnije i proširujući mogućnosti za svakoga ko ideju pretvara u funkcionalan softver.

Autor

OpenAI