Ngenalake GPT‑5.3‑Codex‑Spark
Model super cepet kanggo coding real-time ing Codex.
Dina iki, kami ngluncurake pratayang riset GPT‑5.3‑Codex‑Spark, versi luwih cilik saka GPT‑5.3‑Codex, lan model pisanan saka kami sing dirancang kanggo coding real-time. Codex-Spark nandhani tonggak pisanan ing kemitraan kami karo Cerebras, sing kami umumake ing Januari. Codex-Spark dioptimalake supaya krasa meh instan nalika dilayani ing hardware latensi ultra-rendah—ngasilake luwih saka 1000 token per detik lan tetep banget mumpuni kanggo tugas coding nyata.
Kami nuduhake Codex-Spark ing Cerebras minangka pratayang riset kanggo pangguna ChatGPT Pro supaya developer bisa miwiti nyoba luwih awal nalika kami kerja bareng Cerebras kanggo nambah kapasitas datacenter, nguatake pengalaman pangguna end-to-end, lan masang model tercanggih kami sing luwih gedhe.
Model tercanggih paling anyar saka kami wis nuduhake kaunggulan tartamtu ing kemampuan nindakake tugas jangka dawa, kerja kanthi otonom nganti pirang-pirang jam, dina, utawa minggu tanpa intervensi. Codex-Spark yaiku model pisanan saka kami sing dirancang khusus kanggo kerja karo Codex kanthi real-time—nggawe suntingan sing ditargetake, mbentuk ulang logika, utawa nyaring antarmuka lan langsung ndeleng asil. Kanthi Codex-Spark, Codex saiki ndhukung tugas jangka dawa sing ambisius lan ngrampungake kerja nalika iku uga. Kami ngarep bisa sinau saka cara developer nggunakake lan nggabungake umpan balik nalika kami terus nggedhekake akses.
Nalika peluncuran, Codex-Spark nduweni jendhela konteks 128k lan mung teks. Sajrone pratayang riset, Codex-Spark bakal nduweni wates tarif dhewe lan panggunaan ora bakal diitung menyang wates tarif standar. Nanging, nalika panjaluk dhuwur, sampeyan bisa ndeleng akses winates utawa antrean sementara nalika kami njaga reliabilitas antar pangguna.
Codex-Spark dioptimalake kanggo kerja interaktif nalika latensi padha pentinge karo kapinteran. Sampeyan bisa kolaborasi karo model kanthi real-time, nyelani utawa ngarahake maneh nalika lagi kerja, lan iterasi kanthi cepet nganggo tanggapan sing meh instan. Amarga disetel kanggo kacepetan, Codex-Spark njaga gaya kerja bawaan tetep entheng: nggawe suntingan minimal lan ditargetake lan ora otomatis mbukak tes kajaba sampeyan njaluk.
Codex-Spark yaiku model cilik sing banget mumpuni lan dioptimalake kanggo inferensi cepet. Ing SWE-Bench Pro lan Terminal-Bench 2.0, loro benchmark sing ngevaluasi kemampuan rekayasa piranti lunak agen, GPT‑5.3‑Codex‑Spark nuduhake performa sing kuwat nalika ngrampungake tugas mung ing sebagean cilik wektu dibandhingake GPT‑5.3‑Codex.
Durasi dikira minangka jumlah saka (1) wektu generasi output (token output ÷ kacepetan sampling), (2) wektu prefill (token prefill ÷ kacepetan prefill), (3) total wektu eksekusi alat, lan (4) total overhead jaringan.
Nalika kami nglatih Codex-Spark, dadi cetha yen kacepetan model mung salah siji bagean saka persamaan kanggo kolaborasi real-time—kami uga kudu nyuda latensi ing saindenging pipeline panjaluk-tanggapan. Kami ngetrapake peningkatan latensi end-to-end ing harness kami sing bakal migunani kanggo kabeh model. Ing balik layar, kami nyederhanakake cara tanggapan mili saka klien menyang server lan bali maneh, nulis ulang bagean-bagean kunci saka stack inferensi kami, lan ngolah ulang cara sesi diinisialisasi supaya token katon pisanan muncul luwih cepet lan Codex tetep responsif nalika sampeyan iterasi. Liwat introduksi sambungan WebSocket persisten lan optimisasi sing ditargetake ing njero Responses API, kami nyuda overhead saben perjalanan bolak-balik klien/server nganti 80%, overhead per-token nganti 30%, lan wektu-menyang-token-pisanan nganti 50%. Jalur WebSocket diaktifake kanggo Codex-Spark kanthi default lan bakal dadi default kanggo kabeh model sakcepete.
Codex-Spark mlaku ing Wafer Scale Engine 3(mbukak ing jendhela anyar) duweke Cerebras—akselerator AI sing digawe khusus kanggo inferensi kacepetan dhuwur sing menehi Codex lapisan serving kanthi prioritas latensi. Kami kerja bareng Cerebras kanggo nambah jalur latensi rendah iki menyang stack serving produksi sing padha karo sisa armada kami, supaya bisa mlaku mulus ing Codex lan nyiapake kami kanggo ndhukung model ing mangsa ngarep.
“Sing paling nggawe kita semangat babagan GPT-5.3-Codex-Spark yaiku kemitraan karo OpenAI lan komunitas developer kanggo nemokake apa sing bisa ditindakake inferensi cepet—pola interaksi anyar, kasus panggunaan anyar, lan pengalaman model sing dhasaré beda. Pratayang iki mung wiwitan.”
GPU tetep dadi dhasar ing saindenging pipeline latihan lan inferensi kami lan ngasilake token paling hemat biaya kanggo panggunaan sing wiyar. Cerebras nglengkapi dhasar kasebut kanthi unggul ing alur kerja sing mbutuhake latensi banget rendah, ngencengi loop end-to-end supaya Codex krasa luwih responsif nalika sampeyan iterasi. GPU lan Cerebras bisa digabung kanggo beban kerja tunggal supaya nggayuh performa paling apik.
Codex-Spark wiwit diluncurake dina iki minangka pratayang riset kanggo pangguna ChatGPT Pro ing versi paling anyar saka app Codex, CLI, lan ekstensi VS Code. Amarga mlaku ing hardware latensi rendah khusus, panggunaan diatur dening wates tarif kapisah sing bisa diatur adhedhasar panjaluk sajrone pratayang riset. Kajaba iku, kami nggawe Codex-Spark kasedhiya ing API kanggo set cilik mitra desain supaya ngerti carane developer pengin ngintegrasi Codex-Spark menyang produke. Kami bakal nggedhekake akses sajrone sawetara minggu ngarep nalika terus nyetel integrasi kami ing beban kerja nyata.
Codex-Spark saiki mung teks kanthi jendhela konteks 128k lan dadi sing pisanan ing kulawarga model super cepet. Nalika kami sinau luwih akeh bareng komunitas developer babagan ing endi model cepet unggul kanggo coding, kami bakal ngenalake luwih akeh kapabilitas—kalebu model luwih gedhe, dawa konteks luwih dawa, lan input multimodal.
Codex-Spark nyakup latihan safety sing padha karo model utama kami, kalebu latihan sing relevan karo siber. Kami ngevaluasi Codex-Spark minangka bagean saka proses deployment standar kami, sing kalebu evaluasi dasar kanggo siber lan kapabilitas liyane, lan nemtokake yen model iki ora nduweni kemungkinan sing masuk akal kanggo nggayuh ambang Kerangka Kesiapan kami kanggo kapabilitas dhuwur ing keamanan siber utawa biologi.
Codex-Spark yaiku langkah pisanan menyang Codex kanthi rong mode pelengkap: nalar lan eksekusi cakrawala luwih dawa, lan kolaborasi real-time kanggo iterasi cepet. Suwe-suwe, mode-mode iki bakal nyawiji—Codex bisa njaga sampeyan ing loop interaktif sing rapet nalika mendelegasikan kerja sing luwih dawa menyang sub-agen ing latar mburi, utawa nyebarake tugas menyang akeh model kanthi paralel nalika sampeyan butuh jangkauan lan kacepetan, supaya sampeyan ora perlu milih siji mode saka awal.
Nalika model dadi luwih mumpuni, kacepetan interaksi dadi bottleneck sing cetha. Inferensi super cepet ngencengi loop kasebut, nggawe Codex krasa luwih alami kanggo digunakake lan nggedhekake apa sing bisa ditindakake sapa wae sing ngowahi gagasan dadi piranti lunak sing bisa digunakake.


