Lumaktaw sa pangunahing content
OpenAI

Pebrero 12, 2026

ProduktoPaglabasKumpanya

Ipinakikilala ang GPT‑5.3‑Codex‑Spark

Isang napakabilis na modelo para sa real-time na pag-code sa Codex.

Naglo-load…

Ngayon, maglalabas kami ng preview ng pananaliksik ng GPT‑5.3‑Codex, at ang una naming modelo na dinisenyo para sa real-time na pagko-code. Ang Codex-Spark ay na-optimize upang maramdaman na halos agarang—naghahatid ng 15x na mas mabilis na pagbuo habang nananatiling lubos na may kakayahan para sa mga gawain sa pag-code sa totoong mundo.

Ang Codex-Spark ay nagmamarka ng unang milestone sa aming pakikipagsosyo sa Cerebras, na aming inanunsyo noong Enero. Ibinabahagi namin ang Codex-Spark bilang preview ng pananaliksik para sa mga user ng ChatGPT Pro upang makapagsimulang mag-eksperimento nang maaga ang mga developer habang nakikipagtulungan kami sa Cerebras upang palakihin ang kapasidad ng datacenter, patibayin ang end-to-end na karanasan, at i-deploy ang mas malaki naming frontier na modelo.

Ipinakita ng aming pinakabagong mga frontier na modelo ang partikular na lakas sa kanilang kakayahang magsagawa ng mga pangmatagalang gawain, nagtatrabaho nang mag-isa sa loob ng ilang oras, araw, o linggo nang walang interbensyon. Ang Codex-Spark ay ang aming unang modelo na dinisenyo partikular para sa pakikipagtulungan sa Codex sa real-time—gumagawa ng mga naka-target na pag-edit, muling paghubog ng lohika, o pagpino ng mga interface at agad na nakikita ang mga resulta. Sa Codex-Spark, sinusuportahan na ngayon ng pamilya ng Codex ang parehong mga pangmatagalang ambisyosong gawain at ang pagtapos ng trabaho sa mismong sandali. Umaasa kaming matuto mula sa kung paano ito ginagamit ng mga developer at isama ang feedback habang patuloy naming palalawakin ang access.

Noong paglulunsad, ang Codex-Spark ay may 128k window ng konteksto at text-only. Sa panahon ng preview ng pananaliksik, magkakaroon ang Codex-Spark ng sarili nitong mga limitasyon sa rate at hindi mabibilang ang paggamit sa mga karaniwang limitasyon sa rate. Gayunpaman, kapag mataas ang demand, maaaring bumagal ang access o pansamantalang pag-queue habang binabalanse namin ang pagiging maaasahan sa lahat ng user.

Bilis at katalinuhan

Ang Codex-Spark ay na-optimize para sa interaktibong trabaho kung saan kasinghalaga ng katalinuhan ang pagkaantala. Maaari kang makipagtulungan sa modelo ng gaya ng sa real-time na katuwang—abalahin o i-redirect ito habang ito'y gumagana, at mabilis na mag-ulit nang hindi naghihintay na matapos ang rollout. Dahil naka-tune ito para sa bilis, pinananatiling magaan ng Codex-Spark ang default na estilo ng pagtatrabaho: gumagawa ito nang kaunti at naka-target na mga pag-edit at hindi awtomatikong nagpapatakbo ng mga pagsusuri maliban kung hihilingin mo ito.

Pag-code

Ang Codex-Spark ay isang napakahusay na maliit na modelo na na-optimize para sa mabilis na inference. Sa SWE-Bench Pro at Terminal-Bench 2.0, dalawang pamantayan na sumusuri sa kakayahan ng agentic sa software engineering, GPT‑5.3‑Codex‑Spark mas mababa ang pagganap kumpara sa GPT‑5.3‑Codex, ngunit magagawa ang gawain sa mas kaunting oras.

Ang tagal ay tinataya bilang ang kabuuan ng (1) oras ng pagbuo ng output (mga output token ÷ bilis ng sampling), (2) oras ng prefill (mga prefill token ÷ bilis ng prefill), (3) kabuuang oras ng pagpapatupad ng tool, at (4) kabuuang overhead ng network.

Mga pagpapabuti sa pagkaantala para sa lahat ng modelo

Habang sinasanay namin ang Codex-Spark, naging malinaw na ang bilis ng modelo ay bahagi lamang ng equation para sa real-time na pakikipagtulungan—kailangan din naming bawasan ang pagkaantala sa pipeline ng kahilingan at tugon. Nagpatupad kami ng mga pagpapahusay sa end-to-end na pagkaantala sa aming harness kung saan nakikinabang ang lahat ng modelo. Sa likod ng mga eksena, pinasimple namin kung paano nag-i-stream ang mga tugon mula sa client papunta sa server at pabalik, muling isinulat ang mahahalagang bahagi ng aming inference stack, at inayos muli kung paano ini-initialize ang mga session para mas maagang lumitaw ang unang nakikitang token at manatiling tumutugon ang Codex habang nag-i-iterate kayo. Sa pamamagitan ng pagpapakilala ng tuloy-tuloy na koneksyon ng WebSocket at mga naka-target na pag-optimize sa loob ng Responses API, nabawasan namin ang overhead kada client/server roundtrip ng 80%, ang overhead kada token ng 30%, at ang oras sa unang token ng 50%. Anuman ang modelong piliin moo, mararanasan mo ang mas mahigpit na loop sa buong karanasan sa Codex.

Pinapagana ng Cerebras

Tumatakbo ang Codex-Spark sa Wafer Scale Engine 3(magbubukas sa bagong window)ng Cerebras—na sadyang dinisenyong pampabilis ng AI para sa mabilisang inference na nagbibigay sa Codex ng priyoridad sa pagkaantala na serving tier. Nakipagsosyo kami sa Cerebras upang idagdag ang landas ng mababang pagkaantala na ito sa parehong serving stack ng produksyon gaya ng iba pa naming fleet, kaya tuloy-tuloy itong gumagana sa Codex at inihahanda kami upang suportahan ang mga modelo sa hinaharap.

Ang pinakakinagigiliwan namin tungkol sa GPT-5.3-Codex-Spark ay ang pakikipagtulungan sa OpenAI at sa komunidad ng mga developer upang matuklasan kung ano ang nagiging posible dahil sa mabilis na inference—mga bagong pattern ng pakikipag-ugnayan, mga bagong kaso ng paggamit, at makabuluhang pagkakaiba sa karanasan ng modelo. Ang preview na ito ay simula pa lamang.
— Sean Lie, CTO at Co-Founder ng Cerebras

Nananatiling pundamental ang mga GPU sa aming mga pipeline ng pagsasanay at inference at naghahatid ng pinakasulit na token para sa malawakang paggamit. Pinupunan ng Cerebras ang pundasyong iyon sa pamamagitan ng pagiging mahusay sa mga daloy ng trabaho na nangangailangan ng napakababang pagkaantala, pinahihigpit ang loop mula simula hanggang dulo upang maging mas masigla ang pakiramdam ng Codex habang ikaw ay nag-i-iterate.

Availability ar mga detalye

Inilulunsad ang Codex-Spark ngayon bilang preview ng pananaliksik para sa lahat ng mga user ng ChatGPT Pro sa mga pinakabagong bersyon ng Codex app, CLI, at VS Code extension. Dahil ito ay tumatakbo sa espesyal na hardware na may mababang pagkaantala, ang paggamit ay pinamamahalaan ng hiwalay na limitasyon sa rate na maaaring mag-adjust batay sa pangangailangan sa panahon ng preview ng pananaliksik. Bukod pa rito, ginagawa naming available ang Codex-Spark sa API para sa maliit na hanay ng mga katuwang sa disenyo upang maunawaan kung paano gustong idagdag ng mga developer ang Codex-Spark sa kanilang mga produkto. Palalawakin po namin ang access sa mga darating na linggo habang patuloy naming inaayos ang aming pagdaragdag sa ilalim ng mga totoong workload.

Ang Codex-Spark ay kasalukuyang text-only sa isang 128k na window ng konteksto at ito ang una sa pamilya ng mga napakabilis na modelo. Habang mas natututo kami kasama ang komunidad ng developer tungkol sa kung saan mahusay ang mga mabilis na modelo para sa pag-code, magpapakilala pa kami ng mas marami pang kakayahan–kabilang ang mas malalaking modelo, mas mahahabang haba ng konteksto, at multimodal na input.

Kasama sa Codex-Spark ang parehong pagsasanay sa kaligtasan gaya ng aming mga pangunahing modelo, kabilang ang pagsasanay na may kaugnayan sa cyber. Sinuri namin ang Codex-Spark bilang bahagi ng aming karaniwang proseso ng pag-deploy, na kinabibilangan ng mga baseline na pagsusuri para sa cyber at iba pang kakayahan, at natukoy naming wala itong makatotohanang pagkakataon na maabot ang threshold ng aming Preparedness Framework para sa mataas na kakayahan sa cybersecurity.

Ano ang susunod

Ang Codex-Spark ang unang hakbang patungo sa isang Codex na may dalawang komplementaryong mode: pangmatagalang pangangatuwiran at pagpapatupad, at pakikipagtulungan sa real-time para sa mabilis na pag-uulit. Sa paglipas ng panahon, magsasama-sama ang mga mode—maaari kang panatilihin ng Codex sa isang mahigpit na interaktibong loop habang iniaatas ang mas matagal na trabahong tumatakbo sa mga sub-agent sa background, o ipamahagi ang mga gawain sa maraming modelo nang sabay-sabay kung gusto mo ang lawak at bilis, upang hindi mo kailangang pumili ng iisang mode sa simula pa lamang.

Habang nagiging mas may kakayahan ang mga modelo, nagiging malinaw na hadlang ang bilis ng pakikipag-ugnayan. Ang napakabilis na inference ay pinahihigpit ang loop na iyon, na ginagawang mas natural gamitin ang Codex at pinapalawak kung ano ang posible para sa sinumang gumagawa ng gumaganang software mula sa isang ideya.

May-akda

OpenAI