Прескокни до главната содржина
OpenAI

Ви го претставуваме GPT‑5.3‑Codex‑Spark

Ултрабрз модел за кодирање во реално време во Codex.

Се вчитува...

Денес објавуваме истражувачки преглед на GPT‑5.3‑Codex‑Spark, помала верзија на GPT‑5.3‑Codex и нашиот прв модел дизајниран за кодирање во реално време. Codex-Spark е оптимизиран да биде речиси моментален - обезбедувајќи 15 пати побрзо генерирање, додека останува многу способен за задачи за кодирање во реалниот свет.

Codex-Spark го означува првиот значаен чекор во нашето партнерство со Cerebras, кое го објавивме во јануари. Го споделуваме Codex-Spark како преглед од истражување за корисниците на ChatGPT Pro, за да можат програмерите да почнат рано да експериментираат додека работиме со Cerebras за да го зголемиме капацитетот на дата-центарот, да го зацврстиме целокупното искуство и да го распоредиме нашиот поголем граничен модел.

Нашите најнови модели на граница покажаа особени предности во нивната способност да извршуваат долготрајни задачи, работејќи автономно со часови, денови или недели без интервенција. Codex-Spark е нашиот прв модел дизајниран специјално за работа со Codex во реално време - овозможувајќи насочени уредувања, преобликување на логиката или доработка на интерфејсите и веднаш да се видат резултатите. Со Codex-Spark, семејството Codex сега поддржува и долготрајни, амбициозни задачи, како и завршување на работа во моментот. Се надеваме дека ќе научиме од тоа како програмерите го користат и ќе ги вклучиме повратните информации додека продолжуваме да го прошируваме пристапот.

При лансирање, Codex-Spark има контекстуален прозорец од 128k и е само текстуален. За време на прегледот на истражувањето, Codex-Spark ќе има свои ограничувања на брзината, а користењето нема да се смета кон стандардните ограничувања. Сепак, кога побарувачката е висока, можеш да забележиш побавен пристап или привремено чекање додека ја одржуваме сигурноста за сите корисници.

Брзина и интелигенција

Codex-Spark е оптимизиран за интерактивна работа каде што доцнењето е исто толку важно колку и интелигенцијата. Можеш да работиш со моделот како со соработник во реално време - можеш да го прекинеш или пренасочиш додека работи и брзо да повторуваш итерации без да чекаш да заврши распоредувањето. Бидејќи е оптимизиран за брзина, Codex-Spark го одржува својот стандардeн работен стил лесен: прави минимални, насочени измени и не извршува автоматски тестови освен ако не го побараш тоа.

Coding

Codex-Spark е многу способен мал модел оптимизиран за брзо изведување на заклучоци. На SWE-Bench Pro и Terminal-Bench 2.0, два репери што ја оценуваат агентската способност за софтверско инженерство, GPT‑5.3‑Codex‑Spark заостанува зад GPT‑5.3‑Codex, но може да ја заврши задачата за многу пократко време.

Времетраењето се проценува како збир од (1) време за генерирање на излез (излезни токени ÷ брзина на семплирање), (2) време за пополнување (пополнувачки токени ÷ брзина на пополнување), (3) вкупно време на извршување на алатките и (4) вкупен мрежен трошок.

Подобрувања во латентноста за сите модели

Додека го обучувавме Codex-Spark, стана јасно дека брзината на моделот е само дел од равенката за соработка во реално време – исто така требаше да ја намалиме латентноста низ целиот процес на барање-одговор. Имплементиравме подобрувања на латентноста од почеток до крај во нашиот систем што им користат на сите модели. Под површината, го поедноставивме начинот на кој одговорите се пренесуваат од клиентот до серверот и назад, одново ги напишавме клучните делови од нашиот стек за инференција и го преработивме начинот на кој се иницијализираат сесиите, така што првиот видлив токен се појавува побрзо и Codex останува брзореактивен додека работите. Со воведување постојана WebSocket врска и насочени оптимизации во рамките на Responses API, го намаливме оптоварувањето по клиент/сервер рунда за 80 %, оптоварувањето по токен за 30 %, и времето до првиот токен за 50 %. Без разлика кој модел ќе го избереш, ќе доживееш потесен циклус низ целото искуство со Codex.

Поддржано од Cerebras

Codex-Spark работи на Cerebras’ Wafer Scale Engine 3(се отвора во нов прозорец) - наменски изграден акцелератор за вештачка интелигенција за инференција со голема брзина, кој му овозможува на Codex слој за опслужување со приоритет на латентноста. Соработувавме со Cerebras за да го додадеме овој пат со ниска латентност во истиот продукциски стек за сервирање како и остатокот од нашата флота, за да функционира беспрекорно низ Codex и да нè подготви за поддршка на идни модели.

„Она што најмногу нè возбудува кај GPT-5.3-Codex-Spark е партнерството со OpenAI и заедницата на развивачи за да откриеме што овозможува брзата инференција - нови обрасци на интеракција, нови случаи на употреба и суштински поинакво искуство со моделот. „Овој преглед е само почеток.“
- Шон Ли, технички директор и коосновач на Cerebras

Графичките процесори остануваат основни низ нашите процеси за обука и инференција и испорачуваат најисплатливи токени за широка употреба. Cerebras ја надополнува таа основа со тоа што се истакнува во работни процеси кои бараат исклучително ниска латентност, затегнувајќи го крајниот циклус за Codex да биде побрзо реактивен додека повторуваш.

Достапност и детали

Codex-Spark се лансира денес како истражувачки преглед за сите корисници на ChatGPT Pro во најновите верзии на апликацијата Codex, CLI и екстензијата за VS Code. Бидејќи работи на специјализиран хардвер со ниска латентност, користењето е регулирано со посебно ограничување на стапката што може да се прилагоди врз основа на побарувачката за време на прегледот на истражувањето. Покрај тоа, Codex-Spark го правиме достапен во API за мал број на дизајнерски партнери за да разбереме како програмерите сакаат да го интегрираат Codex-Spark во своите производи. Ќе го прошириме пристапот во наредните недели додека продолжуваме да ја прилагодуваме нашата интеграција под реални работни оптоварувања.

Codex-Spark моментално е само текстуален со прозорец за контекст од 128 илјади и е првиот во семејство на ултра-брзи модели. Како што учиме повеќе заедно со заедницата на развивачи за тоа каде брзите модели се истакнуваат во кодирањето, ќе воведеме уште повеќе можности, вклучувајќи поголеми модели, подолги контекстуални должини и мултимодален внес.

Codex-Spark вклучува ист вид обука за безбедност како и нашите главни модели, вклучувајќи и обука поврзана со сајбер-безбедност. Го оценивме Codex-Spark како дел од нашиот стандарден процес на распоредување, кој вклучува основни проценки за сајбер и други способности, и утврдивме дека нема веројатност да го достигне прагот на нашата Рамка за подготвеност за висока способност во сајбербезбедноста.

Што е следно

Codex-Spark е првиот чекор кон Codex со два комплементарни режима: подолгорочно расудување и извршување и соработка во реално време за брза итерација. Со текот на времето, режимите ќе се спојат - Codex може да те одржува во тесна интерактивна јамка додека делегира подолготрајна работа на подагенти во заднина, или да ги распредели задачите на многу модели паралелно кога сакаш широчина и брзина, за да не мораш однапред да избереш само еден режим.

Како што моделите стануваат поспособни, брзината на интеракција станува очигледно тесно грло. Ултра-брзата инференција го затегнува тој циклус, правејќи Codex да се чувствува поприродно за користење и проширувајќи ги можностите за секој што претвора идеја во функционален софтвер.

Автор

OpenAI