Днес пускаме в изследователски преглед GPT‑5.3‑Codex‑Spark, по-лека версия на GPT‑5.3‑Codex, и първия ни модел, предназначен за кодиране в реално време. Codex-Spark бележи първия етап в нашето партньорство с Cerebras, което обявихме през януари. Codex-Spark е оптимизиран да осигурява почти мигновено усещане при работа на хардуер с ултраниско забавяне, доставяйки над 1000 токена в секунда, като същевременно остава изключително ефективен за реални задачи по кодиране.
Споделяме Codex-Spark на Cerebras като изследователски предварителен достъп за потребителите на ChatGPT Pro, за да могат разработчиците да започнат да експериментират по-рано, докато работим съвместно със Cerebras за увеличаване на капацитета на центровете за данни, подобряване и стабилизиране на цялостното потребителско изживяване и внедряване на нашите по-големи авангардни модели.
Нашите най-нови авангардни модели демонстрираха особени предимства в способността си да изпълняват дългосрочни задачи, работейки автономно в продължение на часове, дни или седмици без намеса. Codex-Spark е нашият първи модел, проектиран специално за работа с Codex в реално време – позволяващ целенасочени редакции, преформулиране на логиката или усъвършенстване на интерфейси и незабавно виждане на резултатите. С Codex-Spark Codex вече поддържа както дълготрайни, амбициозни задачи, така и работа, която трябва да се свърши на момента. Надяваме се да научим как разработчиците го използват и да включим обратната връзка, докато продължаваме да разширяваме достъпа.
При стартиране Codex-Spark има контекстуален прозорец от 128k и е само текстов. По време на изследователския преглед, Codex-Spark ще има свои собствени ограничения на заявките и използването му няма да се отчита към стандартните ограничения. Въпреки това, когато търсенето е високо, може да се наблюдава ограничен достъп или временно изчакване, докато осигуряваме надеждност за всички потребители.
Codex-Spark е оптимизиран за интерактивна работа, при която забавянето е толкова важно, колкото и интелигентността. Можете да си сътрудничите с модела в реално време, като го прекъсвате или пренасочвате, докато работи, и бързо да правите итерации с почти мигновени отговори. Тъй като е настроен за скорост, Codex-Spark поддържа своя лек стил на работа по подразбиране – прави минимални и целенасочени редакции и не изпълнява автоматично тестове, освен ако не го помолите.
Codex-Spark е високоефективен лек модел, оптимизиран за бързо извеждане на резултати. На SWE-Bench Pro и Terminal-Bench 2.0, два еталона, оценяващи възможностите за агентно софтуерно инженерство, GPT‑5.3‑Codex‑Spark демонстрира висока производителност, като изпълнява задачите за част от времето, необходимо на GPT‑5.3‑Codex.
Продължителността се изчислява като сбор от (1) времето за генериране на изходните данни (изходни токени ÷ скорост на семплиране), (2) времето за предварително запълване (токени за предварително запълване ÷ скорост на предварително запълване), (3) общото време за изпълнение на инструмента и (4) общото мрежово натоварване.
Докато обучавахме Codex-Spark, стана ясно, че скоростта на модела е само част от уравнението за сътрудничество в реално време – също така трябваше да намалим забавянето по цялата верига на заявка-отговор. Внедрихме подобрения в забавянето от край до край в нашата тестова среда, които ще са от полза за всички модели. Зад кулисите оптимизирахме начина, по който отговорите протичат между клиента и сървъра, пренаписахме ключови части от нашия стек за инференция и преработихме инициализацията на сесиите, така че първият видим токен да се появява по-бързо, а Codex да остава отзивчив по време на итерации. Чрез въвеждането на постоянна WebSocket връзка и целеви оптимизации в Responses API, намалихме режийните разходи на клиент/сървър обиколка с 80%, режийните разходи на токен с 30% и времето до първия токен с 50%. Пътят на WebSocket е активиран по подразбиране за Codex-Spark и скоро ще бъде стандартен за всички модели.
Codex-Spark работи на Wafer Scale Engine 3(отваря се в нов прозорец)на Cerebras – специализиран ускорител на ИИ за високоскоростна инференция, който предоставя на Codex слой за обслужване с приоритет на ниско забавяне. Сътрудничихме си със Cerebras, за да добавим този път с ниско забавяне към същата производителна инфраструктура, която използваме за останалите ни системи, така че той да работи безпроблемно с Codex и да ни подготви за поддръжка на бъдещи модели.
„Това, което ни вълнува най-много в GPT-5.3-Codex-Spark, е партньорството с OpenAI и общността на разработчиците, за да открием какво прави възможно бързото извеждане на резултати – нови модели на взаимодействие, нови случаи на употреба и фундаментално различно изживяване с модела. Този предварителен преглед е само началото.“
Графичните процесори остават основополагащи в нашите процеси за обучение и инференция и осигуряват най-рентабилните токени за широко използване. Cerebras надгражда тази основа, като се справя отлично с работни потоци, които изискват изключително ниско забавяне, съкращавайки цикъла от край до край, така че Codex да откликва по-бързо, докато правите итерации. Графичните процесори и Cerebras могат да се комбинират за единични работни натоварвания, за да се постигне оптимална производителност.
Codex-Spark се пуска днес като изследователски преглед за потребителите на ChatGPT Pro в най-новите версии на приложението Codex, CLI и разширението за VS Code. Тъй като работи на специализиран хардуер с ниско забавяне, употребата се регулира от отделно ограничение на скоростта, което може да се коригира въз основа на търсенето по време на предварителния преглед. Освен това правим Codex-Spark достъпен в API за малък кръг от партньори по дизайн, за да разберем как разработчиците искат да интегрират Codex-Spark в своите продукти. През следващите седмици ще разширим достъпа, докато продължаваме да настройваме интеграцията си при реални работни натоварвания.
Codex-Spark в момента е само текстови с 128k контекстуален прозорец и е първият в семейство ултрабързи модели. Докато учим заедно с общността от разработчици в какво бързите модели се отличават при кодиране, ще въведем още повече възможности, включително по-големи модели, по-дълги контекстни дължини и мултимодален вход.
Codex-Spark включва същото обучение по безопасност като основните ни модели, включително обучение, свързано с киберсигурността. Оценихме Codex-Spark като част от нашия стандартен процес на внедряване, който включва базови оценки за кибер и други способности, и установихме, че той няма реална възможност да достигне прага на нашата рамка за готовност за високо ниво на способности в киберсигурността или биологията.
Codex-Spark е първата стъпка към Codex с два допълващи се режима – структурирано анализиране и изпълнение, и сътрудничество в реално време за бърза итерация. С течение на времето режимите ще се слеят – Codex може да Ви държи в стегнат интерактивен цикъл, като същевременно делегира по-дългосрочната работа на подагенти във фонов режим или разпределя задачите към много модели паралелно, когато искате широта и скорост, така че да не се налага да избирате един-единствен режим предварително.
С нарастването на способностите на моделите, скоростта на взаимодействие се превръща в очевидно ограничение. Свръхбързото извеждане стяга този цикъл, правейки Codex по-естествен за използване и разширявайки възможностите на всеки, който превръща идеите си в работещ софтуер.


