Негізгі мазмұнға өту
OpenAI

GPT‑5.3‑Codex‑Spark таныстыру

Codex-та нақты уақыттағы кодтауға арналған аса жылдам модель.

Жүктелуде…

Бүгін біз GPT‑5.3‑Codex‑тің шағындау нұсқасы әрі нақты уақыттағы кодтауға арналған алғашқы моделіміз GPT‑5.3‑Codex‑Spark‑тің research preview нұсқасын шығарып отырмыз. Codex-Spark — қаңтарда жариялаған серіктестігіміздің Cerebras-пен бірге жасалған алғашқы маңызды кезеңі. Codex-Spark аса төмен кідірісті жабдықта қызмет көрсетілгенде лезде дерлік әсер беру үшін оңтайландырылған — нақты әлемдегі кодтау тапсырмаларында жоғары қабілетін сақтай отырып, секундына 1000-нан астам токен шығарады.

Біз Codex-Spark-ті Cerebras платформасында ChatGPT Pro пайдаланушыларына research preview ретінде ұсынып отырмыз, осылайша әзірлеушілер ертерек тәжірибе жасап көре алады, ал біз Cerebras-пен бірге деректер орталығының сыйымдылығын арттырып, толық пайдаланушы тәжірибесін нығайтып және ірілеу озық модельдерімізді енгіземіз.

Соңғы озық модельдеріміз араласусыз сағаттар, күндер немесе апталар бойы автономды жұмыс істеп, ұзақ орындалатын тапсырмаларды атқару қабілетімен ерекше көзге түсті. Codex-Spark — Codex-пен нақты уақытта жұмыс істеуге арнайы жасалған алғашқы моделіміз: нысаналы түзетулер енгізу, логиканы қайта құру немесе интерфейстерді жетілдіру және нәтижені бірден көру үшін. Codex-Spark көмегімен Codex енді ұзаққа созылатын ауқымды тапсырмаларды да, сол сәтте жұмысты бітіріп тастауды да қолдайды. Әзірлеушілер оны қалай пайдаланатынынан үйреніп, қолжетімділікті кеңейтуді жалғастырған сайын пікірлерді ескереміз деп үміттенеміз.

Іске қосылған сәтте Codex-Spark-те 128k контекст терезесі бар және ол тек мәтінмен жұмыс істейді. Research preview кезінде Codex-Spark-тің өз rate limit-тері болады және оны пайдалану стандартты rate limit-терге есептелмейді. Дегенмен, сұраныс жоғары болғанда, барлық пайдаланушы үшін сенімділікті теңестіру барысында шектеулі қолжетімділік немесе уақытша кезек күту болуы мүмкін.

Жылдамдық пен зият

Codex-Spark кідіріс зияттылықтай маңызды болатын интерактивті жұмыс үшін оңтайландырылған. Сіз модельмен нақты уақытта бірлесіп жұмыс істей аласыз: ол жұмыс істеп жатқанда тоқтатып не бағытын өзгертіп, лезде дерлік жауаптармен тез итерация жасай аласыз. Жылдамдыққа бапталғандықтан, Codex-Spark әдепкі жұмыс стилін жеңіл ұстайды: ол ең аз, нысаналы түзетулер жасайды және сіз сұрамайынша тесттерді автоматты түрде іске қоспайды.

Код жазу

Codex-Spark — жылдам инференске оңтайландырылған, мүмкіндігі жоғары шағын модель. Агенттік бағдарламалық инженерия қабілетін бағалайтын екі benchmark — SWE-Bench Pro мен Terminal-Bench 2.0-де GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex‑пен салыстырғанда тапсырмаларды уақыттың аз ғана бөлігінде орындап, жоғары нәтиже көрсетеді.

Ұзақтық (1) шығыс жасау уақытының (шығыс токендері ÷ үлгілеу жылдамдығы), (2) prefill уақытының (prefill токендері ÷ prefill жылдамдығы), (3) құралдардың жалпы орындалу уақытының және (4) желідегі жалпы үстеме шығынның қосындысы ретінде есептеледі.

Барлық модельдерге арналған кідіріс жақсартулары

Codex-Spark-ті үйрету барысында нақты уақыттағы ынтымақтастықта модель жылдамдығы теңдеудің бір бөлігі ғана екені анық болды — бізге сұрау мен жауаптың толық pipeline бойындағы кідірісті де азайту керек болды. Біз барлық модельдерге пайдасын тигізетін harness жүйемізге ұшынан-ұшына дейінгі кідіріс жақсартуларын енгіздік. Ішкі жағынан біз жауаптардың клиенттен серверге және кері қарай ағуын ықшамдадық, инференс стекіміздің негізгі бөліктерін қайта жаздық және сессиялардың инициализациясын қайта өңдедік, соның арқасында алғашқы көрінетін токен ертерек пайда болып, Codex итерация жасағанда да жауап бергіш күйін сақтайды. Тұрақты WebSocket қосылымын енгізу және Responses API ішіндегі нысаналы оңтайландырулар арқылы біз клиент/сервер арасындағы әрбір roundtrip үшін үстеме шығынды 80%-ға, әр токенге шаққандағы үстеме шығынды 30%-ға және алғашқы токенге дейінгі уақытты 50%-ға қысқарттық. WebSocket жолы Codex-Spark үшін әдепкі бойынша қосылған және жақын арада барлық модель үшін әдепкіге айналады.

Cerebras қуаттандырады

Codex-Spark Cerebras-тың Wafer Scale Engine 3(жаңа терезеде ашылады) жүйесінде жұмыс істейді — бұл Codex-ке кідіріс басымдығы бар қызмет көрсету деңгейін беретін, жоғары жылдамдықты инференске арналған арнайы AI үдеткіші. Біз Cerebras-пен серіктесіп, осы төмен кідірісті жолды флотымыздың қалған бөлігімен бірдей production serving stack-ке қостық, сондықтан ол Codex аясында біркелкі жұмыс істейді және болашақ модельдерді қолдауға негіз қалайды.

«GPT-5.3-Codex-Spark туралы бізді ең қатты қуантатыны — OpenAI және әзірлеушілер қауымдастығымен бірге жылдам инференс ненің мүмкін екенін ашу: жаңа өзара әрекет үлгілері, жаңа қолдану сценарийлері және модельмен мүлде басқа тәжірибе. Бұл preview — тек бастамасы.»
— Sean Lie, Cerebras CTO-сы және тең құрылтайшысы

GPU-лар оқу және инференс pipeline-дарымыздың негізі болып қала береді әрі ауқымды қолдануға ең үнемді токендерді ұсынады. Cerebras бұл негізді өте төмен кідірісті қажет ететін workflow-ларда озық болу арқылы толықтырады, ұшынан-ұшына дейінгі циклді қысқартып, сіз итерация жасағанда Codex-ті анағұрлым жауап бергіш етеді. Ең жоғары өнімділікке жету үшін GPU-лар мен Cerebras-ты бір workload аясында бірге қолдануға болады.

Қолжетімділік және егжей-тегжейлер

Codex-Spark бүгіннен бастап Codex қолданбасының, CLI-дің және VS Code кеңейтімінің соңғы нұсқаларында ChatGPT Pro пайдаланушылары үшін research preview ретінде кезең-кезеңімен іске қосылып жатыр. Ол арнайы төмен кідірісті жабдықта жұмыс істейтіндіктен, оны пайдалану research preview барысында сұранысқа қарай өзгеруі мүмкін бөлек rate limit арқылы реттеледі. Бұған қоса, әзірлеушілер Codex-Spark-ті өз өнімдеріне қалай кіріктіргісі келетінін түсіну үшін біз Codex-Spark-ті API-де аздаған design partner тобына қолжетімді етіп отырмыз. Нақты workload жағдайларында интеграциямызды баптауды жалғастыра отырып, алдағы апталарда қолжетімділікті кеңейтеміз.

Қазіргі уақытта Codex-Spark тек мәтінмен жұмыс істейді, контекст терезесі 128k, әрі аса жылдам модельдер тобының алғашқысы болып табылады. Әзірлеушілер қауымдастығымен бірге код жазуда жылдам модельдер қай жерде жақсы нәтиже беретінін көбірек түсінген сайын, біз одан да көп мүмкіндіктерді — соның ішінде ірілеу модельдерді, ұзағырақ контекст көлемдерін және мультимодальды енгізуді — ұсынамыз.

Codex-Spark негізгі модельдеріміздегідей қауіпсіздікке оқытуды қамтиды, соның ішінде киберқауіпке қатысты оқыту да бар. Біз Codex-Spark-ті стандартты deployment үдерісіміздің бөлігі ретінде бағаладық; оған киберқауіп және басқа қабілеттер бойынша базалық бағалаулар кіреді, және оның киберқауіпсіздік немесе биология саласында жоғары қабілет үшін Дайындық шеңбері шегіне жету ықтималдығы шынайы емес деген қорытындыға келдік.

Келесі қадам

Codex-Spark — екі бірін-бірі толықтыратын режимі бар Codex-ке жасалған алғашқы қадам: ұзақ көкжиекті ой қорыту мен орындау, сондай-ақ жылдам итерацияға арналған нақты уақыттағы бірлескен жұмыс. Уақыт өте бұл режимдер араласады — Codex сізді тығыз интерактивті циклде ұстап тұрып, ұзаққа созылатын жұмысты фонда ішкі агенттерге бере алады немесе ауқым мен жылдамдық керек болғанда тапсырмаларды көптеген модельге параллель тарата алады, сондықтан басынан бір ғана режимді таңдаудың қажеті болмайды.

Модельдер қабілетті болған сайын, өзара әрекет жылдамдығы айқын тар орынға айналады. Аса жылдам инференс бұл циклді қысқартады, Codex-ті қолдануды табиғи ете түседі және идеяны жұмыс істейтін бағдарламалық жасақтамаға айналдыратын кез келген адам үшін мүмкіндіктерді кеңейтеді.

Автор

OpenAI