Үндсэн агуулга руу алгасах
OpenAI

2026 оны хоёрдугаар сарын 12

БүтээгдэхүүнГаргалтКомпани

GPT‑5.3‑Codex‑Spark‑ийг танилцуулж байна

Codex дахь бодит цагийн кодчлолд зориулсан хэт хурдан загвар.

Ачаалж байна…

Өнөөдөр бид GPT‑5.3‑Codex‑ийн жижигрүүлсэн хувилбар бөгөөд бодит цагийн кодчлолд зориулан бүтээсэн анхны загвар болох GPT‑5.3‑Codex‑Spark‑ийн research preview-г танилцуулж байна. Codex-Spark нь Cerebras-тай хийж буй түншлэлийн маань эхний томоохон үе шат бөгөөд үүнийг бид нэгдүгээр сард зарласан. Codex-Spark нь хэт бага сааталтай тоног төхөөрөмж дээр ажиллахдаа бараг шууд мэт мэдрэмж төрүүлэхээр оновчлогдсон бөгөөд бодит ертөнцийн кодчлолын даалгаварт өндөр чадвараа хадгалсаар секундэд 1000-аас дээш токен хүргэдэг.

Бид Codex-Spark-ийг Cerebras дээр ChatGPT Pro хэрэглэгчдэд research preview хэлбэрээр түгээж байгаа нь, Cerebras-тай хамт дата төвийн багтаамжийг нэмэгдүүлэх, төгсгөлөөс төгсгөл хүртэлх хэрэглэгчийн туршлагыг бэхжүүлэх, мөн илүү том хил хязгаар загваруудаа нэвтрүүлэх зуур хөгжүүлэгчид эртнээс туршиж эхлэх боломжтой болгох зорилготой.

Манай сүүлийн үеийн хил хязгаар загварууд удаан хугацаанд үргэлжлэх даалгавруудыг хийх, ямар нэгэн оролцоогүйгээр цаг, өдөр, долоо хоногоор бие даан ажиллах чадвараараа онцгой давуу талаа харуулсан. Codex-Spark бол Codex-тэй бодит цагт ажиллахаар тусгайлан бүтээгдсэн манай анхны загвар бөгөөд тодорхой засвар хийх, логикийг өөрчлөн хэлбэржүүлэх, эсвэл интерфэйсийг сайжруулж, үр дүнг нь шууд харах боломжтой. Codex-Spark-ийн тусламжтайгаар Codex одоо урт хугацааны, амбицтай ажлуудыг ч, тухайн мөчид ажлаа амжуулахыг ч дэмждэг болсон. Хөгжүүлэгчид үүнийг хэрхэн ашиглаж байгаагаас бид суралцаж, цаашид хандалтаа өргөжүүлэхийн хэрээр санал хүсэлтийг тусгана гэж найдаж байна.

Эхний нээлтийн үед Codex-Spark нь 128k контекст цонхтой бөгөөд зөвхөн текст дэмжинэ. Research preview-ийн хугацаанд Codex-Spark өөрийн гэсэн rate limit-тэй байх бөгөөд хэрэглээ нь стандарт rate limit рүү тооцогдохгүй. Гэхдээ эрэлт өндөр үед хэрэглэгчдийн хооронд найдвартай байдлыг тэнцвэржүүлэхийн тулд хязгаарлагдмал хандалт эсвэл түр дараалал үүсэж магадгүй.

Хурд ба оюун

Codex-Spark нь саатал оюун ухаантай адил чухал байдаг интерактив ажилд зориулан оновчлогдсон. Та загвартай бодит цагт хамтран ажиллаж, ажиллаж байх явцад нь тасалдуулж эсвэл чиглэлийг нь өөрчилж, бараг агшин зуурын хариутайгаар маш хурдан давтан сайжруулалт хийх боломжтой. Хурданд тааруулан тохируулсан тул Codex-Spark нь анхдагч ажлын хэв маягаа хөнгөн байлгадаг: хамгийн бага, чиглэсэн засвар хийдэг бөгөөд та хүсэхгүй бол тестийг автоматаар ажиллуулдаггүй.

Кодчлол

Codex-Spark бол хурдан inference-д оновчлогдсон, өндөр чадвартай жижиг загвар юм. агент маягийн програм хангамжийн инженерчлэлийн чадварыг үнэлдэг хоёр benchmark болох SWE-Bench Pro болон Terminal-Bench 2.0 дээр GPT‑5.3‑Codex‑Spark нь GPT‑5.3‑Codex‑той харьцуулахад даалгавруудыг хугацааны өчүүхэн хэсэгт гүйцэтгэхийн зэрэгцээ хүчтэй гүйцэтгэл үзүүлж байна.

Үргэлжлэх хугацааг (1) гаралтын үүсгэх хугацаа (гаралтын токен ÷ семплингийн хурд), (2) prefill хугацаа (prefill токен ÷ prefill хурд), (3) хэрэгслийн нийт гүйцэтгэх хугацаа, мөн (4) сүлжээний нийт нэмэлт ачааллын нийлбэрээр тооцоолсон.

Бүх загварын саатлын сайжруулалт

Бид Codex-Spark-ийг сургах явцад бодит цагийн хамтын ажиллагаанд загварын хурд бол зөвхөн нэг хэсэг гэдэг нь тодорхой болсон—мөн хүсэлт-хариу дамжуулах бүх шугамын турш саатлыг багасгах шаардлагатай байв. Бид бүх загварт ашиг тусаа өгөх төгсгөлөөс төгсгөл хүртэлх саатлын сайжруулалтуудыг harness-даа хэрэгжүүлсэн. Дотоод түвшинд бид хариунууд клиентээс сервер рүү, буцаад хэрхэн stream хийгддэгийг оновчлон, inference stack-ийнхаа гол хэсгүүдийг дахин бичиж, session-уудыг хэрхэн эхлүүлдгийг шинэчилснээр эхний харагдах токен илүү хурдан гарч, Codex таныг давтан ажиллах үед хариу үйлдэлтэй хэвээр байдаг болсон. Тогтвортой WebSocket холболт болон Responses API доторх чиглэсэн оновчлолуудыг нэвтрүүлснээр бид клиент/серверийн нэг roundtrip тутмын нэмэлт ачааллыг 80%, токен тутмын нэмэлт ачааллыг 30%, мөн эхний токен хүртэлх хугацааг 50%-иар бууруулсан. WebSocket зам нь Codex-Spark-д анхдагчаар идэвхжсэн бөгөөд тун удахгүй бүх загварын анхдагч горим болно.

Cerebras-ээр ажилладаг

Codex-Spark нь Cerebras-ийн Wafer Scale Engine 3(шинэ цонхонд нээгдэнэ) дээр ажилладаг—өндөр хурдны inference-д зориулан бүтээсэн AI accelerator бөгөөд Codex-д саатлыг нэн тэргүүнд тавьсан serving tier өгдөг. Бид энэ бага сааталтай замыг манай бусад дэд бүтцийн адил нэг production serving stack-д нэмэхийн тулд Cerebras-тай хамтарсан тул энэ нь Codex даяар саадгүй ажиллаж, ирээдүйн загваруудыг дэмжих суурийг бүрдүүлж байна.

“GPT-5.3-Codex-Spark-ийн талаар биднийг хамгийн их догдлуулж буй зүйл бол OpenAI болон хөгжүүлэгчдийн хамт олонтой хамтран, хурдан inference юуг боломжтой болгодгийг нээж илрүүлэх явдал—шинэ харилцан үйлчлэлийн загварууд, шинэ хэрэглээний тохиолдлууд, мөн загварын цоо шинэ туршлага. Энэ preview бол дөнгөж эхлэл.”
— Cerebras-ийн CTO, хамтран үүсгэн байгуулагч Sean Lie

GPU-ууд нь манай сургалт болон inference шугамуудын суурь хэвээр байгаа бөгөөд өргөн хэрэглээнд хамгийн өртөг багатай токенуудыг хүргэдэг. Cerebras нь маш бага саатал шаарддаг ажлын урсгалуудад онцгой сайн байж, төгсгөлөөс төгсгөл хүртэлх мөчлөгийг чангатгаснаар Codex-ийг давтан ажиллах үед илүү хурдан мэдрэмжтэй болгодог. GPU болон Cerebras-ийг нэг ажлын ачаалалд хослуулан хамгийн сайн гүйцэтгэлд хүрч болно.

Хүртээмж ба дэлгэрэнгүй

Codex-Spark нь өнөөдрөөс эхлэн Codex апп, CLI, болон VS Code extension-ийн хамгийн сүүлийн хувилбаруудад ChatGPT Pro хэрэглэгчдэд research preview хэлбэрээр нэвтэрч байна. Энэ нь тусгай бага сааталтай тоног төхөөрөмж дээр ажилладаг тул хэрэглээ нь research preview-ийн явцад эрэлтээс хамааран өөрчлөгдөж болох тусдаа rate limit-ээр зохицуулагдана. Нэмж хэлэхэд, хөгжүүлэгчид Codex-Spark-ийг бүтээгдэхүүндээ хэрхэн нэгтгэхийг хүсэж байгааг ойлгохын тулд бид Codex-Spark-ийг API-аар цөөн тооны design partner-д мөн олгож байна. Бодит ажлын ачаалал дор интеграцаа цаашид тааруулан сайжруулахын хэрээр бид ирэх хэдэн долоо хоногт хандалтаа өргөжүүлнэ.

Codex-Spark нь одоогоор 128k контекст цонхтой, зөвхөн текст дэмждэг бөгөөд хэт хурдан загваруудын нэгэн гэр бүлийн эхлэл юм. Хурдан загварууд кодчлолд яг хаана хамгийн сайн гэрэлтдгийг хөгжүүлэгчдийн хамт олонтойгоо хамт илүү сайн ойлгохын хэрээр бид бүр илүү олон боломжуудыг—үүнд илүү том загварууд, урт контекстийн хэмжээ, мөн multimodal оролт багтана—нэвтрүүлэх болно.

Codex-Spark нь манай үндсэн шугамын загваруудтай ижил аюулгүй байдлын сургалтыг, үүнд киберт хамаарах сургалтыг багтаан агуулдаг. Бид Codex-Spark-ийг кибер болон бусад чадварын суурь үнэлгээнүүдийг багтаадаг стандарт нэвтрүүлэлтийн процессынхаа хүрээнд үнэлсэн бөгөөд энэ нь кибер аюулгүй байдал эсвэл биологийн чиглэлээр өндөр чадварын Preparedness Framework босгонд хүрэх бодит боломжгүй гэж тогтоосон.

Дараа нь юу вэ

Codex-Spark нь харилцан нөхөх хоёр горимтой Codex руу чиглэх эхний алхам юм: урт хугацааны сэтгэн бодох ба гүйцэтгэл, мөн хурдан давталтад зориулсан бодит цагийн хамтын ажиллагаа. Цаг хугацааны явцад эдгээр горимууд уусах болно—Codex нь таныг нягт интерактив мөчлөгт байлгахын зэрэгцээ урт хугацаанд үргэлжлэх ажлыг цаана нь дэд агентуудад даатгаж, эсвэл өргөн хүрээ ба хурд хэрэгтэй үед олон загварт даалгавруудыг зэрэг тарааж чадна, ингэснээр та эхнээс нь ганц горим сонгох шаардлагагүй болно.

Загварууд илүү чадвартай болох тусам харилцан үйлчлэлийн хурд тодорхой саад болж байна. Хэт хурдан inference энэ мөчлөгийг чангатгаж, Codex-ийг ашиглахад илүү байгаллаг мэт мэдрэмж төрүүлэн, санааг ажилладаг програм хангамж болгохыг хүссэн хэн бүхэнд боломжийн хүрээг тэлж байна.

Зохиогч

OpenAI