Անցնել հիմնական բովանդակությանը
OpenAI

Ներկայացնում ենք GPT‑5.3‑Codex‑Spark-ը

Codex-ում իրական ժամանակում կոդավորման համար գերհզոր մոդել։

Բեռնվում է…

Այսօր մենք թողարկում ենք GPT‑5.3‑Codex‑Spark‑ի հետազոտական նախադիտումը՝ GPT‑5.3‑Codex‑ի ավելի փոքր տարբերակը, և մեր առաջին մոդելը, որը նախատեսված է իրական ժամանակում կոդավորման համար։ Codex-Spark-ը նշանավորում է Cerebras-ի հետ մեր համագործակցության առաջին հանգրվանը, որը մենք հայտարարեցինք հունվարին։ Codex-Spark-ը օպտիմիզացված է՝ գերծածր հապաղմամբ սարքավորման վրա մատուցվելիս գրեթե ակնթարթային զգացողություն ապահովելու համար՝ մեկ վայրկյանում ապահովելով ավելի քան 1000 թոքեն՝ միաժամանակ մնալով բարձր ունակ իրական աշխարհի կոդավորման առաջադրանքների համար։

Մենք Codex-Spark-ը Cerebras-ի վրա տրամադրում ենք որպես հետազոտական նախադիտում ChatGPT Pro օգտատերերին, որպեսզի ծրագրավորողները կարողանան վաղ սկսեն փորձարկել, մինչ մենք Cerebras-ի հետ աշխատում ենք տվյալների կենտրոնի հզորությունը մեծացնելու, ամբողջական օգտատիրոջ փորձը ամրապնդելու և մեր ավելի մեծ առաջադեմ մոդելները տեղակայելու ուղղությամբ։

Մեր վերջին առաջադեմ մոդելները ցուցադրել են առանձնահատուկ ուժեր՝ երկարատև առաջադրանքներ կատարելու իրենց կարողության մեջ՝ ինքնուրույն աշխատելով ժամերով, օրերով կամ շաբաթներով՝ առանց միջամտության։ Codex-Spark-ը մեր առաջին մոդելն է, որը հատուկ նախագծված է Codex-ի հետ իրական ժամանակում աշխատելու համար՝ նպատակային խմբագրումներ կատարելու, տրամաբանությունը վերաձևակերպելու կամ ինտերֆեյսները կատարելագործելու և անմիջապես արդյունքները տեսնելու համար։ Codex-Spark-ի միջոցով Codex-ն այժմ աջակցում է ինչպես երկարատև, հավակնոտ առաջադրանքներին, այնպես էլ տվյալ պահին աշխատանքն ավարտելուն։ Մենք հույս ունենք սովորել, թե ինչպես են մշակողները օգտագործում այն և ներառել նրանց կարծիքները, երբ շարունակենք ընդլայնել հասանելիությունը։

Գործարկման պահին Codex-Spark-ը ունի 128 հազար համատեքստի պատուհան և միայն տեքստային է։ Հետազոտական նախադիտման ընթացքում Codex-Spark-ը կունենա իր սեփական սահմանաչափերը, և օգտագործումը չի հաշվարկվի ստանդարտ սահմանաչափերի մեջ։ Սակայն, երբ պահանջարկը բարձր է, հնարավոր է, որ տեսնեք սահմանափակ մուտք կամ ժամանակավոր հերթագրում, քանի որ մենք հավասարակշռում ենք հուսալիությունը բոլոր օգտատերերի միջև։

Արագություն և բանականություն

Codex-Spark-ը օպտիմիզացված է ինտերակտիվ աշխատանքի համար, որտեղ ուշացումը նույնքան կարևոր է, որքան խելքը։ Դուք կարող եք իրական ժամանակում համագործակցել մոդելի հետ՝ ընդհատելով կամ վերաուղղորդելով այն, երբ այն աշխատում է, և արագ կրկնել՝ գրեթե ակնթարթային պատասխաններով։ Քանի որ այն կարգավորված է արագ աշխատանքի համար, Codex-Spark-ը իր կանխադրված աշխատանքային ոճը պահում է թեթև՝ կատարելով նվազագույն, նպատակային խմբագրումներ և ինքնաբերաբար թեստեր չի գործարկում, եթե դուք չխնդրեք։

Կոդավորում

Codex-Spark-ը բարձր կարողունակ փոքր մոդել է, որը օպտիմալացված է արագ ինֆերենսի համար։ SWE-Bench Pro և Terminal-Bench 2.0՝ երկու չափանիշներ, որոնք գնահատում են գործակալային ծրագրային ճարտարագիտության կարողությունը, GPT‑5.3‑Codex‑Spark‑ը, ցուցադրում են բարձր արդյունավետություն՝ առաջադրանքները կատարելով ժամանակի մի փոքր հատվածում՝ համեմատած GPT‑5.3‑Codex‑ի հետ։

Տևողությունը գնահատվում է որպես (1) արտածման գեներացման ժամանակի (արտածման թոքեններ ÷ նմուշառման արագություն), (2) նախալցման ժամանակի (նախալցման թոքեններ ÷ նախալցման արագություն), (3) գործիքների կատարման ընդհանուր ժամանակի և (4) ցանցային ընդհանուր հավելյալ ծախսերի գումարը։

Հապաղման բարելավումներ բոլոր մոդելների համար

Երբ մենք ուսուցանում էինք Codex-Spark-ը, պարզ դարձավ, որ մոդելի արագությունը իրական ժամանակում համագործակցության համար հավասարման միայն մի մասն է. մենք նաև պետք է նվազեցնենք ուշացումը ամբողջ հարցում-պատասխան խողովակաշարի ընթացքում։ Մենք մեր համակարգում իրականացրել ենք ծայրից ծայր հապաղման բարելավումներ, որոնք կօգնեն բոլոր մոդելներին։ Ներքին մակարդակում մենք պարզեցրինք, թե ինչպես են պատասխանները հոսում հաճախորդից դեպի սերվեր և հետ, վերաշարադրեցինք մեր ինֆերենս ստեկի հիմնական մասերը և վերամշակեցինք, թե ինչպես են սեսիաները սկզբնավորվում, որպեսզի առաջին տեսանելի թոքենը ավելի շուտ հայտնվի, և Codex-ը մնա արձագանքող, երբ դուք կրկնակի փորձարկումներ եք կատարում։ Մշտական WebSocket կապի ներդրման և Responses API-ի ներսում նպատակային օպտիմիզացիաների շնորհիվ մենք նվազեցրինք հաճախորդ/սերվեր շրջապտույտի հավելյալ ծախսը 80%-ով, յուրաքանչյուր թոքենի համար հավելյալ ծախսը՝ 30%-ով, և առաջին թոքենի ժամանակը՝ 50%-ով։ WebSocket ուղին կանխադրված միացված է Codex-Spark-ի համար և շուտով կդառնա կանխադրվածը բոլոր մոդելների համար։

Cerebras-ի կողմից աշխատեցված

Codex-Spark-ը աշխատում է Cerebras-ի Wafer Scale Engine 3(բացվում է նոր պատուհանում)-ի վրա՝ բարձր արագությամբ ինֆերենսի համար հատուկ նախագծված ԱԲ արագացուցիչ, որը Codex-ին ապահովում է հապաղում-առաջնահերթ սպասարկման շերտ։ Մենք համագործակցեցինք Cerebras-ի հետ՝ այս ցածր հապաղմամբ ուղին ավելացնելու նույն արտադրական սպասարկման կուտակին, ինչ մեր մնացած պարկը, որպեսզի այն անխափան աշխատի Codex-ի հետ և մեզ պատրաստի ապագա մոդելներին աջակցելու համար։

«GPT-5.3-Codex-Spark-ի մասին մեզ ամենաշատը ոգևորում է OpenAI-ի և ծրագրավորողների համայնքի հետ համագործակցությունը՝ բացահայտելու, թե ինչ հնարավորություններ է ընձեռում արագ ինֆերենսը՝ նոր փոխազդեցության ձևաչափեր, նոր կիրառման դեպքեր և սկզբունքորեն այլ մոդելի փորձառություն։ Այս նախադիտումը միայն սկիզբն է»։
— Շոն Լի, Cerebras-ի տեխնիկական տնօրեն և համահիմնադիր

GPU-ները շարունակում են մնալ հիմնարար մեր ուսուցման և եզրակացության գործընթացներում և ապահովում են ամենածախսարդյունավետ թոքենները լայն կիրառման համար։ Cerebras-ը լրացնում է այդ հիմքը՝ գերազանցելով այն աշխատանքային հոսքերում, որոնք պահանջում են չափազանց ցածր հապաղում՝ սեղմելով ամբողջական ցիկլը, որպեսզի Codex-ը ավելի արձագանքող լինի, երբ դուք կատարելագործում եք։ GPU-ները և Cerebras-ը կարող են համակցվել մեկ աշխատանքային ծանրաբեռնվածության համար՝ լավագույն կատարողականին հասնելու համար։

Հասանելիություն և մանրամասներ

Codex-Spark-ը այսօր թողարկվում է որպես հետազոտական նախադիտում ChatGPT Pro օգտատերերի համար Codex հավելվածի, CLI-ի և VS Code ընդլայնման վերջին տարբերակներում։ Քանի որ այն աշխատում է մասնագիտացված ցածր հապաղմամբ սարքավորման վրա, օգտագործումը կարգավորվում է առանձին սահմանաչափով, որը կարող է փոփոխվել պահանջարկից կախված՝ հետազոտական նախադիտման ընթացքում։ Բացի այդ, մենք Codex-Spark-ը հասանելի ենք դարձնում API-ում դիզայնի գործընկերների փոքր խմբի համար՝ հասկանալու, թե ինչպես են ծրագրավորողները ցանկանում Codex-Spark-ը ինտեգրել իրենց արտադրանքների մեջ։ Մենք առաջիկա շաբաթների ընթացքում կընդլայնենք հասանելիությունը՝ շարունակելով կարգավորել մեր ինտեգրումը իրական աշխատանքային բեռների պայմաններում։

Codex-Spark-ը ներկայումս միայն տեքստային է՝ 128 հազար նիշ համատեքստի պատուհանով և ուլտրաարագ մոդելների ընտանիքի առաջինն է։ Քանի որ մենք ծրագրավորողների համայնքի հետ ավելի շատ ենք իմանում, թե որտեղ են արագ մոդելները փայլում կոդավորման համար, մենք կներկայացնենք ավելի շատ հնարավորություններ՝ ներառյալ ավելի մեծ մոդելներ, ավելի երկար համատեքստեր և բազմամոդալ մուտքեր։

Codex-Spark-ը ներառում է նույն անվտանգության ուսուցումը, ինչ մեր հիմնական մոդելները, ներառյալ կիբերանվտանգության հետ կապված ուսուցումը։ Մենք գնահատեցինք Codex-Spark-ը՝ որպես մեր ստանդարտ ներդրման գործընթացի մաս, որը ներառում է կիբեր և այլ կարողությունների բազային գնահատումներ, և որոշեցինք, որ այն չունի հավանական հնարավորություն հասնելու մեր Պատրաստվածության շրջանակի շեմին՝ կիբերանվտանգության կամ կենսաբանության ոլորտում բարձր կարողության հասնելու համար։

Ի՞նչ է հաջորդը

Codex-Spark-ը առաջին քայլն է դեպի Codex՝ երկու փոխլրացնող ռեժիմներով՝ երկարաժամկետ հիմնավորում և կատարում, և իրական ժամանակի համագործակցություն՝ արագ կրկնության համար։ Ժամանակի ընթացքում ռեժիմները կխառնվեն՝ Codex-ը կարող է ձեզ պահել սերտ ինտերակտիվ ցիկլում՝ միաժամանակ ֆոնային ռեժիմով ավելի երկարատև աշխատանքը պատվիրակելով ենթաագենտներին կամ առաջադրանքները զուգահեռաբար բաշխելով բազմաթիվ մոդելների միջև, երբ ցանկանում եք լայնություն և արագություն, որպեսզի ստիպված չլինեք նախապես ընտրել մեկ ռեժիմ։

Քանի որ մոդելները դառնում են ավելի կարողունակ, փոխազդեցության արագությունը ակնհայտորեն դառնում է խոչընդոտ։ Ուլտրաարագ ինֆերենցը սեղմում է այդ ցիկլը՝ Codex-ի օգտագործումը դարձնելով ավելի բնական և ընդլայնելով հնարավորությունները բոլոր նրանց համար, ովքեր գաղափարը վերածում են աշխատող ծրագրային ապահովման։

Հեղինակ

OpenAI