Անցնել հիմնական բովանդակությանը
OpenAI

23 ապրիլի, 2026 թ.

ԱրտադրանքԹողարկում

Ներկայացնում ենք GPT‑5.5‑ը

Իրական աշխատանքի համար բանականության նոր դաս

Բեռնվում է…

Թարմացում՝ 2026 թվականի ապրիլի 24-ին․ GPT‑5.5-ը և GPT‑5.5 Pro-ն այժմ հասանելի են API-ում։ Համակարգի քարտը նույնպես թարմացվել է՝ նկարագրելու համար կիրառվող լրացուցիչ պաշտպանական միջոցները։


Մենք թողարկում ենք GPT‑5.5‑ը՝ մինչ օրս մեր ամենախելացի և օգտագործման համար ամենաինտուիտիվ մոդելը, ինչպես նաև համակարգչով աշխատանք կատարելու նոր եղանակի ուղղությամբ հաջորդ քայլը։

GPT‑5.5‑ն ավելի արագ է հասկանում, թե ինչ եք փորձում անել, և կարող է ինքնուրույն կատարել աշխատանքի ավելի մեծ մասը։ Այն գերազանց է կոդ գրելու և վրիպազերծելու, առցանց հետազոտություն կատարելու, տվյալները վերլուծելու, փաստաթղթեր և աղյուսակաթերթեր ստեղծելու, ծրագրային ապահովում գործարկելու և գործիքների միջև անցնելու մեջ՝ մինչև առաջադրանքի ավարտը։ Յուրաքանչյուր քայլը մանրակրկիտ կառավարելու փոխարեն կարող եք GPT‑5.5‑ին տալ խառն, բազմամաս առաջադրանք և վստահել, որ այն կկարողանա պլանավորել, օգտագործել գործիքներ, ստուգել իր աշխատանքը, կողմնորոշվել երկիմաստության պայմաններում և շարունակել առաջ շարժվել։

Առավելությունները հատկապես զգալի են ագենտային կոդավորման, համակարգչի օգտագործման, գիտելիքային աշխատանքի և վաղ փուլերի գիտական հետազոտությունների ոլորտներում՝ այնպիսի ոլորտներում, որտեղ առաջընթացը կախված է համատեքստի շրջանակում հիմնավորումից և ժամանակի ընթացքում գործողություններ կատարելուց։ GPT‑5.5‑ն ապահովում է բանականության այս աճը՝ առանց արագության վրա փոխզիջման գնալու. ավելի մեծ և ավելի ունակ մոդելները հաճախ ավելի դանդաղ են մատուցվում, սակայն GPT‑5.5‑ը իրական պայմաններում մատուցման ընթացքում մեկ թոքենի հաշվով ուշացմամբ համընկնում է GPT‑5.4‑ի հետ՝ միաժամանակ ցուցաբերելով բանականության շատ ավելի բարձր մակարդակ։ Այն նաև օգտագործում է զգալիորեն ավելի քիչ թոքեններ՝ նույն Codex առաջադրանքները կատարելու համար, ինչը այն դարձնում է ոչ միայն ավելի արդյունավետ, այլև ավելի ունակ։

Մենք թողարկում ենք GPT‑5.5‑ը՝ մինչ օրս մեր ամենաուժեղ պաշտպանիչ միջոցների փաթեթով, որոնք նախատեսված են չարաշահումը նվազեցնելու՝ միաժամանակ պահպանելով օգտակար աշխատանքի համար հասանելիությունը։ Մինչև թողարկումը մենք գնահատել ենք այս մոդելը մեր անվտանգության և պատրաստվածության շրջանակների ամբողջական փաթեթով, աշխատել ենք ներքին և արտաքին անվտանգության փորձագետների հետ, ավելացրել ենք նպատակային փորձարկումներ կիբերանվտանգության և կենսաբանության առաջադեմ կարողությունների համար և հավաքել ենք իրական օգտագործման դեպքերի վերաբերյալ արձագանքներ վաղ հասանելիություն ունեցող գրեթե 200 վստահելի գործընկերներից։

Այսօր GPT‑5.5‑ը սկսում է տարածվել ChatGPT‑ում և Codex-ում՝ Plus, Pro, Business և Enterprise օգտատերերի համար, իսկ GPT‑5.5 Pro-ն սկսում է տարածվել ChatGPT‑ում՝ Pro, Business և Enterprise օգտատերերի համար։ API-ների տեղակայումները պահանջում են տարբեր պաշտպանիչ միջոցներ, և մենք սերտորեն համագործակցում ենք գործընկերների և հաճախորդների հետ՝ այն լայն մասշտաբով մատուցելու համար անվտանգության և պաշտպանվածության պահանջների շուրջ։ GPT‑5.5 և GPT‑5.5 Pro-ն շատ շուտով կհասցնենք API։

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82,7%

75.1%

-

-

69.4%

68.5%

Expert-SWE (Ներքին)

73,1%

68.5%

-

-

-

-

GDPval (հաղթանակներ կամ ոչ-ոքի)

84,9%

83,0%

82.3%

82.0%

80,3%

67.3%

OSWorld հաստատված

78.7%

75,0%

-

-

78.0%

-

Toolathlon

55,6%

54.6%

-

-

-

48.8%

BrowseComp

84.4%

82,7%

90.1%

89.3%

79.3%

85.9%

FrontierMath 1–3 մակարդակ

51.7%

47.6%

52,4%

50.0%

43.8%

36.9%

FrontierMath 4-րդ մակարդակ

35.4%

27.1%

39,6%

38,0%

22.9%

16.7%

CyberGym

81.8%

79.0%

-

-

73,1%

-

Մոդելի հնարավորություններ

OpenAI-ը կառուցում է ագենտային ԱԲ-ի համաշխարհային ենթակառուցվածքը՝ հնարավորություն տալով աշխարհի տարբեր ծայրերում գտնվող մարդկանց և բիզնեսներին ԱԲ-ի միջոցով կատարել իրենց աշխատանքը։ Վերջին տարվա ընթացքում մենք տեսել ենք, թե ինչպես է ԱԲ-ն կտրուկ արագացնում ծրագրային ճարտարագիտությունը։ GPT‑5.5‑ով Codex-ում և ChatGPT‑ում նույն փոխակերպումը սկսում է տարածվել դեպի գիտական հետազոտությունները և մարդկանց՝ համակարգիչներով կատարած ավելի լայն շրջանակի աշխատանքը։

Այս ոլորտներում GPT‑5.5‑ը ոչ միայն ավելի խելացի է, այլև ավելի արդյունավետ խնդիրների լուծման մեջ՝ հաճախ հասնելով ավելի բարձր որակի արդյունքների՝ ավելի քիչ թոքեններով և կրկնափորձերով։ Artificial Analysis-ի Coding Index-ում GPT‑5.5‑ը ապահովում է նորագույն մակարդակի բանականություն՝ մրցակցային առաջադեմ կոդավորման մոդելների համեմատ կես գնով։

Artificial Analysis Intelligence Index(բացվում է նոր պատուհանում) -ը արտաքին կողմի կողմից անցկացված 10 գնահատումների կշռված միջինն է՝ AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom։

Գործակալական կոդավորում

GPT‑5.5‑ը մեր մինչ օրս ամենահզոր ագենտային կոդավորման մոդելն է։ Terminal-Bench 2.0-ում, որը ստուգում է պլանավորում, կրկնվող մշակում և գործիքների համակարգում պահանջող բարդ հրամանային տողի աշխատանքային հոսքերը, այն հասնում է ոլորտում լավագույն 82.7% ճշգրտության։ SWE-Bench Pro-ում, որը գնահատում է GitHub-ի իրական խնդիրների լուծումը, այն հասնում է 58,6%-ի՝ նախորդ մոդելների համեմատ մեկ անցմամբ ավելի շատ առաջադրանքներ լուծելով։ Expert-SWE-ում՝ մեր ներքին առաջադեմ գնահատման համար, որը նախատեսված է երկարաժամկետ կոդավորման առաջադրանքների համար, որտեղ մարդու կողմից ավարտելու միջին գնահատված ժամանակը կազմում է 20 ժամ, GPT‑5.5‑ը նույնպես գերազանցում է GPT‑5.4‑ին։

Բոլոր երեք գնահատականներում GPT‑5.5‑ը բարելավել է GPT‑5.4‑ի արդյունքները։ գնահատականներ՝ միաժամանակ օգտագործելով ավելի քիչ թոքեն։

Մոդելի ծրագրավորման ուժեղ կողմերը հատկապես հստակ երևում են Codex-ում, որտեղ այն կարող է ստանձնել ինժեներական աշխատանք՝ սկսած իրականացումից և վերափոխումներից մինչև վրիպազերծում, թեստավորում և վավերացում։ Վաղ փորձարկումները ցույց են տալիս, որ GPT‑5.5‑ն ավելի լավ է այն վարքագծերում, որոնցից կախված է իրական ինժեներական աշխատանքը, օրինակ՝ խոշոր համակարգերի միջև համատեքստը պահպանելը, երկիմաստ խափանումները հիմնավորելով վերլուծելը, գործիքների միջոցով ենթադրությունները ստուգելը և փոփոխությունները հարակից կոդային բազայում ամբողջությամբ տարածելը։

Պատկերված հետագիծը օգտագործում է NASA/JPL Horizons-ի վեկտորային տվյալները Օրիոնի, Լուսնի և Արեգակի համար, իսկ ցուցադրման մասշտաբավորումը կիրառված է՝ ընթեռնելիությունն ապահովելու համար։

Հարցում. [կից նկար] Իրականացրու սա որպես նոր հավելված՝ օգտագործելով webgl և vite՝ օգտագործելով Artemis II առաքելության իրական տվյալները։ Համոզվիր, որ մանրակրկիտ փորձարկում ես հավելվածը, մինչև այն լիովին գործունակ լինի և տեսքով նման լինի նկարում պատկերված հավելվածին։ Հատուկ ուշադրություն դարձրու մոլորակների արտապատկերմանը և թռիչքի ուղիներին։ Ես ցանկանում եմ փոխազդել 3D արտապատկերման հետ։ Համոզվիր, որ այն ունի իրատեսական ուղեծրային մեխանիկա։

Չափանիշներից անդին, վաղ փորձարկողները նշել են, որ GPT‑5.5‑ը ցույց է տալիս համակարգի կառուցվածքը հասկանալու ավելի ուժեղ կարողություն՝ ինչու է ինչ-որ բան ձախողվում, որտեղ պետք է կիրառվի շտկումը, և էլ ինչի վրա կազդի դա կոդային բազայում։

alt

«Առաջին կոդավորման մոդելը, որ ես օգտագործել եմ, որն ունի իսկապես լուրջ հայեցակարգային հստակություն»։

Դեն Շիփեր, Every-ի հիմնադիր և գործադիր տնօրենը, GPT‑5.5‑ը նկարագրել է որպես «առաջին կոդավորման մոդելը, որ ես օգտագործել եմ, որն ունի լուրջ գաղափարական հստակություն»։

Հավելվածը գործարկելուց հետո նա օրեր անցկացրեց՝ կարգաբերելով գործարկումից հետո առաջացած խնդիրը, նախքան իր լավագույն ինժեներներից մեկին ներգրավելը՝ համակարգի մի մասը վերաշարադրելու համար։ GPT‑5.5‑ը փորձարկելու համար նա, ըստ էության, ժամանակը հետ տվեց. մոդելը կարո՞ղ էր նայել խափանված վիճակին և ստեղծել նույնպիսի վերաշարադրում, որի մասին ինժեները վերջնականապես որոշեց։ GPT‑5.4‑ը չկարողացավ։ GPT‑5.5‑ը կարողացավ։

alt

«Իսկապես թվում է, թե ես աշխատում եմ ավելի բարձր բանականության հետ, և գրեթե հարգանքի զգացում կա»։

Pietro Schirano, MagicPath-ի գլխավոր տնօրենը, նմանատիպ կտրուկ փոփոխություն նկատեց, երբ GPT‑5.5‑ը frontend-ի և վերակառուցման հարյուրավոր փոփոխություններ պարունակող մի ճյուղ միավորեց զգալիորեն փոփոխված հիմնական ճյուղի մեջ՝ ամբողջ աշխատանքը մեկ օրինակ լուծելով մոտ 20 րոպեում։

Մոդելը փորձարկած առաջատար ինժեներներն ասացին, որ GPT‑5.5‑ը հիմնավորման և ինքնավարության մեջ ակնհայտորեն ավելի ուժեղ էր, քան GPT‑5.4‑ը և Claude Opus 4.7-ը՝ նախապես հայտնաբերում էր խնդիրները և կանխատեսում էր փորձարկման և վերանայման կարիքները՝ առանց հստակ հուշման։ Մի դեպքում ինժեները խնդրեց դրան վերաճարտարապետել մեկնաբանությունների համակարգը համատեղ markdown խմբագրիչում և վերադարձավ 12 diff-անոց ստեկի, որը գրեթե ավարտված էր։ Մյուսներն ասացին, որ իրենց զարմանալիորեն քիչ իրականացման շտկում էր պետք և GPT‑5.5‑ի ծրագրերի նկատմամբ ավելի վստահ էին, քան GPT‑5.4‑ի դեպքում։

NVIDIA-ի մի ինժեներ, որը մոդելին վաղ հասանելիություն ուներ, նույնիսկ ասաց. «GPT‑5.5‑ի հասանելիությունը կորցնելը այնպիսի զգացողություն է, կարծես վերջույթս անդամահատել են»։

«GPT-5.5-ը նկատելիորեն ավելի խելացի և ավելի հետևողական է, քան GPT-5.4-ը, ավելի ուժեղ կոդավորման կատարողականությամբ և գործիքների ավելի հուսալի օգտագործմամբ։ Այն մնում է առաջադրանքի վրա էականորեն ավելի երկար՝ առանց վաղաժամ դադարելու, ինչը հատկապես կարևոր է այն բարդ, երկարատև աշխատանքի համար, որը մեր օգտատերերը պատվիրակում են Cursor-ին։
— Մայքլ Թրուել, Cursor-ի համահիմնադիր և գործադիր տնյորեն

Գիտելիքի աշխատանք

Նույն ուժեղ կողմերը, որոնք GPT‑5.5‑ին ծրագրավորման մեջ գերազանց են դարձնում, այն դարձնում են հզոր գործիք համակարգչով ամենօրյա աշխատանքի համար։ Քանի որ մոդելը ավելի լավ է հասկանում մտադրությունը, այն կարող է ավելի բնական կերպով անցնել գիտելիքային աշխատանքի ամբողջ ցիկլով՝ տեղեկատվություն գտնելով, հասկանալով, թե ինչն է կարևոր, գործիքներ օգտագործելով, արդյունքը ստուգելով և հում նյութը օգտակար բանի վերածելով։

Codex-ում GPT‑5.5‑ը գերազանցում է GPT‑5.4‑ին փաստաթղթեր, աղյուսակներ և սահիկաշարեր ստեղծելու հարցում։ Ալֆա փորձարկողները նշել են, որ այն գերազանցում է նախորդ մոդելներին այնպիսի աշխատանքներում, ինչպիսիք են օպերացիոն հետազոտությունը, աղյուսակների մոդելավորումը և խառնաշփոթ բիզնես մուտքային տվյալները պլանների վերածելը։ Codex-ի համակարգչի օգտագործման հմտությունների հետ համատեղ՝ GPT‑5.5‑ը մեզ ավելի է մոտեցնում այն զգացողությանը, որ մոդելը կարող է ձեզ հետ իրականում օգտագործել համակարգիչը՝ տեսնել, թե ինչ կա էկրանին, սեղմել, մուտքագրել, կողմնորոշվել ինտերֆեյսներում և ճշգրտությամբ անցնել գործիքների միջև։

OpenAI-ի թիմերը արդեն օգտագործում են այս ուժեղ կողմերը իրական աշխատանքային հոսքերում։ Այսօր ընկերության ավելի քան 85%-ը ամեն շաբաթ Codex-ն օգտագործում է տարբեր բաժիններում՝ ներառյալ ծրագրային ապահովման ճարտարագիտությունը, ֆինանսները, հաղորդակցությունները, մարքեթինգը, տվյալագիտությունը և արտադրանքի կառավարումը։ Հաղորդակցությունների բաժնում թիմը Codex-ում օգտագործել է GPT‑5.5‑ը՝ վերլուծելու ելույթների հարցումների վեց ամսվա տվյալները, ստեղծելու գնահատման և ռիսկերի շրջանակ, ինչպես նաև Slack-ի ավտոմատացված ագենտը վավերացնելու համար, որպեսզի ցածր ռիսկ ունեցող հարցումները մշակվեն ավտոմատ կերպով, իսկ բարձր ռիսկ ունեցողները՝ ուղարկվեն մարդկային վերանայման։ Ֆինանսների բաժնում թիմը օգտագործեց Codex-ը՝ 24 771 K-1 հարկային ձևաթղթեր վերանայելու համար, որոնք ընդհանուր առմամբ կազմում էին 71 637 էջ։ Աշխատանքային հոսքը բացառել էր անձնական տեղեկությունները և թիմին օգնել էր առաջադրանքի կատարումն արագացնել երկու շաբաթով՝ նախորդ տարվա համեմատ։ Շուկա մտնելու համար թիմում աշխատակիցներից մեկը ավտոմատացրել է շաբաթական բիզնես հաշվետվությունների պատրաստումը՝ շաբաթական խնայելով 5-10 ժամ։

ChatGPT‑ում GPT‑5.5 Thinking ռեժիմը բացում է ավելի արագ օգնություն ավելի դժվար խնդիրների համար՝ ապահովելով ավելի խելացի և ավելի հակիրճ պատասխաններ, որպեսզի դուք կարողանաք ավելի արդյունավետ առաջ շարժվել բարդ աշխատանքներում։ Այն գերազանցում է մասնագիտական աշխատանքներում՝ կոդավորում, հետազոտություն, տեղեկատվության սինթեզ և վերլուծություն, ինչպես նաև փաստաթղթերի վրա հիմնված առաջադրանքներ, հատկապես՝ պլագիններ օգտագործելիս։

GPT‑5.5 Pro-ում վաղ փորձարկողները տեսնում են նշանակալի առաջընթաց ինչպես այն աշխատանքի բարդության, այնպես էլ որակի առումով, որը ChatGPT‑ն կարող է ստանձնել, ինչպես նաև ուշացման բարելավումներ, որոնք այն շատ ավելի գործնական են դարձնում պահանջկոտ առաջադրանքների համար։ GPT‑5.4 Pro-ի համեմատ՝ փորձարկողները գտել են, որ GPT‑5.5 Pro-ի պատասխանները զգալիորեն ավելի համապարփակ, լավ կառուցված, ճշգրիտ, տեղին և օգտակար են՝ հատկապես բարձր արդյունավետությամբ բիզնեսի, իրավունքի, կրթության և տվյալագիտության ոլորտներում։

GPT‑5.5‑ը հասնում է գերժամանակակից արդյունավետության բազմաթիվ չափանիշներով, որոնք արտացոլում են այս տեսակի աշխատանքը։ GDPval-ում, որը ստուգում է ագենտների կարողությունները՝ 44 զբաղմունքների շրջանակում հստակ սահմանված գիտելիքի վրա հիմնված աշխատանք կատարելու համար, GPT‑5.5‑ը ստանում է 84,9%։ OSWorld-Verified-ում, որը չափում է, թե արդյոք մոդելը կարող է ինքնուրույն գործել իրական համակարգչային միջավայրերում, այն հասնում է 78,7%-ի։ Եվ Tau2-bench Telecom-ում, որը ստուգում է հաճախորդների սպասարկման բարդ աշխատանքային հոսքերը, այն հասնում է 98.0%-ի՝ առանց հարցումի ճշգրտման։ GPT‑5.5-ը նույնպես բարձր արդյունքներ է ցույց տալիս գիտելիքային աշխատանքի այլ հենանիշներում՝ FinanceAgent-ում՝ 60,0%, ներքին ներդրումային բանկային մոդելավորման առաջադրանքներում՝ 88,5%, և OfficeQA Pro-ում՝ 54,1%։

Tau2-bench Telecom-ը գործարկվել է առանց հարցման թյունինգի (և GPT‑4.1‑ը որպես օգտատիրոջ մոդել)։ GPT‑5.5‑ը ավելի լավ է հասկանում առաջադրանքի նպատակը և թոքենների առումով ավելի արդյունավետ է, քան իր նախորդները։

«GPT-5.5-ը ապահովում է կատարմամբ ծանրաբեռնված աշխատանքի համար պահանջվող կայուն կատարողականություն։ Կառուցված և սպասարկվող NVIDIA GB200 NVL72 համակարգերի վրա՝ մոդելը մեր թիմերին հնարավորություն է տալիս բնական լեզվով հարցումներից մատակարարել սկզբից մինչև վերջ ֆունկցիաներ, կրճատել վրիպազերծման ժամանակը օրերից ժամերի և բարդ կոդային բազաներում շաբաթների փորձարկումները վերածել մեկ գիշերվա ընթացքում գրանցված առաջընթացի։ Սա պարզապես ավելի արագ կոդավորում չէ, այլ աշխատելու նոր եղանակ է, որը օգնում է մարդկանց գործել արմատապես այլ արագությամբ»։
— Ջասթին Բոյտանո, NVIDIA-ում ձեռնարկությունների արհեստական բանականության փոխնախագահ

Գիտական հետազոտություն

GPT‑5.5‑ը նաև ցույց է տալիս առաջընթաց գիտական և տեխնիկական հետազոտական աշխատանքային հոսքերում, որոնք պահանջում են ավելին, քան պարզապես բարդ հարցի պատասխանելը։ Հետազոտողները պետք է ուսումնասիրեն գաղափարը, ապացույցներ հավաքեն, փորձարկեն ենթադրությունները, մեկնաբանեն արդյունքները և որոշեն, թե ինչ փորձել հետո։ GPT‑5.5‑ն այդ ցիկլի ընթացքում համառ մնալու առումով ավելի լավն է, քան այլ մոդելները։

Հատկանշական է, որ GPT‑5.5‑ը GeneBench(բացվում է նոր պատուհանում)-ում ցույց է տալիս հստակ բարելավում GPT‑5.4‑ի համեմատությամբ։ Սա նոր գնահատման համակարգ է, որը կենտրոնացած է գենետիկայի և քանակական կենսաբանության ոլորտներում բազմափուլ գիտական տվյալների վերլուծության վրա։ Այս խնդիրները պահանջում են, որ մոդելները նվազագույն վերահսկիչ ուղղորդմամբ վերլուծեն պոտենցիալ երկիմաստ կամ սխալներով տվյալները, հաղթահարեն իրատեսական խոչընդոտներ, ինչպիսիք են թաքնված խառնող գործոնները կամ որակի վերահսկման ձախողումները և ճիշտ իրականացնեն ու մեկնաբանեն ժամանակակից վիճակագրական մեթոդները։ Մոդելի կատարողականը տպավորիչ է՝ հաշվի առնելով, որ այստեղ առաջադրանքները հաճախ համարժեք են գիտական փորձագետների համար մի քանի օր տևող նախագծերի։

Նմանապես, BixBench(բացվում է նոր պատուհանում)-ում՝ իրական կենսաինֆորմատիկ և տվյալների վերլուծության խնդիրների վրա հիմնված գնահատման համակարգում, հրապարակված գնահատականներ ունեցող մոդելների շարքում GPT‑5.5‑ը գրանցել է առաջատար արդյունք։ Մոդելի գիտական կարողություններն այժմ բավականաչափ ուժեղ են, որպեսզի այն որպես իրական համագիտնական էականորեն արագացնի առաջընթացը կենսաբժշկական հետազոտությունների առաջադեմ սահմաններում։

Մեկ այլ օրինակում հատուկ հարթակով GPT‑5.5‑ի ներքին տարբերակը օգնեց բացահայտել Ռեմզիի թվերի մասին նոր ապացույց(բացվում է նոր պատուհանում), որոնք կոմբինատորիկայի կենտրոնական օբյեկտներից են։ Կոմբինատորիկան ուսումնասիրում է, թե ինչպես են առանձին օբյեկտները փոխկապակցվում՝ գրաֆներ, ցանցեր, բազմություններ և օրինաչափություններ։ Ռեմզիի թվերը, ընդհանուր առմամբ, ուսումնասիրում են, թե ցանցը որքան մեծ պետք է լինի, որպեսզի կարգավորվածության որևէ ձև երաշխավորված լինի։ Այս ոլորտում արդյունքները հազվադեպ են հանդիպում և հաճախ տեխնիկապես բարդ են։ Այստեղ GPT‑5.5‑ը հայտնաբերեց վաղուց հայտնի ասիմպտոտիկ փաստի ապացույցը Ռեմզիի ոչ անկյունագծային թվերի վերաբերյալ, որը հետագայում ստուգվեց Lean-ում։ Արդյունքը GPT‑5.5‑ի՝ ոչ միայն կոդով կամ բացատրությամբ, այլև հիմնական հետազոտական ոլորտում զարմանալի և օգտակար մաթեմատիկական փաստարկով ներդրում ունենալու կոնկրետ օրինակ է։

Վաղ փորձարկողները ChatGPT‑ում GPT‑5.5 Pro-ն օգտագործում էին ոչ այնքան որպես մեկ օրինակ պատասխանների շարժիչ, որքան որպես հետազոտական գործընկեր՝ բազմաթիվ անցումներով վերանայելով ձեռագրերը, լարված պայմաններում ստուգելով տեխնիկական փաստարկները, առաջարկելով վերլուծություններ և աշխատելով կոդի, նշումների և PDF համատեքստի հետ։ Ընդհանուր գիծն այն է, որ GPT‑5.5‑ն ավելի լավ է հետազոտողներին օգնելու գործում՝ հարցից դեպի փորձարկում, ապա դեպի արդյունք անցնելու հարցում։

Դերյա Ունութմազը, Ջեքսոնի գենոմային բժշկության լաբորատորիայի իմունոլոգիայի պրոֆեսոր և հետազոտող, օգտագործել է GPT‑5.5 Pro-ն՝ 62 նմուշ և գրեթե 28 000 գեն ներառող գեների արտահայտման տվյալների հավաքածուն վերլուծելու համար՝ ստեղծելով մանրամասն հետազոտական զեկույց, որը ոչ միայն ամփոփում էր արդյունքները, այլև ի հայտ էր բերում կարևոր հարցեր և խորաթափանց դիտարկումներ՝ աշխատանք, որը, նրա խոսքով, իր թիմից կպահանջեր ամիսներ։

Բարտոշ Նասկրենցկին՝ Լեհաստանի Պոզնան քաղաքում գտնվող Ադամ Միցկևիչի անվան համալսարանի մաթեմատիկայի ասիստենտ պրոֆեսորը, Codex-ում օգտագործել է GPT‑5.5‑ը՝ մեկ հարցումով 11 րոպեում հանրահաշվական երկրաչափության հավելված ստեղծելու համար՝ վիզուալացնելով քառակուսային մակերևույթների հատումը և ստացված կորը վերածելով Վեյերշտրասի մոդելի։

Նա հետագայում ընդլայնեց հավելվածը՝ ավելացնելով ավելի կայուն սինգուլյարության պատկերում և ճշգրիտ գործակիցներ, որոնք հնարավոր է կրկին օգտագործել հետագա աշխատանքներում։ Նրա համար ավելի մեծ փոփոխությունն այն է, որ Codex-ն այժմ կարող է աջակցել պատվերով մաթեմատիկական պատկերումների և համակարգչային հանրահաշվի աշխատանքային հոսքերի իրականացմանը, որոնք նախկինում պահանջում էին հատուկ գործիքներ։ Այս օրինակները ցույց են տալիս, թե ինչպես է GPT‑5.5‑ը փորձագետների մտադրությունները վերածում գործող հետազոտական գործիքների և վերլուծությունների։

""

Կրեդիտներ։ Bartosz Naskręcki(բացվում է նոր պատուհանում)

Հարցում: # Ալգեբրական երկրաչափության մակերեսների հատում

Ստեղծեք հավելված, որը պատկերում է երկու քառակուսային մակերես և կարմիր գույնով նշում է հատման կորը։ Օգտագործեք Ռիման-Ռոխի հաշվարկային թեորեմը՝ սա Վայերշտրասի կոր դարձնելու համար։

## Հիմնական պատուհան

Թեթևակի թափանցիկ ստվերավորմամբ երկու երանգավորված մակերեսներ՝ բարձրորակ ռենդերինգով, հատվում են կարմիր գույնի հանրահաշվական կորի երկայնքով

Մկնիկով երկու ուղղություններով պտտում, մեծացնելու համար pinch ժեստի լիարժեք մեխանիզմ, հապտիկ սեղմումով՝ սահիչներով փոքր մենյուն ցուցադրելու համար, որպեսզի փոխվեն յուրաքանչյուր մակերևույթի գործակիցները. հայտնաբերում՝ Z-buffer-ի մակարդակի միջոցով

## Աջ կողմի պատուհան

Վայերշտրասի կարճ հավասարում (Q-ի կամ քառակուսային դաշտի ընդլայնման վրա), հաշվարկված Ռիման-Ռոխի արդյունավետ թեորեմի բանաձևերով՝ առանց 'Go' բառի թարգմանության:

## Գեղագիտական ռեժիմ, որտեղ բոլոր կառավարման տարրերը թաքցված են, և օգտատերը կարող է հիանալ ձևերի գեղեցկությամբ

## Բնութագրեր

Հավելվածը գործարկվում է դիտարկիչում՝ թեթև և արդյունավետ իրականացման տարբերակով, ամբողջական ստեկի նորագույն գրադարաններով, դյուրակիր և տեղակայման համար հարմար

## Փաստաթղթեր

Git պահոց, մատյան, պլան (Markdown ֆայլեր)

«Անհավանականորեն ոգևորիչ է մեր թեստային միջավայրում օգտագործել OpenAI-ի նոր GPT-5.5 մոդելը, թույլ տալ, որ այն հիմնավորում կատարի հսկայական կենսաքիմիական տվյալների հավաքածուների վրա՝ մարդկանց մոտ դեղերի ազդեցության արդյունքները կանխատեսելու համար, և ապա տեսնել, թե ինչպես է այն ապահովում ճշգրտության նշանակալի աճ մեր դեղերի հայտնաբերման ամենաբարդ գնահատումներում։ Եթե OpenAI-ն այս տեմպով շարունակի աշխատել, դեղերի հայտնաբերման հիմքերը մինչև տարվա վերջ կփոխվեն»։
— Բրենդոն Ուայթ, Axiom Bio-ի համահիմնադիր և գործադիր տնօրեն

Հաջորդ սերնդի ինֆերենսի արդյունավետություն

GPT‑5.5‑ը GPT‑5.4‑ի հապաղմամբ մատուցելը պահանջում էր վերաիմաստավորել ինֆերենսը որպես միասնական համակարգ, ոչ թե մեկուսացված օպտիմալացումների հավաքածու։ GPT‑5.5‑ը համատեղ նախագծվել է, ուսուցանվել է և սպասարկվել է NVIDIA GB200 և GB300 NVL72 համակարգերի վրա։ Codex-ը և GPT‑5.5‑ը կարևոր դեր խաղացին այն բանում, թե ինչպես մենք հասանք մեր արդյունավետության թիրախներին։ Codex-ը օգնեց թիմին ավելի արագ առաջ շարժվել՝ գաղափարից մինչև չափանիշներով գնահատելի իրականացում, ուրվագծելով մոտեցումները, կազմաձևելով փորձարկումները և օգնելով բացահայտել, թե որ օպտիմալացումներն էին արժանի ավելի խորը ներդրման։ GPT‑5.5‑ը օգնեց բացահայտել և ներդնել հիմնական բարելավումներ համակարգի ամբողջ կառուցվածքում։ Պարզ ասած՝ մոդելն օգնեց բարելավել այն սպասարկող ենթակառուցվածքը։

Այդպիսի բարելավումներից մեկը բեռի բաշխման և բաժանման հեուրիստիկաներն էին։ Մինչև GPT‑5.5‑ը, մենք արագացուցիչի վրա հարցումները բաժանում էինք ֆիքսված քանակի հատվածների՝ հաշվարկային միջուկների միջև աշխատանքը հավասարակշռելու համար՝ ապահովելով, որ մեծ և փոքր հարցումները կարողանան աշխատել նույն GPU-ի վրա։ Սակայն նախապես սահմանված ստատիկ հատվածների քանակը օպտիմալ չէ երթևեկության բոլոր ձևերի համար։ GPU-ները ավելի լավ օգտագործելու համար Codex-ը վերլուծեց շաբաթների արտադրական տրաֆիկի օրինաչափությունները և մշակեց հատուկ հևրիստիկ ալգորիթմներ՝ աշխատանքը օպտիմալ բաժանելու և հավասարակշռելու համար։ Այս ջանքն անհամաչափ ազդեցություն ունեցավ՝ ավելացնելով թոքենների գեներացման արագությունը ավելի քան 20%-ով։

Բոլորի անվտանգության համար կիբերանվտանգության առաջխաղացում

Աշխարհը պատրաստել այնպիսի մոդելների համար, որոնք գերազանց են անվտանգության խոցելիությունները հայտնաբերելու և շտկելու գործում, թիմային աշխատանք է և կպահանջի, որ ամբողջ էկոհամակարգը մեծ ջանքեր գործադրի դիմացկունություն ձևավորելու համար մոդելների ժողովրդավարացված հասանելիությամբ և կրկնվող տեղակայմամբ՝ կիբեր պաշտպանության հաջորդ դարաշրջանի համար։

Առաջատար մոդելները կիբերանվտանգության ոլորտում դառնում են ավելի ունակ։ Այդ հնարավորությունները լայնորեն հասանելի կդառնան, և մենք կարծում ենք, որ լավագույն ուղին համոզվելն է, որ դրանք կարող են օգտագործվել կիբերպաշտպանությունն արագացնելու և էկոհամակարգն ամրապնդելու համար։

GPT‑5.5‑ը փոքր, բայց կարևոր քայլ է դեպի այնպիսի ԱԲ, որը կարող է լուծել աշխարհի ամենաբարդ մարտահրավերներից մի քանիսը, օրինակ՝ կիբերանվտանգությունը։ Դեկտեմբերին GPT‑5.2‑ի հետ մենք կանխարգելիչ կերպով ներդրեցինք անհրաժեշտ կիբեր պաշտպանական միջոցները ՝ մեր մոդելների հետ հնարավոր կիբեր չարաշահումը սահմանափակելու համար․ այժմ GPT‑5.5‑ի հետ մենք ներդնում ենք հնարավոր կիբեր ռիսկի համար ավելի խիստ դասակարգիչներ, որոնք որոշ օգտատերերի սկզբում կարող են անհարմար թվալ, քանի դեռ ժամանակի ընթացքում ճշգրտում ենք դրանք։

Մենք արդեն տարիներ շարունակ մեր Պատրաստվածության շրջանակ(բացվում է նոր պատուհանում) -ում կիբերանվտանգությունը սահմանել ենք որպես առանձին կատեգորիա՝ քանի որ մեր մոդելները աստիճանաբար բարելավվել են, իսկ մենք կրկնողաբար մշակում և ճշգրտում ենք մեղմման միջոցառումները, որպեսզի կարողանանք պատասխանատու կերպով թողարկել նշանակալի կիբերանվտանգության հնարավորություններով մոդելներ։

  • Մենք ներդնում ենք ոլորտում առաջատար պաշտպանական միջոցներ՝ կիբեր կարողությունների այս մակարդակի համար։Մենք առաջին անգամ կիբերին հատուկ պաշտպանական միջոցներ ներդրեցինք անցյալ տարի՝ GPT‑5.2(բացվում է նոր պատուհանում) -ի հետ, որոնք հետագա տեղակայումներում շարունակել ենք փորձարկել, կատարելագործել և զարգացնել։ GPT‑5.5‑ի համար մենք մշակել ենք խիստ վերահսկման միջոցներ՝ բարձր ռիսկային գործունեության և զգայուն կիբեր հարցումների համար, ինչպես նաև ավելացրել ենք պաշտպանական մեխանիզմներ կրկնվող չարաշահումների դեմ։ Լայն հասանելիությունը հնարավոր է դարձել մեր ներդրումների շնորհիվ՝ ուղղված մոդելի անվտանգության ապահովմանը, նույնականացված օգտագործմանը և անթույլատրելի օգտագործման մշտադիտարկմանը։ Մենք ամիսներ շարունակ համագործակցել ենք արտաքին փորձագետների հետ՝ մշակելու, փորձարկելու և կատարելագործելու այս պաշտպանական միջոցների հուսալիությունը։ GPT‑5.5‑ի միջոցով մենք ապահովում ենք, որ ծրագրավորողները կարողանան հեշտությամբ ապահովել իրենց կոդի անվտանգությունը՝ միաժամանակ խիստ վերահսկողություն սահմանելով այն կիբեր աշխատանքային հոսքերի նկատմամբ, որոնք առավել հավանական է, որ չարամիտ դերակատարները կօգտագործեն վնաս պատճառելու համար։
  • Մենք ընդլայնում ենք հասանելիությունը՝ բոլոր մակարդակներում կիբեր-պաշտպանությունն արագացնելու համար։ Մենք մեր կիբեր-թույլատրող մոդելները հասանելի ենք դարձնում Վստահելի հասանելիություն կիբեր միջավայրում-ի միջոցով՝ սկսելով Codex-ից, որը գործարկման պահին ներառում է GPT‑5.5‑ի առաջադեմ կիբերանվտանգության հնարավորությունների ընդլայնված հասանելիություն՝ ավելի քիչ սահմանափակումներով հաստատված օգտատերերի համար, որոնք համապատասխանում են որոշակի վստահության ազդանշանների(բացվում է նոր պատուհանում) ։ Այն կազմակերպությունները, որոնք պատասխանատու են կարևոր ենթակառուցվածքների պաշտպանմանհամար, կարող են դիմել GPT‑5.4‑Cyber‑ի նման կիբեր-թույլատրող մոդելների հասանելիություն ստանալու համար՝ միաժամանակ բավարարելով անվտանգության խիստ պահանջները՝ այս մոդելներն իրենց ներքին համակարգերի պաշտպանության համար օգտագործելու նպատակով։ Սա ստուգված պաշտպանների լայն շրջանակին տրամադրում է ավելի կարողունակ գործիքներ՝ օրինական անվտանգության աշխատանքի համար, ավելի քիչ անհարկի խոչընդոտներով՝ ապահովելու կարևոր պաշտպանական հնարավորությունների հասանելիության ժողովրդավարացումը։ Օգտատերերը կարող են դիմել վստահելի հասանելիության համար chatgpt.com/cyber(բացվում է նոր պատուհանում) կայքում հաստատված պաշտպանական աշխատանքների համար GPT‑5.5 օգտագործելիս՝ նվազեցնելու ավելորդ հրաժարումները։
  • Մենք աշխատում ենք կառավարական գործընկերների հետ՝ հանրության համար կարևոր ենթակառուցվածքները պաշտպանելուն օգնելու նպատակով։Միասին մենք ուսումնասիրում ենք, թե ինչպես առաջադեմ արհեստական բանականությունը կարող է աջակցել վստահելի պաշտոնյաների պաշտպանական աշխատանքին, որոնք պատասխանատու են այն համակարգերի համար, որոնց վրա մարդիկ ապավինում են՝ սկսած կարևոր հարկատուների տվյալները պաշտպանող թվային համակարգերից մինչև տեղական համայնքների էլեկտրացանցը և ջրամատակարարումը։

Մենք GPT‑5.5‑ի կենսաբանական/քիմիական և կիբերանվտանգության կարողությունները մեր Պատրաստվածության շրջանակի ներքո(բացվում է նոր պատուհանում) դիտարկում ենք որպես բարձր։ Թեև GPT‑5.5‑ը չի հասել կիբերանվտանգության կրիտիկական կարողության մակարդակին, մեր գնահատումներն ու փորձարկումները ցույց տվեցին, որ դրա կիբերանվտանգության կարողությունները GPT‑5.4‑ի համեմատ մեկ քայլ առաջ են։

Բացի այդ, GPT‑5.5‑ը մինչև թողարկումը անցել է անվտանգության և կառավարման ամբողջական գործընթացը, ներառյալ պատրաստվածության գնահատումները, ոլորտային հատուկ փորձարկումները, առաջադեմ կենսաբանության և կիբերանվտանգության կարողությունների թիրախային գնահատումները, ինչպես նաև հիմնավոր փորձարկումները՝ արտաքին փորձագետների մասնակցությամբ։ Մենք ավելի մանրամասն տեղեկություններ ենք ներկայացնում GPT‑5.5 համակարգի քարտում(բացվում է նոր պատուհանում)։

Այս աշխատանքը արտացոլում է ԱԲ կայունության նկատմամբ մեր ավելի լայն մոտեցումը, որը, մեր կարծիքով, անհրաժեշտ է մոդելի կարողությունների զարգացմանը զուգընթաց։ Մենք ցանկանում ենք, որ հզոր ԱԲ-ն հասանելի լինի այն մարդկանց, որոնք այն օգտագործում են՝ համակարգերը, հաստատությունները և հանրությանը պաշտպանելու համար։ Կենսունակ ուղին վստահելի հասանելիությունն է, հնարավորություններին համաչափ ընդլայնվող ամուր պաշտպանական միջոցները և լուրջ չարաշահումները հայտնաբերելու ու դրանց արձագանքելու գործառնական կարողությունը։

Հասանելիություն և գներ

Այսօր GPT‑5.5‑ը սկսում է տարածվել ChatGPT‑ում և Codex-ում՝ Plus, Pro, Business և Enterprise օգտատերերի համար, իսկ GPT‑5.5 Pro-ն սկսում է տարածվել ChatGPT‑ում՝ Pro, Business և Enterprise օգտատերերի համար։ GPT‑5.5 և GPT‑5.5 Pro-ն շատ շուտով կհասցնենք API։

ChatGPT‑ում GPT‑5.5 Thinking-ը հասանելի է Plus, Pro, Business և Enterprise պլանների բաժանորդներին։ GPT‑5.5 Pro-ը, որը նախատեսված է ավելի բարդ հարցերի և ավելի բարձր ճշգրտություն պահանջող աշխատանքի համար, հասանելի է Pro, Business և Enterprise պլանների բաժանորդներին։

Codex-ում GPT‑5.5‑ը հասանելի է Plus, Pro, Business, Enterprise, Edu և Go պլաններում՝ 400K համատեքստի պատուհանով։ GPT‑5.5‑ը հասանելի է նաև Fast ռեժիմում՝ ստեղծելով թոքեն 1.5x ավելի արագ՝ 2.5x ավելի բարձր արժեքով։

API ծրագրավորողների համար gpt-5.5-ը շուտով հասանելի կլինի Պատասխաններ API-ում և զրույցի ավարտման API-ում՝ 5 ԱՄՆ դոլար յուրաքանչյուր 1M մուտքային թոքենի համար և 30 ԱՄՆ դոլար յուրաքանչյուր 1M արտածման թոքենի համար, 1M կոնտեքստի պատուհանով։ Batch և Flex գնագոյացումը հասանելի են ստանդարտ API սակագնի կեսով, մինչդեռ Priority մշակումը հասանելի է ստանդարտ սակագնից 2.5 անգամ բարձր գնով։ Մենք նաև API-ում կթողարկենք gpt-5.5-pro-ն՝ էլ ավելի բարձր ճշգրտության համար, որի գինը կազմում է 30 ԱՄՆ դոլար յուրաքանչյուր 1M մուտքային թոքենների համար և 180 ԱՄՆ դոլար յուրաքանչյուր 1M արտածման թոքենների համար։ Ամբողջական մանրամասների համար տես գների էջը ։

Թեև GPT‑5.5‑ը GPT‑5.4‑ից ավելի բարձր գին ունի, այն և՛ ավելի խելացի է, և՛ թոքենների առումով շատ ավելի արդյունավետ։ Codex-ում մենք մանրակրկիտ կարգավորել ենք փորձը, որպեսզի GPT‑5.5‑ը օգտատերերի մեծ մասի համար ապահովի ավելի լավ արդյունքներ՝ ավելի քիչ թոքեններով, քան GPT‑5.4‑ը՝ միաժամանակ շարունակելով առաջարկել առատ օգտագործման հնարավորություններ բաժանորդագրության տարբեր մակարդակներում։

Գնահատումներ

Կոդավորում

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (հանրային) *

58.6%

57,7%

-

-

64.3%

54.2%

Terminal-Bench 2.0

82,7%

75.1%

-

-

69,4%

68,5%

Փորձագետ-SWE (Ներքին)

73.1%

68,5%

-

-

-

-

*Լաբորատորիաները նշել են մտապահելու կարողության ապացույցներ(բացվում է նոր պատուհանում) այս գնահատման ընթացքում

Մասնագիտական

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (հաղթանակներ կամ ոչ-ոքի)

84.9%

83,0%

82.3%

82.0%

80,3%

67.3%

FinanceAgent v1.1

60.0%

56.0%

-

61.5%

64.4%

59,7%

Ներդրումային բանկային մոդելավորման առաջադրանքներ (Ներքին)

88,5%

87,3%

88,6%

83.6%

-

-

OfficeQA Pro

54,1%

53.2%

-

-

43,6%

18.1%

Համակարգչի օգտագործում և տեսողություն

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld հաստատված

78,7%

75,0%

-

-

78,0%

-

MMMU Pro (առանց գործիքների)

81.2%

81.2%

-

-

-

80.5%

MMMU Pro (գործիքներով)

83.2%

82.1%

-

-

-

-

Գործիքների օգտագործում

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84,4%

82,7%

90.1%

89.3%

79.3%

85.9%

MCP Atlas**

75.3%

70.6%

-

-

79,1%

78,2%

Toolathlon

55,6%

54.6%

-

-

-

48.8%

Tau2-bench Telecom***
(սկզբնական հարցում)

98.0%

92.8%

-

-

-

-

** MCP Atlas: Scale AI-ի արդյունքները 2026 թվականի ապրիլի վերջին թարմացումից հետո։ 
*** Tau2-bench Telecom. 5.5-ի և 5.4-ի արդյունքները՝ սկզբնական հարցումներով, այսինքն՝ առանց հարցումների ճշգրտման։ Սա չի ներառում այլ լաբորատորիաների արդյունքները, որոնք գնահատվել են հարցումի ճշգրտումներով։

Ակադեմիական

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ՋինԲենչ

25.0%

19.0%

33.2%

25.6%

-

-

FrontierMath 1–3 մակարդակ

51.7%

47.6%

52,4%

50.0%

43.8%

36,9%

FrontierMath 4-րդ մակարդակ

35,4%

27.1%

39.6%

38,0%

22.9%

16,7%

BixBench

80.5%

74,0%

-

-

-

-

GPQA Diamond

93.6%

92.8%

-

94.4%

94.2%

94.3%

Մարդկության վերջին քննությունը (առանց գործիքների)

41.4%

39.8%

43.1%

42.7%

46.9%

44.4%

Մարդկության վերջին քննությունը (գործիքներով)

52.2%

52.1%

57.2%

58.7%

54.7%

51.4%

Կիբերանվտանգություն

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Capture-the-Flags մարտահրավերային առաջադրանքներ (Ներքին)****

88,1%

83.7%

-

-

-

-

CyberGym

81.8%

79.0%

-

-

73.1%

-

**** Համակարգի քարտերում օգտագործվող ամենաբարդ CTF-ների ընդլայնում՝ լրացուցիչ բարդ մարտահրավերներով։

Երկար համատեքստ

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256k f1

73,7%

62,5%

-

-

76,9%

-

Graphwalks BFS 1մլն f1

45.4%

9.4%

-

-

41,2% (Opus 4.6)

-

Graphwalks ծնողներ 256 հազ․ f1

90.1%

82.8%

-

-

93.6%

-

Graphwalks ծնողներ 1 մլն f1

58.5%

44.4%

-

-

72.0% (Opus 4.6)

-

OpenAI MRCR v2 8 ասեղային 4K-8K

98.1%

97.3%

-

-

-

-

OpenAI MRCR v2 8 ասեղային 8K-16K

93.0%

91.4%

-

-

-

-

OpenAI MRCR v2 8 ասեղային 16K-32K

96.5%

97,2%

-

-

-

-

OpenAI MRCR v2 8 ասեղ 32K–64K

90,0%

90.5%

-

-

-

-

OpenAI MRCR v2 8 ասեղային 64K-128K

83,1%

86.0%

-

-

-

-

OpenAI MRCR v2 8 ասեղային 128K–256K

87.5%

79.3%

-

-

59.2%

-

OpenAI MRCR v2 8-ասեղային 256K-512K

81,5%

57.5%

-

-

-

-

OpenAI MRCR v2 8-ասեղային 512K-1M

74,0%

36.6%

-

-

32.2%

-

Աբստրակտ մտածողություն

գնահատում

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (Հաստատված)

95.0%

93.7%

-

94.5%

93.5%

98.0%

ARC-AGI-2 (Verified)

85,0%

73.3%

-

83.3%

75,8%

77,1%

GPT‑ի գնահատումները գործարկվել են հիմնավորման ջանքերը սահմանված xhigh և կատարվել են հետազոտական միջավայրում, ինչը որոշ դեպքերում կարող է տալ մի փոքր այլ արդյունք, քան արտադրական ChatGPT‑ն։

Հեղինակ

OpenAI