Ներկայացնում ենք GPT‑4.5‑ը
Մեր ամենաուժեղ GPT մոդելի հետազոտական նախադիտում։ Հասանելի է Pro օգտատերերին և ծրագրավորողներին ամբողջ աշխարհում։
Մենք թողարկում ենք GPT‑4.5-ի՝ մեր մինչ օրս զրույցի համար ամենամեծ և լավագույն մոդելը։ GPT‑4.5‑ը մի քայլ առաջ է նախնական ուսուցման և հետուսուցման մասշտաբավորման գործում։ Չվերահսկվող ուսուցումը մասշտաբավորելով՝ GPT‑4.5‑ը բարելավում է օրինաչափությունները ճանաչելու, կապեր ստեղծելու և ստեղծագործական պատկերացումներ գեներացնելու իր ունակությունը՝ առանց հիմնավորման:
Վաղ փորձարկումները ցույց են տալիս, որ GPT‑4.5‑ի հետ փոխազդեցությունն ավելի բնական է թվում։ Ավելի լայն գիտելիքների բազան, օգտատիրոջ մտադրությունը հետևելու բարելավված կարողությունը և ավելի բարձր «Հուզական ինտելեկտը» այն օգտակար են դարձնում գրելու, ծրագրավորման կատարելագործման և գործնական խնդիրների լուծման նման առաջադրանքների համար։ Մենք նաև ակնկալում ենք, որ այն ավելի քիչ հալյուցինացիաներ կունենա։
Մենք ներկայացնում ենք GPT‑4.5‑ը որպես հետազոտական նախադիտում՝ ավելի լավ հասկանալու դրա ուժեղ կողմերն ու սահմանափակումները։ Մենք դեռ ուսումնասիրում ենք, թե ինչի է այն ընդունակ և անհամբեր սպասում ենք տեսնելու, թե ինչպես են մարդիկ այն օգտագործում այնպիսի ձևերով, որոնք մենք գուցե չէինք սպասել։
Մենք զարգացնում ենք արհեստական բանականության հնարավորությունները՝ մասշտաբավորելով երկու լրացուցիչ մոդելներ՝ չվերահսկվող ուսուցում և հիմնավորում։ Սրանք ներկայացնում են բանականության երկու առանցքները։
- Անվերահսկելի ուսուցումը բարձրացնում է աշխարհի մոդելի ճշգրտությունը և ինտուիցիան։ GPT‑3.5, GPT‑4 և GPT‑4.5 մոդելները առաջ են տանում այս պարադիգմը։
- Մասշտաբային հիմնավորումը, մյուս կողմից, սովորեցնում է մոդելներին մտածել և ստեղծել մտքերի շղթա նախքան արձագանքելը, ինչը թույլ է տալիս նրանց լուծել բարդ STEM կամ տրամաբանական խնդիրներ: OpenAI o1‑ի և OpenAI o3‑mini‑ի նման մոդելները առաջ են մղում այս պարադիգմը։
GPT‑4.5‑ը չվերահսկվող ուսուցման մասշտաբավորման օրինակ է՝ ընդլայնելով հաշվարկները և տվյալները, ինչպես նաև ճարտարապետական և օպտիմալացման նորարարությունները։ GPT‑4.5‑ը վերապատրաստվել է Microsoft Azure արհեստական բանականության սուպերհամակարգիչների վրա։ Արդյունքը մոդել է, որն ունի ավելի լայն տեղեկություններ և աշխարհի ավելի խորը ըմբռնում, ինչը հանգեցնում է հալյուցինացիաների նվազմանը և ավելի մեծ հուսալիության՝ թեմաների լայն շրջանակում։
GPT պարադիգմի մասշտաբավորումը
Աշխարհի ավելի խորը տեղեկություններ
SimpleQA ճշգրտություն (ավելի բարձր՝ ավելի լավ է)
SimpleQA հալյուցինացիայի հաճախականություն (ավելի ցածր՝ ավելի լավ է)
SimpleQA-ն չափում է LLM (մեծ լեզվական մոդել) փաստացիությունը պարզ, բայց մարտահրավեր նետող գիտելիքների հարցերի վերաբերյալ։
Քանի որ մենք մասշտաբավորում ենք մեր մոդելները և դրանք լուծում են ավելի բարդ խնդիրներ, գնալով ավելի կարևոր է դառնում դրանց սովորեցնել մարդկային կարիքների և մտադրությունների ավելի խորը ըմբռնում։ GPT‑4.5‑ի համար մենք մշակել ենք նոր մասշտաբային մեթոդներ, որոնք թույլ են տալիս մեզ va8óecnel ավելի մեծ, ավելի հզոր մոդելներ՝ օգտագործելով ավելի փոքր մոդելներից վերցված տվյալները։ Այս մեթոդները բարելավում են GPT‑4.5‑ի կառավարելիությունը, նրբերանգների ըմբռնումը և բնական զրույցը։
Մարդկային փորձարկողների հետ համեմատական գնահատումներ
Մարդկային նախընտրությունը չափում է այն հարցումների տոկոսը, որոնցում թեստավորողները նախընտրել են GPT‑4.5‑ը GPT‑4o‑ի նկատմամբ։
Աշխարհի խորը ըմբռնման և համագործակցության բարելավման համադրությունը հանգեցնում է մի մոդելի, որը բնականաբար ինտեգրում է գաղափարները ջերմ և ինտուիտիվ զրույցներում, որոնք ավելի շատ են համապատասխանում մարդկային համագործակցությանը։ GPT‑4.5‑ը ավելի լավ է հասկանում, թե ինչ են մարդիկ նկատի ունենում, և մեկնաբանում է նուրբ ազդանշանները կամ անուղղակի սպասումները ավելի մեծ նրբերանգներով և «էմոցիոնալ ինտելեկտով»։ GPT‑4.5‑ը նաև ցուցադրում է ավելի ուժեղ գեղագիտական ինտուիցիա և ստեղծագործականություն։ Այն հիանալի օգնում է գրելու և դիզայնի հարցում։
Օգտագործման դեպքեր
GPT-4.5
GPT‑4.5‑ը ցուցաբերում է ավելի բարձր «հուզական ինտելեկտ» և գիտի, թե երբ խրախուսել հետագա զրույցը և երբ տրամադրել օգտատիրոջը մանրամասն տեղեկատվություն։
GPT‑4.5‑ը չի մտածում նախքան պատասխանելը, ինչը նրա ուժեղ կողմերը դարձնում է հատկապես տարբեր տրամաբանական մոդելներից, ինչպիսիք են OpenAI o1‑ը։ Համեմատած OpenAI o1‑ի և OpenAI o3‑mini‑ի հետ, GPT‑4.5‑ը ավելի ընդհանուր նշանակության, բնատուր ավելի խելացի մոդել է։ Մենք հավատում ենք, որ տրամաբանությունը կլինի ապագա մոդելների հիմնական ունակությունը, և որ մասշտաբավորման երկու մոտեցումները՝ նախնական ուսուցումը և հիմնավորումը, կլրացնեն միմյանց։ Քանի որ GPT‑4.5‑ի նման մոդելները դառնում են ավելի խելացի և ավելի գիտակ նախնական ուսուցման միջոցով, դրանք ավելի ամուր հիմք կծառայեն հիմնավորող և գործիքներ օգտագործող ագենտների համար։
Մոդելի հնարավորությունների յուրաքանչյուր ավելացում նաև մոդելները ավելի անվտանգ դարձնելու հնարավորություն է։ GPT‑4.5‑ը վերապատրաստվել է վերահսկողության նոր մեթոդներով, որոնք համակցված են ավանդական վերահսկվող նուրբ կարգավորման (SFT) և մարդկային հետադարձ կապի միջոցով ուժեղացված ուսուցման (RLHF) մեթոդների հետ, ինչպիսիք օգտագործվում են GPT‑40‑ի համար։ Հուսով ենք, որ այս աշխատանքը հիմք կհանդիսանա ավելի ընդունակ ապագա մոդելների համապատասխանեցման համար։
Մեր բարելավումները սթրես-թեստավորելու համար, տեղակայումից առաջ մենք անցկացրեցինք անվտանգության մի շարք թեստեր՝ համաձայն մեր Պատրաստվածության շրջանակի(բացվում է նոր պատուհանում)։ Մենք պարզեցինք, որ GPT պարադիգմի մասշտաբավորումը նպաստել է մեր գնահատումների ընթացքում կարողությունների բարելավմանը։ Մենք հրապարակում ենք այս գնահատումների մանրամասն արդյունքները կից համակարգի քարտում։
Այսօրվանից սկսած, ChatGPT Pro օգտատերերը կկարողանան ընտրել GPT‑4.5‑ը մոդելի ընտրիչում՝ վեբում, բջջային հեռախոսում և համակարգչում։ Մենք կսկսենք հասանելի դարձնել Plus և Team օգտատերերին հաջորդ շաբաթ, ապա՝ Enterprise և Edu օգտատերերին՝ հաջորդ շաբաթ։
GPT‑4.5‑ը հասանելիություն ունի որոնման միջոցով ամենաթարմ տեղեկատվությանը, աջակցում է ֆայլերի և պատկերների վերբեռնմանը և կարող է օգտագործել կտավը գրելու և կոդավորելու համար։ Սակայն, GPT‑4.5‑ը ներկայումս չի աջակցում ChatGPT‑ում ձայնային ռեժիմի, տեսանյութի և էկրանի համատեղ օգտագործման նման բազմամոդալ գործառույթներին։ Ապագայում մենք կաշխատենք պարզեցնել օգտատիրոջ փորձը, որպեսզի արհեստական բանականությունը «պարզապես աշխատի» ձեզ համար։
Մենք նաև նախադիտում ենք GPT‑4.5‑ը զրույցի լրացումների API-ում, Օգնականների API-ում և Խմբաքանակի API-ում՝ բոլոր վճարովի օգտագործման մակարդակների(բացվում է նոր պատուհանում) ծրագրավորողների համար։ Մոդելը աջակցում է հիմնական գործառույթներին, ինչպիսիք են ֆունկցիաների կանչը, կառուցվածքային ելքերը, հոսքային հեռարձակումը և համակարգային հաղորդագրությունները։ Այն նաև աջակցում է տեսողական հնարավորություններին պատկերների մուտքագրման միջոցով։
Հիմնվելով վաղ թեստավորման վրա՝ ծրագրավորողները կարող են GPT‑4.5‑ը հատկապես օգտակար համարել այն հավելվածների համար, որոնք օգտվում են դրա ավելի բարձր էմոցիոնալ ինտելեկտից և ստեղծագործականությունից, ինչպիսիք են գրելու օգնությունը, հաղորդակցությունը, ուսուցումը, քոուչինգը և գաղափարների գեներացումը։ Այն նաև ցույց է տալիս գործակալական պլանավորման և կատարման ուժեղ կարողություններ, ներառյալ բազմաքայլ կոդավորման աշխատանքային հոսքերը և բարդ առաջադրանքների ավտոմատացումը։
GPT‑4.5‑ը շատ մեծ և հաշվարկային ինտենսիվ մոդել է, ինչը այն դարձնում է ավելի թանկ քան GPT‑4o‑ն և չի փոխարինում դրան։ Այդ պատճառով մենք գնահատում ենք, թե արդյոք շարունակենք այն մատուցել API-ում երկարաժամկետ հեռանկարում՝ համատեղելով ներկայիս հնարավորությունների աջակցությունը ապագա մոդելների կառուցման հետ։ Մենք անհամբեր սպասում ենք ավելին իմանալ դրա ուժեղ կողմերի, կարողությունների և իրական աշխարհում հավելվածների հնարավորությունների մասին։ Եթե GPT‑4.5‑ը եզակի արժեք է ապահովում ձեր օգտագործման դեպքում, ձեր կարծիքը(բացվում է նոր պատուհանում) կարևոր դեր կխաղա մեր որոշումը կայացնելու գործում։
Հաշվողական տեխնոլոգիաների յուրաքանչյուր նոր կարգի հետ գալիս են նոր հնարավորություններ։ GPT‑4.5‑ը չվերահսկվող ուսուցման հնարավորությունների սահմանագծին գտնվող մոդել է։ Մենք շարունակում ենք զարմանալ համայնքի ստեղծագործականությամբ՝ նոր կարողություններ և անսպասելի օգտագործման դեպքեր բացահայտելու հարցում։ GPT‑4.5‑ի միջոցով մենք ձեզ հրավիրում ենք մեզ հետ ուսումնասիրել չվերահսկվող ուսուցման սահմանները և բացահայտել նորարարական հնարավորություններ։
Ստորև մենք ներկայացնում ենք GPT‑4.5-ի արդյունքները ստանդարտ ակադեմիական չափորոշիչների վերաբերյալ՝ պատկերելու համար դրա ներկայիս կատարողականը ավանդաբար դատողության հետ կապված առաջադրանքների կատարման գործում։ Նույնիսկ զուտ չվերահսկվող ուսուցման մասշտաբով՝ GPT‑4.5‑ը ցույց է տալիս նշանակալի բարելավումներ նախորդ մոդելների համեմատ, ինչպիսին է GPT‑4o‑ն։ Այնուամենայնիվ, մենք անհամբեր սպասում ենք GPT‑4.5‑ի հնարավորությունների ավելի ամբողջական պատկերացում կազմելուն այս թողարկման միջոցով, քանի որ գիտակցում ենք, որ ակադեմիական չափանիշները միշտ չէ, որ արտացոլում են իրական աշխարհի օգտակարությունը։
Մոդելի գնահատման միավորներ
GPT‑4.5 | GPT‑4o | OpenAI o3‑mini (բարձր) | |
GPQA (գիտություն) | 71,4% | 53,6% | 79,7% |
AIME ‘24 (մաթեմատիկա) | 36,7% | 9,3% | 87,3% |
MMMLU (բազմալեզու) | 85,1% | 81,5% | 81,1% |
MMMU (բազմամոդալ) | 74,4% | 69,1% | - |
SWE-Lancer Diamond (կոդավորում)* | 32,6% $186125 | 23,3% $138750 | 10,8% $89625 |
SWE-Bench Verified (կոդավորում)* | 38,0% | 30,7% | 61,0% |
*Ցուցադրված թվերը ներկայացնում են ներքին լավագույն արդյունքները։
Հեղինակներ
Հիմնադիր մասնակիցներ
Adam Goucher, Alex Paino, Ali Kamali, Amin Tootoonchian, Andrew Tulloch, Ben Sokolowsky, Clemens Winter, Colin Wei, Daniel Kappler, Daniel Levy, Felipe Petroski Such, Geoff Salmon, Ian O’Connell, Jason Teplitz, Kai Chen, Nik Tezak, Prafulla Dhariwal, Rapha Gontijo Lopes, Sam Schoenholz, Youlong Cheng, Yujia Jin, Yunxing Dai
Հետազոտություններ
Հիմնական ներդրողներ
Այդեն Լոու, Ալեք Ռադֆորդ, Ալեքս Քարնի, Ալեքս Նիկոլ, Ալեքսիս Կոննո, Անանյա Կումար, Բեն Վանգ, Շառլոտ Քոուլ, Էլիզաբեթ Յանգ, Գաբրիել Գոհ, Հադի Սալման, Հայթանգ Հու, Հիվու Ջուն, Յան Սոհլ, Իշաան Գուլրաջանի, Ջեյքոբ Քոքսոն, Ջեյմս Բեթքեր, Ջեյմի Կիրոս, Ջեսիկա Լանդոն, Քայլ Լյութեր, Լիա Գայ, Լուկաս Կոնդրաչյուկ, Լիրիկ Դոշի, Միխայիլ Պավլով, Քիմինգ Յուան, Ռեյմար Լեյք, Ռոուան Զելերս, Շոն Մեցգեր, Շենջիա Չժաո, Սպենսեր Պապայ, Տաո Վանգ
Ներդրողներ
Ադամ Լերեր, Ադրիեն Էկոֆեթ, Աիդան ՄաքԼոֆլին, Ալեքսանդր Պրոկոֆեւ, Ալեքսանդրա Բար, Ալան Ջաբրի, Էնդրյու Գիբիանսկի, Էնդրյու Շմիդտ, Քեյսի Չու, Չակ Լի, Չելսի Վոս, Քրիս Հալլասի, Քրիս Կոխ, Քրիստին Մաքլիվի, Դեյվիդ Մելի, Դիմիտրիս Ցիպրաս, Էրիկ Սիգլեր, Էրին Կավանաու, Ֆարզադ Խորասանի, Հուիվեն Չանգ, Իլյա Կոստրիկով, Իշաան Սինգալ, Ջի Լին, Ջիահու Յու, Ջինգ Յու Ժանգ, Ջոն Ռիզո, Ջոնգ Վուկ Կիմ, Ջոյս Լի, Ջունտանգ Չժուանգ, Լեո Լիու, Լի Ջինգ, Լոնգ Օյանգ, Լուի Ֆեյվրիեր, Մո Բավարիա, Նիկ Ստաթաս, Նիտիշ Կեսկար, Օլեգ Մուրկ, Պրեստոն Բոուման, Սքոթի Յան, SQ Մահ, Տաո Սու, Թեյլոր Գորդոն, Վալերի Ցի, Վենդա Չժոու, Յու Ժանգ
Մասշտաբավորում
Հիմնական ներդրողներ
Ալեքս Չոու, Ալեքս Ռենզին, Ալեքսանդրա Սպիրա, Ավի Նայակ, Բեն Լեյմբերգեր, Քրիստոֆեր Հեսսե, Դուկ Ֆոնգ Նգուեն, Դինգհուա Լի, Էրիկ Պետերսոն, Ֆրենսիս Ժանգ, Ջին Օդեն, Կայ Ֆրիկե, Կայ Հայաշի, Լարի Լվ, Լեկի Զոու, Լին Յանգ, Մադլեն Թոմփսոն, Մայքլ Պետրով, Միգել Կաստրո, Նատալյա Գիմելշեյն, Ֆիլ Տիլեթ, Ռեզա Զամանի, Ռայան Չեու Սթենլի Հսիե, Սթիվ Լի, Ստյուարտ Հոլ, Թոմաս Ռաու, Տյանհաո Չժեն, Վիշալ Կուո, Յոնջիկ Քիմ, Յուչեն Ժանգ, Չժուորան Լիու
Ներդրողներ
Ալվին Վան, Էնդրյու Կան, Էնդրյու Կոդիսպոտի, Անտուան Պելիս, Անուջ Կալյա, Ահարոն Հըրսթ, Ավիտալ Օլիվեր, Բրեդ Բարնս, Բրայան Հսու, Չեն Դինգ, Չեն Շեն, Չժեն Չանգ, Քրիստիան Գիբսոն, Քրիստոֆեր Բերներ, Դունկան Ֆինդլեյ, Ֆան Վանգ, Ֆանգյուան Լի, Ջանլուկա Բորելլո, Հեթեր Շմիդտ, Հենրիկե Պոնդե դե Օլիվեյրա Պինտո, Իկայ Լան, Ջիայ Վենգ, Ջեյմս Քրուքս, Ջոս Կրայեվելդ, Ջունրու Շաո, Քենի Հսու, Քենի Նգուեն, Քեւին Քինգ, Լիա Բուրկհարդտ, Լեո Չեն, Լինդեն Լի, Լու Չժանգ, Մահմուդ Էարիբի, Մարատ Դուխան, Մատեուշ Լիտվին, Միկի Հաբրին, Նաթան Լաֆոնտեյն, Պավել Բելով, Պենգ Սու, Պրասադ Չակկա, Ռեյչել Լիմ, Ռաջկումար Սամուել, Ռենոդ Գաուբերտ, Ռորի Կարմայքլ, Սառա Դոնգ, Շանտանու Ջեյն, Շուայկի Սիա, Սթիվեն Լոգսդոն, Թոդ Անդերվուդ, Թոնի Չժաո, Վայքսինգ Ժանգ, Ուիլ Շեու, Վայի Չժեն, Յինգհայ Լու, Յունկիաո Ժանգ
Անվտանգության համակարգեր
Andrea Vallone, Andy Applebaum, Cameron Raymond, Chong Zhang, Dan Mossing, Elizabeth Proehl, Eric Wallace, Evan Mays, Grace Zhao, Ian Kivlichan, Irina Kofman, Joel Parish, Kevin Liu, Keren Gu-Lemberg, Kristen Ying, Lama Ahmad, Lilian Weng, Leon Maksin, Leyton Ho, Meghan Shah, Michael Lampe, Michele Wang, Miles Wang, Olivia Watkins, Phillip Guo, Samuel Miserendino, Sam Toizer, Sandhini Agarwal, Tejal Patwardhan, Tom Dupré la Tour, Tong Mu, Tyna Eloundou, Yunyun Wang
Տեղակայում
Adam Brandon, Adam Perelman, Adele Li, Akshay Nathan, Alan Hayes, Alfred Xue, Alison Ben, Alec Gorge, Alex Guziel, Alex Iftimie, Ally Bennett, Andrew Chen, Andy Wang, Andy Wood, Angad Singh, Anoop Kotha, Antonia Woodford, Anuj Saharan, Ashley Tyra, Atty Eleti, Ben Schneider, Bessie Ji, Beth Hoover, Bill Chen, Blake Samic, Britney Smith, Brian Yu, Caleb Wang, Cary Bassin, Cary Hudson, Charlie Jatt, Chengdu Huang, Chris Beaumont, Christina Huang, Cristina Scheau, Dana Palmie, Daniel Levine, Daryl Neubieser, Dave Cummings, David Sasaki, Dibya Bhattacharjee, Dylan Hunn, Edwin Arbus, Elaine Ya Le, Enis Sert, Eric Kramer, Fred von Lohmann, Freddie Sulit, Gaby Janatpour, Garrett McGrath, Garrett Ollinger, Gary Yang, Hao Sheng, Harold Hotelling, Janardhanan Vembunarayanan, Jeff Harris, Jeffrey Sabin Matsumoto, Jennifer Robinson, Jessica Liang, Jessica Shieh, Jiacheng Yang, Joel Morris, Joseph Florencio, Josh Kaplan, Kan Wu, Karan Sharma, Karen Li, Katie Pypes, Kendal Simon, Kendra Rimbach, Kevin Park, Kevin Rao, Laurance Fauconnet, Lauren Workman, Leher Pathak, Liang Wu, Liang Xiong, Lien Mamitsuka, Lindsay McCallum, Lukas Gross, Manoli Liodakis, Matt Nichols, Michelle Fradin, Minal Khan, Mingxuan Wang, Nacho Soto, Natalie Staudacher, Nikunj Handa, Niko Felix, Ning Liu, Olivier Godement, Oona Gleeson, Philip Pronin, Raymond Li, Reah Miyara, Robert Xiong, Rohan Nuttall, R.J. Marsan, Sara Culver, Scott Ethersmith, Sean Fitzgerald, Shamez Hemani, Sherwin Wu, Shiao Lee, Shuyang Cheng, Siyuan Fu, Spug Golden, Steve Coffey, Steven Heidel, Sundeep Tirumalareddy, Tabarak Khan, Thomas Degry, Thomas Dimson, Tom Stasi, Tomo Hiratsuka, Trevor Creech, Uzair Navid Iftikhar, Victoria Chernova, Victoria Spiegel, Wanning Jiang, Wenlei Xie, Yaming Lin, Yara Khakbaz, Yilei Qian, Yilong Qin, Yo Shavit, Zhi Bie
Գործադիր ղեկավարություն
Aidan Clark, Bob McGrew, David Farhi, Greg Brockman, Hannah Wong, Jakub Pachocki, Johannes Heidecke, Joanne Jang, Kate Rouch, Kevin Weil, Lauren Itow, Liam Fedus, Mark Chen, Mia Glaese, Mira Murati, Nick Ryder, Sam Altman, Srinivas Narayanan, Tal Broda