Ողջույն GPT‑4o
Մենք հայտարարում ենք GPT‑4o՝ մեր նոր առաջատար մոդելը, որը կարող է իրական ժամանակում հիմնավորել աուդիո, տեսողության և տեքստի միջոցով:
Ենթադրելով մայիսի 13-ի հայտարարությունը։
GPT‑4o‑ն («o»՝ «omni»-ի համար) քայլ է դեպի մարդ-համակարգիչ շատ ավելի բնական փոխազդեցություն. այն որպես մուտքային տվյալներ ընդունում է տեքստի, աուդիոյի, պատկերի և տեսանյութի ցանկացած համադրություն և ստեղծում է տեքստի, աուդիոյի և պատկերի ցանկացած համադրություն։ Այն կարող է պատասխանել աուդիո մուտքագրումներին ընդամենը 232 միլիվայրկյանում, միջինը՝ 320 միլիվայրկյանում, ինչը նման է մարդու պատասխանի ժամանակին(բացվում է նոր պատուհանում) խոսակցության ընթացքում: Այն համապատասխանում է GPT‑4 Turbo-ի կատարողականությանը անգլերեն տեքստի և կոդի առումով՝ զգալիորեն բարելավելով ոչ անգլերեն լեզուներով տեքստը, միաժամանակ API-ի առումով շատ ավելի արագ և 50%-ով ավելի էժան լինելով։ GPT‑4o‑ն հատկապես ավելի լավ է տեսողության և ձայնի ընկալման հարցում՝ համեմատած առկա մոդելների հետ։
Մոդելի հնարավորություններ
Երկու GPT‑4O‑ներ փոխազդում են և երգում։
Հարցազրույցի նախապատրաստում։
Քար, թուղթ, մկրատ։
Սարկազմ։
Մաթեմատիկա Սալի և Իմրան Խանի հետ։
Երկու GPT‑4os‑ի ներդաշնակեցում։
Նշեք և սովորեք իսպաներեն:
Հանդիպում արհեստական բանականության հետ։
Իրական ժամանակի թարգմանություն։
Օրորոցային։
Ավելի արագ խոսել։
Շնորհավոր ծնունդդ։
Շուն։
Հայրիկի կատակներ։
GPT‑4o‑ն Անդիի հետ, Լոնդոնի BeMyEyes-ից։
Հաճախորդների սպասարկման հայեցակարգի ապացույց։
Մինչև GPT‑4o‑ը, դուք կարող էիք օգտագործել ձայնային ռեժիմը ՝ ChatGPT‑ի հետ խոսելու համար 2,8 վայրկյան հապաղումով (GPT‑3.5) և միջինում 5,4 վայրկյան (GPT‑4)։ Դրան հասնելու համար Ձայնային ռեժիմը երեք առանձին մոդելների մի շարք է. մեկ պարզ մոդելը ձայնը փոխակերպում է տեքստի, GPT‑3.5‑ը կամ GPT‑4‑ը ընդունում է տեքստը և արտածում այն, իսկ երրորդ պարզ մոդելը այդ տեքստը կրկին փոխակերպում է ձայնի։ Այս գործընթացը նշանակում է, որ բանականության հիմնական աղբյուրը՝ GPT‑4‑ը, կորցնում է շատ տեղեկատվություն՝ այն չի կարող անմիջապես դիտարկել տոնը, բազմաթիվ խոսողներ կամ ֆոնային աղմուկները, և այն չի կարող ծիծաղել, երգել կամ արտահայտել զգացմունքներ։
GPT‑4o‑ի միջոցով մենք մարզեցինք մեկ նոր մոդել՝ տեքստի, տեսողական և աուդիո տվյալների ամբողջական ընդգրկմամբ, ինչը նշանակում է, որ բոլոր մուտքային և ելքային տվյալները մշակվում են նույն նեյրոնային ցանցի կողմից։ս Քանի որ GPT‑4o‑ն մեր առաջին մոդելն է, որը համատեղում է այս բոլոր մեթոդները, մենք դեռ նոր ենք սկսում ուսումնասիրել մոդելի հնարավորությունները և դրա սահմանափակումները։
A first person view of a robot typewriting the following journal entries:
1. yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?
the text is large, legible and clear. the robot's hands type on the typewriter.

The robot wrote the second entry. The page is now taller. The page has moved up. There are two entries on the sheet:
yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?
sound update just dropped, and it's wild. everything's got a vibe now, every sound's like a new secret. makes you think, what else am i missing?

The robot was unhappy with the writing so he is going to rip the sheet of paper. Here is his first person view as he rips it from top to bottom with his hands. The two halves are still legible and clear as he rips the sheet.

Ավանդական չափանիշներով չափված՝ GPT‑4o‑ն հասնում է GPT‑4 Turbo մակարդակի արդյունավետության տեքստի, դատողության և կոդավորման բանականության ոլորտում՝ միաժամանակ սահմանելով նոր բարձր ցուցանիշներ բազմալեզու, աուդիո և տեսողական հնարավորությունների ոլորտում։
Տեքստի գնահատում
Այս 20 լեզուները ընտրվել են որպես նոր թոքենայզերի սեղմման ներկայացուցիչ տարբեր լեզվաընտանիքներում։
Գուջարաթի 4.4x ավելի քիչ թոքեններ (145-ից 33) | હેલો, મારું નામ જીપીટી-4o છે. હું એક નવા પ્રકારનું ભાષા મોડલ છું. તમને મળીને સારું લાગ્યું! |
Թելուգու 3.5x ավելի քիչ թոքեններ (159-ից 45) | నమస్కారము, నా పేరు జీపీటీ-4o. నేను ఒక్క కొత్త రకమైన భాషా మోడల్ ని. మిమ్మల్ని కలిసినందుకు సంతోషం! |
Թամիլ 3.3x ավելի քիչ թոքեններ (116-ից 35) | வணக்கம், என் பெயர் ஜிபிடி-4o. நான் ஒரு புதிய வகை மொழி மாடல். உங்களை சந்தித்ததில் மகிழ்ச்சி! |
Մարաթի 2.9x ավելի քիչ թոքեններ (96-ից 33) | नमस्कार, माझे नाव जीपीटी-4o आहे| मी एक नवीन प्रकारची भाषा मॉडेल आहे| तुम्हाला भेटून आनंद झाला! |
Հինդի 2.9x ավելի քիչ թոքեններ (90-ից 31) | नमस्ते, मेरा नाम जीपीटी-4o है। मैं एक नए प्रकार का भाषा मॉडल हूँ। आपसे मिलकर अच्छा लगा! |
Ուրդու 2.5x ավելի քիչ թոքեններ (82-ից 33) | ہیلو، میرا نام جی پی ٹی-4o ہے۔ میں ایک نئے قسم کا زبان ماڈل ہوں، آپ سے مل کر اچھا لگا! |
Արաբերեն 2.0x ավելի քիչ թոքեններ (53-ից 26) | مرحبًا، اسمي جي بي تي-4o. أنا نوع جديد من نموذج اللغة، سررت بلقائك! |
Պարսկերեն 1.9x ավելի քիչ թոքեններ (61-ից 32) | سلام، اسم من جی پی تی-۴او است. من یک نوع جدیدی از مدل زبانی هستم، از ملاقات شما خوشبختم! |
Ռուսերեն 1.7x ավելի քիչ թոքեններ (39-ից 23) | Привет, меня зовут GPT-4o. Я — новая языковая модель, приятно познакомиться! |
Կորեերեն 1.7 անգամ պակաս թեքեններ (45-ից մինչև 27) | 안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다! |
Վիետնամերեն 1.5x ավելի քիչ թոքեններ (46-ից 30) | Xin chào, tên tôi là GPT-4o. Tôi là một loại mô hình ngôn ngữ mới, rất vui được gặp bạn! |
Չինարեն 1.4x ավելի քիչ թոքեններ (34-ից 24) | 你好,我的名字是GPT-4o。我是一种新型的语言模型,很高兴见到你! |
Ճապոներեն 1.4x ավելի քիչ թոքեններ (37-ից 26) | こんにちは、私の名前はGPT-4oです。私は新しいタイプの言語モデルです。初めまして! |
Թուրքերեն 1.3x ավելի քիչ թոքեններ (39-ից 30) | Merhaba, benim adım GPT-4o. Ben yeni bir dil modeli türüyüm, tanıştığımıza memnun oldum! |
Իտալերեն 1.2x ավելի քիչ թոքեններ (34-ից 28) | Ciao, mi chiamo GPT-4o. Sono un nuovo tipo di modello linguistico, piacere di conoscerti! |
Գերմաներեն 1.2x ավելի քիչ թոքեններ (34-ից 29) | Hallo, mein Name is GPT-4o. Ich bin ein neues KI-Sprachmodell. Es ist schön, dich kennenzulernen. |
Իսպաներեն 1.1x ավելի քիչ թոքեններ (29-ից 26) | Hola, me llamo GPT-4o. Soy un nuevo tipo de modelo de lenguaje, ¡es un placer conocerte! |
Պորտուգալերեն 1.1x ավելի քիչ թոքեններ (30-ից 27) | Olá, meu nome é GPT-4o. Sou um novo tipo de modelo de linguagem, é um prazer conhecê-lo! |
Ֆրանսերեն 1.1x ավելի քիչ թոքեններ (31-ից 28) | Bonjour, je m'appelle GPT-4o. Je suis un nouveau type de modèle de langage, c'est un plaisir de vous rencontrer! |
Անգլերեն 1.1x ավելի քիչ թոքեններ (27-ից 24) | Hello, my name is GPT-4o. I'm a new type of language model, it's nice to meet you! |
GPT‑4o‑ն նախագծված է անվտանգության բոլոր մոդալությունների միջոցով՝ այնպիսի տեխնիկաների միջոցով, ինչպիսիք են մարզման տվյալների ֆիլտրումը և մոդելի վարքագծի կատարելագործումը հետուսուցման ընթացքում։ Մենք նաև ստեղծել ենք անվտանգության նոր համակարգեր՝ ձայնային արտածումների համար պաշտպանիչ միջոցներ ապահովելու նպատակով:
Մենք գնահատել ենք GPT‑4o‑ն ըստ մեր Պատրաստվածության շրջանակի և մեր կամավոր պարտավորություններին համահունչ: Մեր կիբեռանվտանգության, CBRN-ի, համոզման և մոդելի ինքնավարության գնահատականները ցույց են տալիս, որ GPT‑4o‑ն այս կատեգորիաներից որևէ մեկում միջին ռիսկից բարձր չի գնահատվում։ Այս գնահատումը ներառում էր ավտոմատացված և մարդկային գնահատումների հավաքածուի անցկացում մոդելի ուսուցման ողջ գործընթացում: Մենք փորձարկեցինք մոդելի ինչպես նախաանվտանգության մեղմացման, այնպես էլ հետանվտանգության մեղմացման տարբերակները՝ օգտագործելով հատուկ ճշգրտում և հարցումներ՝ մոդելի հնարավորությունները ավելի լավ բացահայտելու համար:
GPT‑4o‑ն նաև ենթարկվել է լայնածավալ արտաքին կարմիր թիմի փորձարկման 70+ արտաքին փորձագետների հետ այնպիսի տիրույթներում, ինչպիսիք են սոցիալական հոգեբանությունը, կողմնակալությունը և արդարությունը, ինչպես նաև ապատեղեկատվությունը՝ նոր ավելացված մեթոդների կողմից ներմուծվող կամ ուժեղացված ռիսկերը բացահայտելու համար։ Մենք օգտագործեցինք այս դասերը՝ մշակելու մեր անվտանգության միջամտությունները՝ GPT‑4o‑ի հետ փոխազդելու անվտանգությունը բարելավելու համար։ Մենք կշարունակենք մեղմել նոր ռիսկերը, երբ դրանք հայտնաբերվեն։
Մենք գիտակցում ենք, որ GPT‑4o‑ի աուդիո եղանակները ներկայացնում են մի շարք նոր ռիսկեր։ Այսօր մենք հրապարակայնորեն թողարկում ենք տեքստային և պատկերային մուտքագրումներ և տեքստային արտածումներ։ Առաջիկա շաբաթների և ամիսների ընթացքում մենք կաշխատենք տեխնիկական ենթակառուցվածքների, հետուսուցման միջոցով օգտագործելիության և մյուս եղանակները թողարկելու համար անհրաժեշտ անվտանգության վրա։ Օրինակ, գործարկման պահին աուդիո արտածումները կսահմանափակվեն նախադրված ձայների ընտրությամբ և կհամապատասխանեն մեր առկա անվտանգության քաղաքականությանը: GPT‑4o‑ի հնարավորությունների ամբողջական շրջանակի մասին ավելի մանրամասն տեղեկություններ մենք կտրամադրենք առաջիկա համակարգային քարտի թողարկման ժամանակ։
Մոդելի հետ մեր փորձարկումների և կրկնությունների ընթացքում մենք նկատել ենք մի շարք սահմանափակումներ, որոնք առկա են մոդելի բոլոր ձևաչափերում, որոնցից մի քանիսը ներկայացված են ստորև:
Մոդելի սահմանափակումների օրինակներ
Մենք կցանկանայինք ստանալ ձեր կարծիքը՝ օգնելու բացահայտել այն առաջադրանքները, որտեղ GPT‑4 Turbo-ն դեռ գերազանցում է GPT‑4o‑ին, որպեսզի մենք կարողանանք շարունակել բարելավել մոդելը։ Շնորհակալություն։
Թարմացվել է 2024 թ. մայիսի 8-ին
Որպես մեր պատրաստվածության շրջանակի մաս, մենք անցկացնում ենք կանոնավոր գնահատումներ և թարմացնում ենք մեր մոդելների գնահատման քարտերը: Տեղակայվում են միայն այն մոդելները, որոնց հետմեղմման գնահատականը «միջին» կամ ցածր է: Մոդելի ռիսկի ընդհանուր մակարդակը որոշվում է ցանկացած կատեգորիայի ռիսկի ամենաբարձր մակարդակով: Ներկայումս GPT‑4o‑ն գնահատվում է միջին ռիսկի մակարդակով ինչպես մեղմացման ջանքերից առաջ, այնպես էլ հետո:
GPT‑4o‑ն մեր վերջին քայլն է խորքային ուսուցման սահմանները մղելու ուղղությամբ, այս անգամ գործնական կիրառելիության ուղղությամբ։ Վերջին երկու տարիների ընթացքում մենք մեծ ջանքեր ենք գործադրել արդյունավետության բարելավման ուղղությամբ՝ աշխատելով փաթեթի յուրաքանչյուր շերտի վրա։ Որպես այս հետազոտության առաջին արդյունք՝ մենք կարող ենք GPT‑4 մակարդակի մոդելը հասանելի դարձնել շատ ավելի լայն շրջանակում: GPT‑4o‑ի հնարավորությունները կներդրվեն իտերատիվ կերպով (կարմիր թիմի համար ընդլայնված մուտքը կսկսվի այսօրվանից):
GPT‑4o‑ի տեքստային և պատկերի հնարավորությունները սկսում են գործարկվել այսօր ChatGPT‑ում: Մենք GPT‑4o‑ն հասանելի ենք դարձնում անվճար մակարդակում, ինչպես նաև Plus օգտատերերին՝ մինչև 5x ավելի բարձր հաղորդագրությունների սահմանաչափերով։ Առաջիկա շաբաթների ընթացքում մենք կթողարկենք ChatGPT Plus-ի շրջանակներում GPT‑4o‑ի ալֆա տարբերակով Ձայնային ռեժիմի նոր տարբերակը:
Ծրագրավորողները կարող են այժմ մուտք գործել GPT‑4o API-ում՝ որպես տեքստի և տեսլականի մոդել։ GPT‑4o‑ն 2 անգամ ավելի արագ է, կես գնով, և ունի 5 անգամ ավելի բարձր սահմանափակումներ՝ համեմատած GPT‑4 Turbo-ի հետ: Մենք պլանավորում ենք առաջիկա շաբաթների ընթացքում գործարկել GPT‑4o‑ի նոր աուդիո և վիդեո հնարավորությունների աջակցումը API-ում վստահելի գործընկերների փոքր խմբի համար: