မင်္ဂလာပါ GPT‑4o
ကျွန်ုပ်တို့၏ မူရင်း မော်ဒယ် အသစ်ဖြစ်သည့် GPT‑4o ကို မိတ်ဆက်ကြေညာလိုက်ပါသည်။ ၎င်းသည် အသံ၊ ရုပ်မြင်မှုနှင့် စာသားတို့အပေါ် အချိန်နှင့်တပြေးညီ ကျိုးကြောင်းဆင်ခြင်နိုင်ပါသည်။
မေ ၁၃ ရက် ကြေညာချက်ကို ခန့်မှန်းခြင်း။
GPT‑4o (“omni” ကို ရည်ညွှန်းသည့် “o”) သည် လူနှင့်ကွန်ပျူတာ အပြန်အလှန်ဆက်သွယ်မှုကို ပိုမိုသဘာဝကျလာစေရန် ဦးတည်သော ခြေလှမ်းတစ်ရပ်ဖြစ်သည်—၎င်းသည် စာသား၊ အသံ၊ ပုံနှင့် ဗီဒီယိုတို့၏ မည်သည့် ပေါင်းစပ်မှုကိုမဆို input အဖြစ် လက်ခံနိုင်ပြီး၊ စာသား၊ အသံနှင့် ပုံ output များ၏ မည်သည့် ပေါင်းစပ်မှုကိုမဆို ထုတ်ပေးနိုင်သည်။ ၎င်းသည် အသံ input များကို 232 milliseconds အတွင်းအထိ တုံ့ပြန်နိုင်ပြီး ပျမ်းမျှမှာ 320 milliseconds ဖြစ်ကာ၊ စကားဝိုင်းတစ်ခုတွင် လူ၏ တုံ့ပြန်ချိန်(ဝင်းဒိုးအသစ်တွင် ဖွင့်မည်) နှင့် ဆင်တူပါသည်။ ၎င်းသည် အင်္ဂလိပ်စာသားနှင့် code တွင် GPT‑4 Turbo ၏ စွမ်းဆောင်ရည်နှင့် ကိုက်ညီပြီး၊ အင်္ဂလိပ်မဟုတ်သော ဘာသာစကားများ၏ စာသားတွင် သိသာထင်ရှားစွာ တိုးတက်လာသလို API တွင်လည်း များစွာ ပိုမြန်ပြီး 50% ပိုသက်သာပါသည်။ GPT‑4o သည် ရှိပြီးသား မော်ဒယ်များနှင့် နှိုင်းယှဉ်လျှင် ရုပ်မြင်မှုနှင့် အသံနားလည်မှုတွင် အထူးသဖြင့် ပိုကောင်းပါသည်။
မော်ဒယ် စွမ်းဆောင်ရည်များ
Two GPT‑4os interacting and singing.
Interview prep.
Rock Paper Scissors.
Sarcasm.
Math with Sal and Imran Khan.
Two GPT‑4os harmonizing.
Point and learn Spanish.
Meeting AI.
Real-time translation.
Lullaby.
Talking faster.
Happy Birthday.
Dog.
Dad jokes.
GPT‑4o with Andy, from BeMyEyes in London.
Customer service proof of concept.
GPT‑4o မတိုင်မီက ChatGPT နှင့် စကားပြောရန် အသံမုဒ် ကို အသုံးပြုနိုင်ခဲ့ပြီး ပျမ်းမျှ ကြန့်ကြာချိန်မှာ 2.8 စက္ကန့် (GPT‑3.5) နှင့် 5.4 စက္ကန့် (GPT‑4) ဖြစ်ခဲ့ပါသည်။ ထိုသို့လုပ်ဆောင်ရန် Voice Mode သည် သီးခြား မော်ဒယ် သုံးခုပါဝင်သော pipeline တစ်ခုဖြစ်သည်။ ရိုးရှင်းသော မော်ဒယ်တစ်ခုက အသံကို စာသားအဖြစ် ကူးပြောင်းရေးသားပေးသည်၊ GPT‑3.5 သို့မဟုတ် GPT‑4 က စာသားကို လက်ခံကာ စာသားထုတ်ပေးသည်၊ ထို့နောက် တတိယ ရိုးရှင်းသော မော်ဒယ်က ထိုစာသားကို အသံအဖြစ် ပြန်ပြောင်းပေးသည်။ ဤလုပ်ငန်းစဉ်ကြောင့် အဓိက ဉာဏ်ရည်အရင်းအမြစ်ဖြစ်သော GPT‑4 သည် အချက်အလက်များစွာ ဆုံးရှုံးသွားသည်—အသံအနေအထား၊ စကားပြောသူ များစွာ သို့မဟုတ် နောက်ခံဆူညံသံများကို တိုက်ရိုက် မမြင်နိုင်သကဲ့သို့၊ ရယ်မောသံ၊ သီချင်းဆိုသံ သို့မဟုတ် စိတ်ခံစားမှု ဖော်ပြချက်များကိုလည်း မထုတ်ပေးနိုင်ပါ။
GPT‑4o နှင့်အတူ ကျွန်ုပ်တို့သည် စာသား၊ ရုပ်မြင်မှုနှင့် အသံကို အစမှအဆုံးအထိ တစ်စုတစ်စည်းတည်း လေ့ကျင့်ထားသော မော်ဒယ်သစ်တစ်ခုကို ဖန်တီးခဲ့သည်။ ဆိုလိုသည်မှာ input နှင့် output အားလုံးကို တူညီသော neural network တစ်ခုတည်းက စီမံဆောင်ရွက်ပေးသည်ဟု ဖြစ်သည်။ GPT‑4o သည် ဤ modality မျိုးစုံအားလုံးကို ပေါင်းစည်းထားသော ကျွန်ုပ်တို့၏ ပထမဆုံး မော်ဒယ် ဖြစ်သဖြင့်၊ မော်ဒယ်က ဘာများ လုပ်နိုင်သည်နှင့် ၎င်း၏ ကန့်သတ်ချက်များကို စူးစမ်းလေ့လာရာတွင် ကျွန်ုပ်တို့သည် အစပိုင်းသာ ရှိသေးသည်။
A first person view of a robot typewriting the following journal entries:
1. yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?
the text is large, legible and clear. the robot's hands type on the typewriter.

The robot wrote the second entry. The page is now taller. The page has moved up. There are two entries on the sheet:
yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?
sound update just dropped, and it's wild. everything's got a vibe now, every sound's like a new secret. makes you think, what else am i missing?

The robot was unhappy with the writing so he is going to rip the sheet of paper. Here is his first person view as he rips it from top to bottom with his hands. The two halves are still legible and clear as he rips the sheet.

ရိုးရာ benchmark များအရ တိုင်းတာကြည့်လျှင် GPT‑4o သည် စာသား၊ ကျိုးကြောင်းသင့်လျော်စွာ စဉ််းစားပေးသော စွမ်းရည်နှင့် coding intelligence တို့တွင် GPT‑4 Turbo အဆင့် စွမ်းဆောင်ရည်ကို ရရှိထားပြီး၊ ဘာသာစကားစုံ၊ အသံနှင့် ရုပ်မြင်နိုင်မှု စွမ်းဆောင်ရည်များတွင်လည်း စံချိန်အသစ်များ တင်ထားပါသည်။
စာသား အကဲဖြတ်ခြင်း
ဤဘာသာစကား ၂၀ မျိုးကို ဘာသာစကားမိသားစု ကွဲပြားမှုများတစ်လျှောက် tokenizer အသစ်၏ ဖိသိပ်နိုင်မှုကို ကိုယ်စားပြုရန် ရွေးချယ်ထားသည်
ဂူဂျာရတ်ရှ် 4.4x လျော့နည်းသော တိုကင်များ (၁၄၅ မှ ၃၃ ထိ) | હેલો, મારું નામ જીપીટી-4o છે. હું એક નવા પ્રકારનું ભાષા મોડલ છું. તમને મળીને સારું લાગ્યું! |
တီလူဂူ 3.5x တိုကင် လျော့နည်းသည် (၁၅၉ မှ ၄၅ ထိ) | నమస్కారము, నా పేరు జీపీటీ-4o. నేను ఒక్క కొత్త రకమైన భాషా మోడల్ ని. మిమ్మల్ని కలిసినందుకు సంతోషం! |
တမီလ် 3.3x တိုကင် လျော့နည်းသည် (၁၁၆ မှ ၃၅ ထိ) | வணக்கம், என் பெயர் ஜிபிடி-4o. நான் ஒரு புதிய வகை மொழி மாடல். உங்களை சந்தித்ததில் மகிழ்ச்சி! |
Marathi တိုကင်များ 2.9x လျော့နည်း (၉၆ မှ ၃၃ ထိ) | नमस्कार, माझे नाव जीपीटी-4o आहे| मी एक नवीन प्रकारची भाषा मॉडेल आहे| तुम्हाला भेटून आनंद झाला! |
ဟိန္ဒီ 2.9x တိုကင်နည်းသွားသည် (၉၀ မှ ၃၁ ထိ) | नमस्ते, मेरा नाम जीपीटी-4o है। मैं एक नए प्रकार का भाषा मॉडल हूँ। आपसे मिलकर अच्छा लगा! |
အူရဒူ 2.5x တိုကင် နည်း (၈၂ မှ ၃၃ ထိ) | ہیلو، میرا نام جی پی ٹی-4o ہے۔ میں ایک نئے قسم کا زبان ماڈل ہوں، آپ سے مل کر اچھا لگا! |
အာရဗီ 2.0x တိုကင်နည်းသွားသည် (၅၃ မှ ၂၆ ထိ) | مرحبًا، اسمي جي بي تي-4o. أنا نوع جديد من نموذج اللغة، سررت بلقائك! |
ပါရှန် 1.9x တိုကင်များ ပိုနည်း (၆၁ မှ ၃၂ ထိ) | سلام، اسم من جی پی تی-۴او است. من یک نوع جدیدی از مدل زبانی هستم، از ملاقات شما خوشبختم! |
ရုရှား 1.7x တိုကင် ပိုနည်း (၃၉ မှ ၂၃ ထိ) | Привет, меня зовут GPT-4o. Я — новая языковая модель, приятно познакомиться! |
ကိုရီးယား 1.7x တိုကင်များ ပိုနည်း (၄၅ မှ ၂၇ ထိ) | 안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다! |
ဗီယက်နမ် 1.5x တိုကင်နည်းသွားသည် (၄၆ မှ ၃၀ ထိ) | Xin chào, tên tôi là GPT-4o. Tôi là một loại mô hình ngôn ngữ mới, rất vui được gặp bạn! |
တရုတ်ဘာသာ 1.4x တိုကင် ပိုနည်း (၃၄ မှ ၂၄ ထိ) | 你好,我的名字是GPT-4o。我是一种新型的语言模型,很高兴见到你! |
ဂျပန်ဘာသာ 1.4x တိုကင်နည်း (၃၇ မှ ၂၆ ထိ) | こんにちは、私の名前はGPT-4oです。私は新しいタイプの言語モデルです。初めまして! |
တူရကီ 1.3x တိုကင် အရေအတွက် လျော့နည်း (၃၉ မှ ၃၀ထိ) | Merhaba, benim adım GPT-4o. Ben yeni bir dil modeli türüyüm, tanıştığımıza memnun oldum! |
အီတလီဘာသာ 1.2x တိုကင် ပိုနည်း (၃၄ မှ ၂၈ အထိ) | Ciao, mi chiamo GPT-4o. Sono un nuovo tipo di modello linguistico, piacere di conoscerti! |
ဂျာမန် 1.2x တိုကင် နည်းသွားသည် (၃၄ မှ ၂၉ ထိ) | Hallo, mein Name is GPT-4o. Ich bin ein neues KI-Sprachmodell. Es ist schön, dich kennenzulernen. |
စပိန်ဘာသာ 1.1x တိုကင်နည်း (၂၉ မှ ၂၆ ထိ) | Hola, me llamo GPT-4o. Soy un nuevo tipo de modelo de lenguaje, ¡es un placer conocerte! |
ပေါ်တူဂီ 1.1x တိုကင် ပိုနည်း (၃၀ မှ ၂၇ ထိ) | Olá, meu nome é GPT-4o. Sou um novo tipo de modelo de linguagem, é um prazer conhecê-lo! |
ပြင်သစ် 1.1x လျော့နည်းသော တိုကင်များ (၃၁ မှ ၂၈ ထိ) | Bonjour, je m'appelle GPT-4o. Je suis un nouveau type de modèle de langage, c'est un plaisir de vous rencontrer! |
အင်္ဂလိပ် 1.1x တိုကင် အရေအတွက် လျော့နည်း (၂၇ မှ ၂၄ သို့) | Hello, my name is GPT-4o. I'm a new type of language model, it's nice to meet you! |
GPT‑4o ကို modality မျိုးစုံတစ်လျှောက် design အရပင် လုံခြုံရေးထည့်သွင်းတည်ဆောက်ထားပြီး၊ လေ့ကျင့်ရေးဒေတာ စစ်ထုတ်ခြင်းနှင့် post-training မှတစ်ဆင့် မော်ဒယ်၏ အပြုအမူကို ပြန်လည်ညှိနှိုင်းခြင်းကဲ့သို့ နည်းလမ်းများကို အသုံးပြုထားပါသည်။ အသံ output များအတွက် guardrail များ ပေးနိုင်ရန် လုံခြုံရေးစနစ်အသစ်များကိုလည်း ဖန်တီးထားပါသည်.
OpenAI ၏ ကြိုတင်ပြင်ဆင်ထားခြင်းဆိုင်ရာ ဖွဲ့စည်းမှု နှင့် ကျွန်ုပ်တို့၏ မိမိဆန္ဒအလျောက် ကတိကဝတ်များ နှင့်အညီ GPT‑4o ကို ကျွန်ုပ်တို့ အကဲဖြတ်ခဲ့ပါသည်။ cybersecurity, CBRN, persuasion နှင့် model autonomy ဆိုင်ရာ ကျွန်ုပ်တို့၏ အကဲဖြတ်ချက်များအရ GPT‑4o သည် ဤအမျိုးအစား မည်သည့်တစ်ခုတွင်မှ Medium risk ထက် မကျော်လွန်ပါ။ ဤအကဲဖြတ်မှုတွင် မော်ဒယ် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်တစ်လျှောက် automated နှင့် လူက ဆောင်ရွက်သော evaluation မျိုးစုံကို လုပ်ဆောင်ခြင်း ပါဝင်ပါသည်။ မော်ဒယ်၏ စွမ်းဆောင်ရည်များကို ပိုမိုဖော်ထုတ်နိုင်ရန် custom fine-tuning နှင့် prompt များကို အသုံးပြုပြီး safety mitigation မတိုင်မီနှင့် safety mitigation ပြီးနောက် ဗားရှင်း နှစ်မျိုးလုံးကို စမ်းသပ်ခဲ့ပါသည်။
GPT‑4o သည် အသစ်ထည့်သွင်းထားသော modality များကြောင့် ဖြစ်ပေါ်လာသည့် သို့မဟုတ် ပိုမိုပြင်းထန်လာသည့် အန္တရာယ်များကို ဖော်ထုတ်ရန် social psychology, bias and fairness, misinformation စသည့် နယ်ပယ်များရှိ ပြင်ပကျွမ်းကျင်သူများ 70 ကျော်နှင့် ကျယ်ကျယ်ပြန့်ပြန့် ပြင်ပ ထိုးဖောက်စမ်းသပ်ခြင်း ကိုလည်း ခံယူထားပါသည်။ GPT‑4o နှင့် အပြန်အလှန်ဆက်သွယ်ရာတွင် လုံခြုံရေး ပိုမိုကောင်းမွန်စေရန် ဤသင်ခန်းစာများကို အသုံးပြုပြီး ကျွန်ုပ်တို့၏ လုံခြုံရေးဆိုင်ရာ ကြားဝင်ဆောင်ရွက်မှုများကို တည်ဆောက်ခဲ့ပါသည်။ အန္တရာယ်အသစ်များ တွေ့ရှိလာသည်နှင့်အမျှ ဆက်လက်လျော့ပါးစေသွားမည်ဖြစ်ပါသည်။
GPT‑4o ၏ အသံ modality များတွင် အသစ်အဆန်း အန္တရာယ်မျိုးစုံ ရှိနေကြောင်း ကျွန်ုပ်တို့ အသိအမှတ်ပြုပါသည်။ ယနေ့တွင် စာသားနှင့် ပုံ input များ၊ စာသား output များကို အများပြည်သူအတွက် ဖြန့်ချိနေပါသည်။ လာမည့် သီတင်းပတ်များနှင့် လများအတွင်း အခြား modality များကို ဖြန့်ချိနိုင်ရန် လိုအပ်သော နည်းပညာအခြေခံအဆောက်အအုံ၊ post-training မှတစ်ဆင့် အသုံးပြုရလွယ်ကူမှုနှင့် လုံခြုံရေးများအပေါ် ကျွန်ုပ်တို့ ဆက်လက်လုပ်ဆောင်သွားမည်ဖြစ်ပါသည်။ ဥပမာအားဖြင့် launch အချိန်တွင် အသံ output များကို preset voice အချို့အထိသာ ကန့်သတ်ထားမည်ဖြစ်ပြီး ကျွန်ုပ်တို့၏ ရှိပြီးသား လုံခြုံရေးမူဝါဒများကို လိုက်နာမည်ဖြစ်ပါသည်။ မကြာမီထွက်ရှိမည့် စနစ်ကဒ် တွင် GPT‑4o ၏ modality များ အပြည့်အစုံကို ကိုင်တွယ်ဖော်ပြသည့် အသေးစိတ်အချက်အလက်များကို မျှဝေပေးသွားမည်ဖြစ်ပါသည်။
မော်ဒယ်နှင့် စမ်းသပ်ခြင်း၊ iteration လုပ်ခြင်းများမှတစ်ဆင့် မော်ဒယ်၏ modality အားလုံးတစ်လျှောက် ရှိနေသော ကန့်သတ်ချက်များ အချို့ကို ကျွန်ုပ်တို့ တွေ့ရှိထားပြီး၊ ထိုအချို့ကို အောက်တွင် ဖော်ပြထားပါသည်။
Examples of model limitations
We would love feedback to help identify tasks where GPT‑4 Turbo still outperforms GPT‑4o, so we can continue to improve the model.
၂၀၂၄ ခုနှစ် မေ ၈ ရက်တွင် အပ်ဒိတ်လုပ်ထားသည်
ကျွန်ုပ်တို့၏ Preparedness Framework ၏ အစိတ်အပိုင်းတစ်ရပ်အဖြစ်၊ ကျွန်ုပ်တို့သည် ပုံမှန် အကဲဖြတ်မှုများ ပြုလုပ်ပြီး မော်ဒယ်များအတွက် scorecard များကို အပ်ဒိတ်လုပ်ပါသည်။ mitigation ပြီးနောက် အမှတ် “medium” သို့မဟုတ် ထိုထက်နိမ့်သော မော်ဒယ်များကိုသာ ဖြန့်ချိပါသည်။ မော်ဒယ်တစ်ခု၏ စုစုပေါင်း အန္တရာယ်အဆင့်ကို အမျိုးအစားတစ်ခုခုအတွင်း အမြင့်ဆုံး အန္တရာယ်အဆင့်အပေါ် မူတည်၍ သတ်မှတ်ပါသည်။ လက်ရှိတွင် GPT‑4o ကို mitigation မတိုင်မီနှင့် ပြီးနောက် နှစ်ခုစလုံးတွင် medium risk ဟု အကဲဖြတ်ထားပါသည်။
GPT‑4o သည် နက်နဲစွာ သင်ယူလေ့လာခြင်း၏ နယ်နိမိတ်များကို တိုးချဲ့ရာတွင် ကျွန်ုပ်တို့၏ နောက်ဆုံးခြေလှမ်းဖြစ်ပြီး၊ ယခုတစ်ကြိမ်တွင် လက်တွေ့အသုံးဝင်မှုဘက်သို့ ဦးတည်ထားပါသည်။ လွန်ခဲ့သော နှစ်နှစ်အတွင်း stack အလွှာတိုင်း၌ စွမ်းရည်ထိရောက်မှု မြှင့်တင်မှုများအပေါ် ကျွန်ုပ်တို့ အားထုတ်မှု များစွာ ပြုလုပ်ခဲ့ပါသည်။ ဤသုတေသန၏ ပထမဆုံးရလဒ်အဖြစ် GPT‑4 အဆင့် မော်ဒယ်တစ်ခုကို ပိုမိုကျယ်ပြန့်စွာ အသုံးပြုနိုင်အောင် ပြုလုပ်ပေးနိုင်ခဲ့ပါသည်။ GPT‑4o ၏ စွမ်းဆောင်ရည်များကို အဆင့်လိုက် ဖြန့်ချိသွားမည်ဖြစ်ပြီး (ယနေ့မှစ၍ တိုးချဲ့ ထိုးဖောက်စမ်းသပ်ခြင်း အသုံးပြုခွင့် စတင်ပါသည်)။
GPT‑4o ၏ စာသားနှင့် ပုံ စွမ်းဆောင်ရည်များကို ယနေ့မှစ၍ ChatGPT တွင် စတင် ဖြန့်ချိနေပါသည်။ GPT‑4o ကို အခမဲ့အဆင့်တွင်လည်း ရရှိနိုင်စေပြီး၊ Plus အသုံးပြုသူများအတွက် မက်ဆေ့ချ်ကန့်သတ်ချက်ကို 5 ဆအထိ မြှင့်ပေးထားပါသည်။ လာမည့် သီတင်းပတ်များအတွင်း ChatGPT Plus တွင် GPT‑4o ပါဝင်သော အသံမုဒ် ဗားရှင်းအသစ်ကို alpha အဖြစ် ဖြန့်ချိသွားမည်ဖြစ်ပါသည်။
Developer များသည် ယခုအခါ GPT‑4o ကို API တွင် စာသားနှင့် ရုပ်မြင်မှု မော်ဒယ်အဖြစ်လည်း အသုံးပြုနိုင်ပါပြီ။ GPT‑4o သည် GPT‑4 Turbo နှင့် နှိုင်းယှဉ်လျှင် 2 ဆ ပိုမြန်ပြီး၊ ဈေးနှုန်း တစ်ဝက်သာရှိကာ rate limit သည် 5 ဆ ပိုမြင့်ပါသည်။ လာမည့် သီတင်းပတ်များအတွင်း GPT‑4o ၏ အသံနှင့် ဗီဒီယို စွမ်းဆောင်ရည်အသစ်များကို API တွင် ယုံကြည်စိတ်ချရသော မိတ်ဖက်အဖွဲ့ငယ်တစ်စုအတွက် စတင်ပံ့ပိုးပေးရန် စီစဉ်ထားပါသည်။