Habari GPT‑4o
Tunatangaza GPT‑4o, muundo wetu mpya wa bendera ambao unaweza Waza katika sauti, maono, na maandishi kwa wakati halisi.
Nadhani tangazo la Mei 13 litakavyokuwa.
GPT‑4o (“o” kwa “omni”) ni hatua kuelekea mwingiliano wa asili zaidi wa binadamu na kompyuta—inakubali kama ingizo lolote la mchanganyiko wa maandishi, sauti, picha, na video na huzalisha utoaji wowote wa maandishi, sauti na picha. Inaweza kujibu viingizo vya sauti kwa muda wa milisekunde 232 tu, na wastani wa milisekunde 320, ambayo ni sawa na muda wa jibu ya binadamu(fungua katika dirisha jipya) katika mazungumzo. Inalingana na utendaji wa GPT‑4 Turbo kwenye maandishi kwa Kiingereza na msimbo, huku ikiboreshwa sana kwenye maandishi katika lugha zisizo za Kiingereza na pia ni ya haraka zaidi na 50% ya bei nafuu katika API. GPT‑4o ni bora zaidi hasa katika uelewa wa maono na sauti ikilinganishwa na miundo iliyopo.
Uwezo wa miundo
GPT‑4os mbili zikishirikiana na kuimba.
Maandalizi ya mahojiano.
Jiwe Karatasi Makasi.
Kejeli.
Hisabati na Sal na Imran Khan.
GPT‑4os mbili zikiharmonisha.
Onyesha na ujifunze Kihispania.
Mkutano wa AI.
Tafsiri ya papo hapo.
Bembezi.
Kuzungumza kwa haraka zaidi.
Heri ya Siku ya Kuzaliwa.
Mbwa.
Vichekesho vya baba.
GPT‑4o pamoja na Andy, kutoka BeMyEyes mjini London.
Uthibitisho wa dhana ya huduma kwa wateja.
Kabla ya GPT‑4o, ungeweza kutumia hali ya sauti kuzungumza na ChatGPT kwa ufichwaji wa sekunde 2.8 (GPT‑3.5) na sekunde 5.4 (GPT‑4) kwa wastani. Ili kufanikisha hili, hali ya sauti ni mkondo wa miundo mitatu tofauti: muundo mmoja rahisi unanakili sauti kuwa maandishi, GPT‑3.5 au GPT‑4 inachukua maandishi na hutoa utoaji wa maandishi na muundo wa tatu rahisi hubadilisha maandishi hayo kuwa sauti nyuma. Mchakato huu unamaanisha kuwa chanzo kikuu cha akili, GPT‑4, hupoteza habari nyingi - hakiwezi kuona moja kwa moja sauti, wasemaji wengi, au kelele za nyuma na hakiwezi kutoa kicheko, kuimba, au kueleza hisia.
Kwa kutumia GPT‑4o, tulifundisha muundo mmoja mpya kutoka mwanzo hadi mwisho kwenye maandishi, maono, na sauti, ikimaanisha kuwa ingizo na utoaji vyote vinasindika na mtandao huo huo wa neva. Kwa sababu GPT‑4o ni muundo wetu wa kwanza unaochanganya njia hizi zote, bado tunagundua tu kidogo kuhusu kile ambacho muundo unaweza kufanya na mapungufu yake.
A first person view of a robot typewriting the following journal entries:
1. yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?
the text is large, legible and clear. the robot's hands type on the typewriter.

The robot wrote the second entry. The page is now taller. The page has moved up. There are two entries on the sheet:
yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?
sound update just dropped, and it's wild. everything's got a vibe now, every sound's like a new secret. makes you think, what else am i missing?

The robot was unhappy with the writing so he is going to rip the sheet of paper. Here is his first person view as he rips it from top to bottom with his hands. The two halves are still legible and clear as he rips the sheet.

Kama ilivyopimwa kwenye viwango vya jadi, GPT‑4o hufikia utendaji wa kiwango cha GPT‑4 Turbo katika maandishi, hoja na akili za usimbuaji, huku ikiweka viwango vipya vya juu katika uwezo wa lugha nyingi, sauti, na maono.
Tathmini ya Maandishi
Lugha hizi 20 zilichaguliwa kama mwakilishi wa ufinyaji wa tokenizer mpya katika familia tofauti za lugha
Tokeni chache kwa mara 4.4 kwa Gujarati (kutoka 145 hadi 33) | હેલો, મારું નામ જીપીટી-4o છે. હું એક નવા પ્રકારનું ભાષા મોડલ છું. તમને મળીને સારું લાગ્યું! |
Tokeni za Telugu ni 3.5x chache (kutoka 159 hadi 45) | నమస్కారము, నా పేరు జీపీటీ-4o. నేను ఒక్క కొత్త రకమైన భాషా మోడల్ ని. మిమ్మల్ని కలిసినందుకు సంతోషం! |
Tokeni za Tamil ni chache mara 3.3 (kutoka 116 hadi 35) | வணக்கம், என் பெயர் ஜிபிடி-4o. நான் ஒரு புதிய வகை மொழி மாடல். உங்களை சந்தித்ததில் மகிழ்ச்சி! |
Marathi tokeni 2.9x chache (kutoka 96 hadi 33) | नमस्कार, माझे नाव जीपीटी-4o आहे| मी एक नवीन प्रकारची भाषा मॉडेल आहे| तुम्हाला भेटून आनंद झाला! |
Kihindi kina tokeni chache kwa mara 2.9 (kutoka 90 hadi 31) | नमस्ते, मेरा नाम जीपीटी-4o है। मैं एक नए प्रकार का भाषा मॉडल हूँ। आपसे मिलकर अच्छा लगा! |
Urdu tokeni 2.5x chache (kutoka 82 hadi 33) | ہیلو، میرا نام جی پی ٹی-4o ہے۔ میں ایک نئے قسم کا زبان ماڈل ہوں، آپ سے مل کر اچھا لگا! |
Kiarabu kina tokeni chache kwa mara (kutoka 29 hadi 26) | مرحبًا، اسمي جي بي تي-4o. أنا نوع جديد من نموذج اللغة، سررت بلقائك! |
Kiajemi 1.9x tokeni chache (kutoka 61 hadi 32) | سلام، اسم من جی پی تی-۴او است. من یک نوع جدیدی از مدل زبانی هستم، از ملاقات شما خوشبختم! |
Kirusi 1.7x tokeni chache (kutoka 39 hadi 23) | Привет, меня зовут GPT-4o. Я — новая языковая модель, приятно познакомиться! |
Kikorea 1.7x tokeni chache (kutoka 45 hadi 27) | 안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다! |
Tokeni za Kivietinamu ni chache mara 1.5 (kutoka 46 hadi 30) | Xin chào, tên tôi là GPT-4o. Tôi là một loại mô hình ngôn ngữ mới, rất vui được gặp bạn! |
Kichina ina tokeni 1.4x chache (kutoka 34 hadi 24) | 你好,我的名字是GPT-4o。我是一种新型的语言模型,很高兴见到你! |
Kijapani 1.4x tokeni chache (kutoka 37 hadi 26) | こんにちは、私の名前はGPT-4oです。私は新しいタイプの言語モデルです。初めまして! |
Tokeni za Kituruki ni chache kwa mara 1.3 (kutoka 39 hadi 30) | Merhaba, benim adım GPT-4o. Ben yeni bir dil modeli türüyüm, tanıştığımıza memnun oldum! |
Tokeni za Kiitaliano 1.2x chache (kutoka 34 hadi 28) | Ciao, mi chiamo GPT-4o. Sono un nuovo tipo di modello linguistico, piacere di conoscerti! |
Kijerumani tokeni 1.2x chache (kutoka 34 hadi 29) | Hallo, mein Name is GPT-4o. Ich bin ein neues KI-Sprachmodell. Es ist schön, dich kennenzulernen. |
Kihispania tokeni 1.1x chache (kutoka 29 hadi 26) | Hola, me llamo GPT-4o. Soy un nuevo tipo de modelo de lenguaje, ¡es un placer conocerte! |
Kireno 1.1x tokeni chache (kutoka 30 hadi 27) | Olá, meu nome é GPT-4o. Sou um novo tipo de modelo de linguagem, é um prazer conhecê-lo! |
Tokeni chache za Kifaransa mara 1.1 (kutoka 31 hadi 28) | Bonjour, je m'appelle GPT-4o. Je suis un nouveau type de modèle de langage, c'est un plaisir de vous rencontrer! |
Kiingereza 1.1x tokeni chache (kutoka 27 hadi 24) | Hello, my name is GPT-4o. I'm a new type of language model, it's nice to meet you! |
GPT‑4o ina usalama uliojengwa kwa muundo katika njia zote, kupitia mbinu kama vile kichujio data ya mafunzo na kuboresha tabia ya muundo kupitia mafunzo ya baada ya mafunzo. Pia tumeunda mifumo mipya ya usalama ili kutoa kinga kwenye matoaji ya sauti.
Tumetathmini GPT‑4o kulingana na Mfumo wetu wa Utayari na kulingana na ahadi zetu za hiari. Tathmini zetu za usalama wa mtandao, CBRN, ushawishi, na uhuru wa muundo zinaonyesha kuwa GPT‑4o haipati alama juu ya Hatari ya ati katika mojawapo ya jamii hizi. Tathmini hii ilihusisha kuendesha seti ya tathmini za kiotomatiki na za kibinadamu katika mchakato mzima wa mafunzo ya muundo. Tulijaribu matoleo yote ya kabla ya kupunguza usalama na baada ya kupunguza usalama ya muundo, kwa kutumia marekebisho ya kuboresha na dokezo maalum, ili kupata uwezo bora wa muundo.
GPT‑4o pia imefanyiwa tathmini ya kina ya timu nyekundu ya nje na wataalamu wa nje zaidi ya 70 katika nyanja kama vile saikolojia ya kijamii, upendeleo na usawa, na habari potofu ili kutambua hatari zinazoweza kuletwa au kuimarishwa na njia mpya zilizoongezwa. wataalamu wa nje Tulitumia mafunzo haya kuunda hatua zetu za usalama ili kuboresha usalama wa kuingiliana na GPT‑4o. Tutaendelea kupunguza hatari mpya zinapogunduliwa.
Tunatambua kwamba njia za sauti za GPT‑4o zinawasilisha hatari mbalimbali mpya. Leo tunatoa hadharani ingizo za maandishi na picha pamoja na utoaji wa maandishi. Katika wiki na miezi ijayo, tutafanya kazi kwenye miundombinu ya kiufundi, utumiaji kupitia mafunzo ya baadae, na usalama unaohitajika ili kutoa njia zingine. Kwa mfano, wakati wa uzinduzi, utoaji wa sauti utakuwa wenye kikomo kwa uteuzi wa sauti zilizowekwa awali na utafuata sera zetu za usalama zilizopo. Tutashiriki maelezo zaidi yanayohusu aina kamili za njia za GPT‑4o katika kadi ya mfumo inayokuja.
Kupitia upimaji wetu na urudiaji wa muundo huo, tumeona mapungufu kadhaa ambayo yapo katika njia zote za muundo, baadhi ya ambazo zimeonyeshwa hapa chini.
Mifano ya mapungufu ya miundo
Tungependa majibu ili kusaidia kutambua shughuli ambapo GPT‑4 Turbo bado inazidi GPT‑4o, ili tuendelee kuboresha muundo huo, asante.
Ilisasishwa Mei 8, 2024
Kama sehemu ya Mfumo wetu wa Utayari, tunafanya tathmini za mara kwa mara na kusasisha kadi za alama kwa miundo yetu. Ni miundo tu iliyo na alama ya baada ya kupunguza ya “kati” au chini ndiyo inayopelekwa. Kiwango cha jumla cha hatari cha muundo kinaamuliwa na kiwango cha juu cha hatari katika kitengo chochote. Hivi sasa, GPT‑4o inatathminiwa kuwa katika hatari ya kati kabla na baada ya juhudi za kupunguza hatari.
GPT‑4o ni hatua yetu ya hivi karibuni katika kusukuma mipaka ya mafunzo ya kina, safari hii kuelekea matumizi ya vitendo. Tumetumia juhudi nyingi katika miaka miwili iliyopita kuboresha ufanisi katika kila safu ya staki. Kama matunda ya kwanza ya utafiti huu, tunaweza kufanya muundo wa kiwango cha GPT‑4 upatikane kwa upana zaidi. Uwezo wa GPT‑4o utatolewa kwa awamu (na upatikanaji uliopanuliwa wa Team nyekundu kuanzia leo).
Uwezo wa maandishi na picha wa GPT‑4o unaanza kutolewa leo katika ChatGPT. Tunafanya GPT‑4o ipatikane katika kiwango cha bure, na kwa watumiaji wa Plus wenye mipaka ya ujumbe hadi mara 5 zaidi. Tutatoa toleo jipya la Hali ya Sauti na GPT‑4o katika awamu ya alpha ndani ya ChatGPT Plus katika wiki zijazo.
Wasanidi programu sasa wanaweza Chatgpt imeingia UI iliyofunikwa kwenye asili ya kijani kibichi. kufikia GPT‑4o API kama muundo wa maandishi na maono. GPT‑4o ni mara 2 haraka, nusu ya bei, na ina mipaka ya kiwango cha juu mara 5 ikilinganishwa na GPT‑4 Turbo. Mpango wetu ni kuzindua usaidizi kwa uwezo mpya wa sauti na video wa GPT‑4o kwa kikundi kidogo cha washirika wanaoaminika katika API katika wiki zijazo.