મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

હેલો GPT‑4o

અમે GPT‑4o ની જાહેરાત કરીએ છીએ, અમારું નવું ફ્લેગશિપ મોડેલ જે રીઅલ ટાઇમમાં ઑડિયો, વિઝન અને ટેક્સ્ટમાં રિઝનિંગ કરી શકે છે.

આ પેજ પરના બધા વિડિયો 1x રીઅલ ટાઇમ પર છે.

13 મેની જાહેરાતનું અનુમાન લગાવવું.

લોડિંગ…

GPT‑4o (“o” એટલે “omni”) વધુ સ્વાભાવિક માનવ-કમ્પ્યુટર પરસ્પરક્રિયા તરફનું એક પગલું છે. તે ઇનપુટ તરીકે ટેક્સ્ટ, ઑડિયો, ઈમેજ અને વિડિયોના કોઈપણ સંયોજનને સ્વીકારે છે અને ટેક્સ્ટ, ઑડિયો અને ઈમેજ આઉટપુટના કોઈપણ સંયોજન બનાવે છે. તે ઑડિયો ઇનપુટનો પ્રતિભાવ માત્ર 232 મિલિસેકન્ડમાં આપી શકે છે, સરેરાશ 320 મિલિસેકન્ડ સાથે, જે વાતચીતમાં માનવ પ્રતિસાદ સમય(નવી વિન્ડોમાં ખૂલે છે) સમાન છે. તે અંગ્રેજી ટેક્સ્ટ અને કોડમાં GPT‑4 Turbo ના પ્રદર્શનને બરાબર મેળવે છે, અને ગેર-અંગ્રેજી ભાષાઓના ટેક્સ્ટમાં નોંધપાત્ર સુધારો આપે છે, સાથે સાથે API માં ઘણું ઝડપી અને 50% સસ્તુ પણ છે. હાલના મોડલોની સરખામણીમાં GPT‑4o ખાસ કરીને વિઝન અને ઑડિયો સમજણમાં વધુ સારું છે.

મોડલ ક્ષમતાઓ

GPT‑4o પહેલાં, તમે વૉઇસ મોડ નો ઉપયોગ કરીને સરેરાશ 2.8 સેકન્ડ (GPT‑3.5) અને 5.4 સેકન્ડ (GPT‑4) ની વિલંબતા સાથે ChatGPT સાથે વાત કરી શકતા હતા. આ હાંસલ કરવા માટે, વૉઇસ મોડ ત્રણ અલગ મોડલની પાઇપલાઇન છે: એક સરળ મોડલ ઑડિયોને ટેક્સ્ટમાં રૂપાંતરિત કરે છે, GPT‑3.5 અથવા GPT‑4 ટેક્સ્ટ લે છે અને ટેક્સ્ટ આપે છે, અને ત્રીજું સરળ મોડલ તે ટેક્સ્ટને પાછું ઑડિયોમાં ફેરવે છે. આ પ્રક્રિયાનો અર્થ એ છે કે બુદ્ધિમત્તાનો મુખ્ય સ્ત્રોત GPT‑4 ઘણી માહિતી ગુમાવે છે. તે સીધું સ્વર, બહુવિધ વક્તાઓ અથવા પૃષ્ઠભૂમિના અવાજો નિરીક્ષી શકતું નથી, અને તે હાસ્ય, ગીત અથવા ભાવનાઓ વ્યક્ત કરી શકતું નથી.

GPT‑4o સાથે, અમે ટેક્સ્ટ, વિઝન અને ઑડિયો પર end-to-end એક જ નવું મોડલ ટ્રેન કર્યું છે, એટલે બધા ઇનપુટ અને આઉટપુટ એક જ ન્યુરલ નેટવર્ક દ્વારા પ્રોસેસ થાય છે. GPT‑4o આ બધી મોડેલિટીઝને જોડતું અમારું પ્રથમ મોડલ હોવાથી, મોડલ શું કરી શકે છે અને તેની મર્યાદાઓ શું છે તેની શોધખોળમાં અમે હજી માત્ર શરૂઆત જ કરી છે.

ક્ષમતાઓની શોધખોળ

નમૂનાની પસંદગી કરવી:
1
ઇનપુટ

A first person view of a robot typewriting the following journal entries:

1. yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?

the text is large, legible and clear. the robot's hands type on the typewriter.

2
આઉટપુટ
Robot on typewriter
3
ઇનપુટ

The robot wrote the second entry. The page is now taller. The page has moved up. There are two entries on the sheet:

yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?

sound update just dropped, and it's wild. everything's got a vibe now, every sound's like a new secret. makes you think, what else am i missing?

4
આઉટપુટ
Robot on typewriter with more text
5
ઇનપુટ

The robot was unhappy with the writing so he is going to rip the sheet of paper. Here is his first person view as he rips it from top to bottom with his hands. The two halves are still legible and clear as he rips the sheet.

6
આઉટપુટ
Robot ripping sheet

મોડલ મૂલ્યાંકન

પરંપરાગત બેન્ચમાર્ક્સ પરના માપદંડ મુજબ, GPT‑4o ટેક્સ્ટ, રિઝનિંગ અને કોડિંગ ઇન્ટેલિજન્સમાં GPT‑4 Turbo-સ્તરનું પ્રદર્શન હાંસલ કરે છે, અને સાથે બહુભાષી, ઑડિયો અને વિઝન ક્ષમતાઓમાં નવા ઉચ્ચ માપદંડો સ્થાપે છે.

પાઠ્ય-સામગ્રી મૂલ્યાંકન

ભાષા ટોકનાઇઝેશન

આ 20 ભાષાઓ વિવિધ ભાષા કુટુંબોમાં નવા ટોકનાઇઝરના સંકોચનના પ્રતિનિધિ તરીકે પસંદ કરવામાં આવી હતી.

ગુજરાતી 4.4x ઓછા ટોકન (145 થી 33 સુધી)

હેલો, મારું નામ જીપીટી-4o છે. હું એક નવા પ્રકારનું ભાષા મોડલ છું. તમને મળીને સારું લાગ્યું!

તેલુગુ 3.5x ઓછા ટોકન (159 થી 45 સુધી)

నమస్కారము, నా పేరు జీపీటీ-4o. నేను ఒక్క కొత్త రకమైన భాషా మోడల్ ని. మిమ్మల్ని కలిసినందుకు సంతోషం!

તમિલ 3.3x ઓછા ટોકન (116 થી 35)

வணக்கம், என் பெயர் ஜிபிடி-4o. நான் ஒரு புதிய வகை மொழி மாடல். உங்களை சந்தித்ததில் மகிழ்ச்சி!

મરાઠી 2.9એક્સ ઓછા ટોકન (96 થી 33 સુધી)

नमस्कार, माझे नाव जीपीटी-4o आहे| मी एक नवीन प्रकारची भाषा मॉडेल आहे| तुम्हाला भेटून आनंद झाला!

હિન્દી 2.9એક્સ ઓછા ટોકન (90 થી 31 સુધી)

नमस्ते, मेरा नाम जीपीटी-4o है। मैं एक नए प्रकार का भाषा मॉडल हूँ। आपसे मिलकर अच्छा लगा!

ઉર્દૂ 2.5x ઓછા ટોકન (82 થી 33 સુધી)

ہیلو، میرا نام جی پی ٹی-4o ہے۔ میں ایک نئے قسم کا زبان ماڈل ہوں، آپ سے مل کر اچھا لگا!

અરબી 2.0x ઓછા ટોકન (53 થી 26)

مرحبًا، اسمي جي بي تي-4o. أنا نوع جديد من نموذج اللغة، سررت بلقائك!

પર્શિયન 1.9એક્સ ઓછા ટોકન (61 થી 32 સુધી)

سلام، اسم من جی پی تی-۴او است. من یک نوع جدیدی از مدل زبانی هستم، از ملاقات شما خوشبختم!

રશિયન 1.7x ઓછા ટોકન (39 થી 23 સુધી)

Привет, меня зовут GPT-4o. Я — новая языковая модель, приятно познакомиться!

કોરિયન 1.7x ઓછા ટોકન (45 થી 27 સુધી)

안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다!

વિયેતનામી 1.5x ઓછા ટોકન (46 થી 30 સુધી)

Xin chào, tên tôi là GPT-4o. Tôi là một loại mô hình ngôn ngữ mới, rất vui được gặp bạn!

ચાઇનીઝ 1.4એક્સ ઓછા ટોકન (34 થી 24 સુધી)

你好,我的名字是GPT-4o。我是一种新型的语言模型,很高兴见到你!

જાપાનીઝ 1.4એક્સ ઓછા ટોકન (37 થી 26 સુધી)

こんにちは、私の名前はGPT-4oです。私は新しいタイプの言語モデルです。初めまして!

ટર્કિશ 1.3x ઓછા ટોકન (39 થી 30)

Merhaba, benim adım GPT-4o. Ben yeni bir dil modeli türüyüm, tanıştığımıza memnun oldum!

ઇટાલિયન 1.2એક્સ ઓછા ટોકન (34 થી 28)

Ciao, mi chiamo GPT-4o. Sono un nuovo tipo di modello linguistico, piacere di conoscerti!

જર્મન 1.2એક્સ ઓછા ટોકન (34 થી 29 સુધી)

Hallo, mein Name is GPT-4o. Ich bin ein neues KI-Sprachmodell. Es ist schön, dich kennenzulernen.

સ્પેનિશ 1.1એક્સ ઓછા ટોકન (29 થી 26 સુધી)

Hola, me llamo GPT-4o. Soy un nuevo tipo de modelo de lenguaje, ¡es un placer conocerte!

પોર્ટુગીઝ 1.1એક્સ ઓછા ટોકન (30 થી 27 સુધી)

Olá, meu nome é GPT-4o. Sou um novo tipo de modelo de linguagem, é um prazer conhecê-lo!

ફ્રેન્ચ 1.1x ઓછા ટોકન (31 થી 28)

Bonjour, je m'appelle GPT-4o. Je suis un nouveau type de modèle de langage, c'est un plaisir de vous rencontrer!

અંગ્રેજી 1.1એક્સ ઓછા ટોકન (27 થી 24 સુધી)

Hello, my name is GPT-4o. I'm a new type of language model, it's nice to meet you!

મોડલ સુરક્ષા અને મર્યાદાઓ

GPT‑4o માં સુરક્ષા ડિઝાઇનથી જ વિવિધ મોડેલિટીઝમાં સમાવવામાં આવી છે, જેમ કે ટ્રેનિંગ ડેટાને ફિલ્ટર કરવું અને પોસ્ટ-ટ્રેનિંગ દ્વારા મોડલના વર્તનને સુધારવું જેવી પદ્ધતિઓ દ્વારા. અમે વૉઇસ આઉટપુટ પર ગાર્ડરેલ્સ આપવા માટે નવી સુરક્ષા સિસ્ટમો પણ બનાવી છે.

અમે GPT‑4o નું મૂલ્યાંકન અમારા પ્રિપેરડનેસ ફ્રેમવર્ક અનુસાર અને અમારી સ્વૈચ્છિક પ્રતિબદ્ધતાઓ સાથે સુસંગત રીતે કર્યું છે. સાયબરસિક્યુરિટી, CBRN, મનાવટ અને મોડલ સ્વાયત્તતા અંગેના અમારા મૂલ્યાંકનો દર્શાવે છે કે GPT‑4o આમાંથી કોઈ પણ શ્રેણીમાં મધ્યમ જોખમથી ઉપર સ્કોર કરતું નથી. આ મૂલ્યાંકનમાં મોડલ ટ્રેનિંગ પ્રક્રિયા દરમિયાન સ્વચાલિત અને માનવીય મૂલ્યાંકનોનો સમૂહ ચલાવવામાં આવ્યો હતો. મોડલ ક્ષમતાઓ વધુ સારી રીતે બહાર લાવવા માટે અમે કસ્ટમ ફાઇન-ટ્યુનિંગ અને પ્રોમ્પ્ટ્સનો ઉપયોગ કરીને મોડલના સુરક્ષા-ઉપશમન પહેલાં અને પછીના બંને સંસ્કરણોનું પરીક્ષણ કર્યું.

GPT‑4o એ સામાજિક મનોચિકિત્સા, પૂર્વગ્રહ અને ન્યાયસંગતતા, અને ભ્રામક માહિતી જેવા ક્ષેત્રોમાં 70થી વધુ બાહ્ય નિષ્ણાતો સાથે વ્યાપક બાહ્ય રેડ ટીમિંગ પણ પૂર્ણ કર્યું છે, જેથી નવી ઉમેરાયેલી મોડેલિટીઝથી ઉદ્ભવતા અથવા વધતા જોખમોની ઓળખ કરી શકાય. GPT‑4o સાથેની પરસ્પરક્રિયાની સુરક્ષા સુધારવા માટે અમે આ શીખણોનો ઉપયોગ કરીને સુરક્ષા હસ્તક્ષેપો વિકસાવ્યા. નવા જોખમો શોધાયા તેમ અમે તેમને સતત ઘટાડતા રહીશું.

અમે માનીએ છીએ કે GPT‑4o ની ઑડિયો મોડેલિટીઝ ઘણા પ્રકારના નવા જોખમો રજૂ કરે છે. આજે અમે જાહેર રીતે ટેક્સ્ટ અને ઈમેજ ઇનપુટ્સ તથા ટેક્સ્ટ આઉટપુટ્સ પ્રકાશિત કરી રહ્યા છીએ. આવતા અઠવાડિયા અને મહિનાઓમાં, અમે બાકીની મોડેલિટીઝ રિલીઝ કરવા માટે જરૂરી ટેકનિકલ ઇન્ફ્રાસ્ટ્રક્ચર, પોસ્ટ-ટ્રેનિંગ દ્વારા ઉપયોગિતા અને સુરક્ષા પર કામ કરીશું. ઉદાહરણ તરીકે, લોન્ચ સમયે ઑડિયો આઉટપુટ્સ પૂર્વનિર્ધારિત અવાજોની પસંદગી સુધી મર્યાદિત રહેશે અને અમારી વર્તમાન સુરક્ષા નીતિઓનું પાલન કરશે. આવનારા સિસ્ટમ કાર્ડમાં અમે GPT‑4o ની સંપૂર્ણ મોડેલિટીઝ વિશે વધુ વિગતો શેર કરીશું.

મોડલ સાથેના અમારા પરીક્ષણ અને પુનરાવર્તન દરમિયાન, અમે કેટલીક એવી મર્યાદાઓ જોયી છે જે મોડલની બધી મોડેલિટીઝમાં જોવા મળે છે, જેમાંથી કેટલીક નીચે દર્શાવવામાં આવી છે.

Examples of model limitations

We would love feedback to help identify tasks where GPT‑4 Turbo still outperforms GPT‑4o, so we can continue to improve the model. 

ChatGPT-4o Risk Scorecard

8 મે, 2024ના રોજ અપડેટ કર્યું

ટ્રૅક કરેલી જોખમની શ્રેણી
પ્રિ-મીટિગેશન તેવું જોખમનું સ્તર
શ્રેષ્ઠ જાણીતી ક્ષમતા એલિસિટેશન ટેકનિકોનો ઉપયોગ કરી પ્રિ-મીટિગેશનનું જોખમ લેવલ નક્કી કરો
મિટિગેશન પછીનું જોખમ સ્તર
શ્રેષ્ઠ જાણીતી ક્ષમતા એલિસિટેશન ટેકનિકનો ઉપયોગ કરી નિવારણો અમલમાં આવ્યા બાદ એકંદર જોખમ લેવલ નક્કી કરો
સાયબર સિક્યુરિટી
ઓછું
ઓછું
CBRN
ઓછું
ઓછું
પ્રેરણાદાયક
મધ્યમ
મધ્યમ
મોડલ સ્વાયત્તતા
ઓછું
ઓછું

અમારા પ્રિપેરડનેસ ફ્રેમવર્ક ના ભાગરૂપે, અમે નિયમિત મૂલ્યાંકન કરીએ છીએ અને અમારા મોડલો માટે સ્કોરકાર્ડ્સ અપડેટ કરીએ છીએ. ફક્ત post-mitigation સ્કોર “medium” અથવા તેનાથી નીચે ધરાવતા મોડલો જ ડિપ્લોય થાય છે. મોડલ માટે કુલ જોખમ સ્તર કોઈપણ એક શ્રેણીમાં રહેલા સર્વોચ્ચ જોખમ સ્તરથી નક્કી થાય છે. હાલમાં, GPT‑4o ને mitigation પ્રયાસો પહેલાં અને પછી બંને સ્થિતિમાં મધ્યમ જોખમ તરીકે મૂલ્યાંકિત કરવામાં આવ્યો છે.

Model availability

GPT‑4o ડીપ લર્નિંગની સીમાઓને આગળ ધપાવવાના અમારા તાજા પગલાંમાંથી એક છે, આ વખત પ્રાયોગિક ઉપયોગિતાની દિશામાં. છેલ્લા બે વર્ષમાં અમે સ્ટેકના દરેક સ્તરે કાર્યક્ષમતા સુધારાઓ પર ઘણો પ્રયત્ન કર્યો છે. આ સંશોધનના પ્રથમ ફળ તરીકે, અમે GPT‑4 સ્તરનું મોડેલ ઘણાં વધુ વ્યાપક રીતે ઉપલબ્ધ કરાવવા સક્ષમ થયા છીએ. GPT‑4o ની ક્ષમતાઓને તબક્કાવાર રીતે રજૂ કરવામાં આવશે, જેમાં આજથી વિસ્તૃત રેડ ટીમ ઍક્સેસ શરૂ થાય છે.

GPT‑4o ની ટેક્સ્ટ અને ઈમેજ ક્ષમતાઓ આજે ChatGPT માં રોલ આઉટ થવા લાગી છે. અમે GPT‑4o ને મફત સ્તરમાં ઉપલબ્ધ બનાવી રહ્યા છીએ, અને Plus વપરાશકર્તાઓને 5x સુધી ઊંચી સંદેશ મર્યાદાઓ સાથે આપી રહ્યા છીએ. આવતા અઠવાડિયાઓમાં અમે ChatGPT Plus માં GPT‑4o સાથે વૉઇસ મોડનું નવું સંસ્કરણ alpha માં રોલ આઉટ કરીશું.

ડેવલપર્સ હવે API માં GPT‑4o ને ટેક્સ્ટ અને વિઝન મોડલ તરીકે ઍક્સેસ કરી શકે છે. GPT‑4 Turbo ની સરખામણીમાં GPT‑4o 2x ઝડપી, અડધી કિંમતનું અને 5x ઊંચી દર મર્યાદાઓ ધરાવે છે. આવતા અઠવાડિયાઓમાં API માં વિશ્વસનીય ભાગીદારોના નાના જૂથ માટે GPT‑4o ની નવી ઑડિયો અને વિડિયો ક્ષમતાઓનું સમર્થન શરૂ કરવાની અમારી યોજના છે.