OpenAI o3 iyo o4-mini waa noocyadii ugu dambeeyay ee caqliyeynta muuqaalka ee taxanaheenna o-series. Markii ugu horreysay, noocyadeennu waxay ku fikiri karaan sawirro gudaha silsilada fikirka—kuma eka oo keliya inay arkaan.
Si la mid ah noocii hore ee OpenAI o1, o3 iyo o4-mini waxaa loo tababaray inay waqti dheer fikiraan ka hor inta aysan jawaabin—oo ay isticmaalaan silsilad fikir oo gudaha ah oo dheer ka hor inta aysan uga jawaabin isticmaalaha. o3 iyo o4-mini waxay sii ballaariyaan awooddan iyagoo sawirro ku fikiraya gudaha silsilada fikirka, taas oo lagu gaadho iyadoo sawirrada uu isticmaaluhu soo geliyo lagu beddelayo qalab, taas oo u oggolaanaysa inay gooyaan, soo dhoweeyaan, oo rogaan, marka lagu daro farsamooyin kale oo fudud oo habaynta sawirka ah. Waxa ka sii muhiimsan, awoodahani waxay u yimaadaan si asal ahaan ku dhisan, iyada oo aan lagu tiirsanayn noocyo gaar ah oo kala gooni ah.
Caqliga muuqaalka ee la xoojiyey ee ChatGPT wuxuu kaa caawinayaa inaad xalliso dhibaatooyin adag adigoo sawirrada u falanqaynaya si ka qoto dheer, sax ah, oo lagu kalsoonaan karo sidii hore. Waxay si aan kala go’ lahayn isugu dari kartaa caqliyeyn horumarsan iyo qalab sida raadinta webka iyo wax-ka-beddelka sawirka—iyadoo si toos ah u soo dhowaynaysa, u goynaysa, u rogaysa, ama u hagaajinaysa sawirradaada—si ay xog uga soo saarto xataa sawirro aan qummanayn. Tusaale ahaan, waxaad soo geli kartaa sawir ah xaashi dhibaatooyin dhaqaalaha ah si aad u hesho sharraxaad tallaabo-tallaabo ah, ama waxaad wadaagi kartaa shaashad-qabasho qalad dhisme ah si aad si degdeg ah u hesho falanqayn sababta asalka ah.
Habkani wuxuu suuragelinayaa jiho cusub oo lagu cabbiro xisaabinta waqtiga-imtixaanka taas oo si aan kala go’ lahayn u dhexgelisa caqliyeynta muuqaalka iyo qoraalka, sida ka muuqata waxqabadkooda heerka ugu sarreeya ee cabbirrada multimodal, taas oo calaamad u ah tallaabo weyn oo loo qaaday caqliyeynta multimodal.
Ku fikiridda sawirradu waxay kuu oggolaanaysaa inaad si ka sahlan ula falgasho ChatGPT. Waxaad su’aalo ku weydiin kartaa adigoo sawir qaadaya adoon ka welwelin meelaynta walxaha—ha noqoto qoraalku madax-hoos ama ay jiraan dhowr dhibaato fiisigis ah oo ku jira hal sawir. Xataa haddii walxuhu markiiba si cad u muuqan waayaan, caqliyeynta muuqaalka ayaa u oggolaanaysa nooca inuu soo dhowaado si uu si ka sii cad u arko.
Dhammaan tusaalooyinka waxaa lagu dhammeeyey OpenAI o3.
Noocyadeenna ugu dambeeyay ee caqliyeynta muuqaalka waxay si wadajir ah ula shaqeeyaan qalab kale sida falanqaynta xogta Python, raadinta webka, iyo soo saarida sawirka si hal-abuur iyo wax-ku-oolnimo leh loogu xalliyo dhibaatooyin ka sii adag, iyaga oo u keenaya isticmaalayaasha waayo-aragnimadeennii ugu horreysay ee wakiil multimodal ah.
Si loo muujiyo horumarka caqliyeynta muuqaalka marka loo eego noocyadeennii hore ee multimodal, waxaan ku tijaabinnay OpenAI o3 iyo o4-mini imtixaano bini’aadan oo kala duwan iyo cabbirro ML ah. Noocyadan cusub ee caqliyeynta muuqaalka ayaa si weyn uga sarreeya kuwii ka horreeyay dhammaan hawlaha multimodal ee aan tijaabinnay.
Dhammaan noocyada waxaa lagu qiimeeyaa dejimo “dadaal caqliyeyn” oo sarreeya—kuwaas oo la mid ah noocyo sida “o4-mini-high” ee ChatGPT.
Gaar ahaan, ku fikiridda sawirrada—iyada oo aan lagu tiirsanayn baaritaan web—waxay keentaa horumar weyn dhammaan cabbirrada garashada ee aan qiimeynnay. Noocyadeennu waxay dejiyaan waxqabad cusub oo heerka ugu sarreeya ah su’aal-jawaabaha STEM (MMMU, MathVista), akhrinta iyo caqliyeynta jaantusyada (CharXiv), unugyada aasaasiga ah ee garashada (VLMs are Blind), iyo raadinta muuqaalka (V*). V* gudaheeda, habkeenna caqliyeynta muuqaalka wuxuu gaaraa saxnaan 95.7%, isaga oo inta badan xallinaya cabbirkaas.
Ku fikiridda sawirrada hadda waxay leedahay xaddidaadaha soo socda:
- Silsilado caqliyeyn oo aad u dheer: Noocyadu waxay samayn karaan wicitaanno qalab oo soo noqnoqda ama aan loo baahnayn iyo tallaabooyin wax-ka-beddel sawir, taas oo dhalinaysa silsilo fikir oo aad u dheer.
- Khaladaadka garashada: Noocyadu weli waxay samayn karaan khaladaad garasho oo aasaasi ah. Xataa marka wicitaannada qalabku si sax ah u hormariyaan habka caqliyeynta, fasiraado muuqaal oo qaldan ayaa keeni kara jawaabo kama dambays ah oo khaldan.
- Kalsoonida: Noocyadu waxay isku dayi karaan habab kala duwan oo caqliyeyn muuqaal ah marar badan oo isku dhibaatada ah, kuwaas oo qaarkood keeni kara natiijooyin khaldan.
OpenAI o3 iyo o4-mini waxay si weyn u hormariyaan awoodaha caqliyeynta muuqaalka ee heerka ugu sarreeya, iyaga oo matalaya tallaabo muhiim ah oo loo qaaday caqliyeyn balaadhan oo multimodal ah. Noocyadani waxay bixiyaan saxnaanta ugu fiican fasalkooda ee hawlaha garashada muuqaalka, taas oo u suurtagelinaysa inay xalliyaan su’aalo markii hore aan la gaadhi karin.
Waxaan si joogto ah u hagaajinaynaa awoodaha caqliyeynta ee noocyada ku shaqeeya sawirrada si ay u noqdaan kuwo kooban, aan soo noqnoqon, oo lagu kalsoonaan karo. Waxaan ku faraxsanahay inaan sii wadno cilmi-baaristayada caqliyeynta multimodal, iyo in dadku sahamiyaan sida horumaradani u xoojin karaan shaqadooda maalinlaha ah.
Cusboonaysiinta Abriil 16: natiijooyinka o3 ee Charxiv-r, Mathvista, iyo vlmsareblind waa la cusboonaysiiyay si ay uga tarjumaan isbeddel ku yimid system prompt-ka oo aan ku jirin qiimeyntii asalka ahayd.
Qorayaasha
Ka qayb-qaatayaasha
Aditya Ramesh, Aidan Clark, Aleksandra Spyra, Alex Tachard Passos, Alexander Kirillov, Ali Kalami, Amy McDonald Sandjideh, Andrei Gheorghe, Andrew Gibiansky, Andrew Tulloch, Angela Baek, Anubha Srivastava, Avital Oliver, Behrooz Ghorbani, Ben Leimberger, Borys Minaiev, Bowen Cheng, Brandon McKinzie, Carpus Chang, Cary Hudson, Casey Chu, Charlotte Cole, Chen Shen, Dan Roberts, Dana Palmie, Daniel Kappler, David Medina, Edmund Wong, Eric Mitchell, Eric Ning, Freddie Sulit, Haiming Bao, Haitang Hu, Hongyu Ren, Hyeonwoo Noh, Jakub Pachocki, James Betker, James Qin, Jamie Kiros, Jason Ai, Jerry Tworek, Jessica Liang, Ji Lin, Jiahui Yu, Jianfeng Wang, Joseph Mo, Kenji Hata, Kevin King, Kristian Georgiev, Kshitij Gupta, Lauren Yang, Li Jing, Lin Yang, Linden Li, Mark Chen, Martin Li, Max Schwarzer, Mia Glaese, Michael Malek, Minnia Feng, Nacho Soto, Nat McAleese, Niko Felix, Peter Faiman, Prafulla Dhariwal, Rajkumar Samuel, Rapha Gontijo Lopes, Ravi Teja Mullapudi, Reiichiro Nakano, Rennie Song, Ricky Xu, Sam Altman, Sean Fitzgerald, Shengjia Zhao, Shengli Hu, Shuchao Bi, Spencer Papay, Szi-chieh Yu, Wenda Zhou, Yang Lu, Yara Khakbaz, Yunxing Dai, Zhishuai Zhang








