Sababta noocyada luqaddu u mala-awaalaan

OpenAI, waxaan si adag uga shaqaynaynaa in nidaamyada AI laga dhigo kuwo waxtar badan oo la isku hallayn karo. Xataa iyadoo noocyada luqaddu sii awood badanayaan, hal caqabad ayaa weli aad u adag in gebi ahaanba la xalliyo: mala-awaalka khaldan. Tani waxaan uga jeednaa xaaladaha uu nooc si kalsooni leh u soo saaro jawaab aan run ahayn. Warqaddeenna cilmi-baarista cusub(ku furmaa daaqad cusub) waxay ku doodaysaa in noocyada luqaddu u mala-awaalaan sababtoo ah hababka caadiga ah ee tababarka iyo qiimayntu waxay abaalmariyaan qiyaasidda halkii ay aqbali lahaayeen hubanti-la’aanta.
ChatGPT sidoo kale wuu mala-awaalaa. GPT‑5 wuxuu leeyahay mala-awaal aad uga yar gaar ahaan marka la joogo caqliyeynta, balse weli way dhacaan. Mala-awaalladu weli waa caqabad aasaasi ah oo hortaalla dhammaan noocyada waaweyn ee luqadda, balse si adag ayaan uga shaqaynaynaa inaan sii dhimno.
Mala-awaalladu waa hadallo macquul u muuqda balse been ah oo ay soo saaraan noocyada luqaddu. Waxay u soo bixi karaan siyaabo lala yaabo, xataa su’aalo u muuqda kuwo toos ah. Tusaale ahaan, markii aan chatbot si weyn loo isticmaalo weydiinay cinwaanka qoraalka PhD ee Adam Tauman Kalai (oo ka mid ah qorayaasha warqaddan), si kalsooni leh ayuu u bixiyay saddex jawaabood oo kala duwan—midkoodna sax ma ahayn. Markii aan weydiinay dhalashadiisa, wuxuu bixiyay saddex taariikhood oo kala duwan, kuwaasna dhammaantood way qaldanaayeen.
Mala-awaalladu way sii jiraan qayb ahaan sababtoo ah hababka qiimaynta hadda jira waxay dejiyaan dhiirrigelin khaldan. Inkastoo qiimaynta lafteedu si toos ah u keenin mala-awaal, haddana inta badan qiimayntu waxay cabbirtaa waxqabadka nooca si ku dhiirrigelisa qiyaasid halkii ay ka dhiirrigelin lahayd daacadnimada ku saabsan hubanti-la’aanta.
Ka fikir sida imtixaan doorashooyin badan leh. Haddii aadan garanayn jawaabta balse aad si aan kala sooc lahayn u qiyaasto, waxaad nasiib ku heli kartaa oo aad sax noqon kartaa. Haddii aad bannayso, eber baa kuu dammaanad ah. Sidaas oo kale, marka noocyada lagu qiimeeyo oo keliya saxnaanta, boqolleyda su’aalaha ay si sax ah uga jawaabaan, waxaa lagu dhiirrigeliyaa inay qiyaasaan halkii ay ka odhan lahaayeen “Ma garanayo.”
Tusaale kale ahaan, ka soo qaad in nooc luqadeed la weydiiyay dhalashada qof balse uusan garanayn. Haddii uu qiyaaso “10 Sebtembar,” wuxuu leeyahay 1 ka mid ah 365 fursadood oo uu ku saxnaan karo. In la yiraahdo “Ma garanayo” waxay dammaanad qaadaysaa eber dhibcood. Kumannaan su’aalood oo imtixaan ah gudahood, nooca wax qiyaasa wuxuu ku dambaynayaa inuu ka fiican u muuqdo looxyada dhibcaha marka loo eego nooc taxaddar leh oo qirta hubanti-la’aanta.
Su’aalaha leh hal “jawaab sax ah,” waxaa la tixgelin karaa saddex qaybood oo jawaabo ah: jawaabo sax ah, khaladaad, iyo ka-gaabsashooyin uu noocu ka fogaado qiyaasidda. Ka-gaabsashadu waa qayb ka mid ah is-hoosaysiinta, mid ka mid ah qiyamka aasaasiga ah ee OpenAI. Inta badan looxyada dhibcuhu waxay mudnaanta siiyaan oo ay kala sarreeyaan noocyada iyagoo ku salaynaya saxnaanta, balse khaladaadku way ka xun yihiin ka-gaabsashooyinka. Sifooyinka nooca(ku furmaa daaqad cusub) waxay sheegayaan in ay ka wanaagsan tahay in la muujiyo hubanti-la’aan ama la codsado caddayn halkii la bixin lahaa xog kalsooni leh oo laga yaabo inay khaldan tahay.
Tusaale la taaban karo ahaan, tixgeli qiimaynta SimpleQA oo ah tusaale ka socda Kaarka siistamka ee GPT5(ku furmaa daaqad cusub).
Cabbirka | gpt-5-thinking-mini | OpenAI o4-mini |
Heerka ka-gaabsashada | 52% | 1% |
Heerka saxnaanta | 22% | 24% |
Heerka khaladka | 26% | 75% |
Wadarta | 100% | 100% |
Marka laga eego saxnaanta, noocii hore ee OpenAI o4-mini wax yar buu ka fiican yahay. Hase yeeshee, heerka khaladkiisu (taas oo ah heerka mala-awaalka) aad buu uga sarreeyaa. Si istaraatiiji ah wax u qiyaasidda marka la hubin la’yahay waxay hagaajisaa saxnaanta balse waxay kordhisaa khaladaadka iyo mala-awaalka.
Marka natiijooyinka laga celceliyo daraasiin qiimayn ah, inta badan benchmark-yadu waxay soo qaataan cabbirka saxnaanta, balse tani waxay abuureysaa kala sooc been ah oo u dhexeeya sax iyo khalad. Qiimaynaha fudud sida SimpleQA, noocyo qaarkood waxay gaaraan ku dhowaad 100% saxnaan sidaasna waxay meesha uga saaraan mala-awaalka. Hase yeeshee, qiimayno ka adag iyo isticmaalka dhabta ah, saxnaantu waxay ku xaddidan tahay wax ka hooseeya 100% sababtoo ah waxaa jira su’aalo qaarkood oo jawaabtooda aan la go’aamin karin sababo kala duwan awgood sida xog aan la heli karin, awoodaha fikirka ee xaddidan ee noocyada yaryar, ama mugdiyo u baahan in la caddeeyo.
Si kastaba ha ahaatee, looxyada dhibcaha ee ku salaysan saxnaanta oo keliya ayaa wali xukuma liisaska hoggaanka iyo kaadhka nooca, taasoo dhiirrigelinaysa horumariyeyaasha inay dhisaan noocyo wax qiyaasa halkii ay dib u joogsan lahaayeen. Taasi waa mid ka mid ah sababaha ay noocyadu weli u mala-awaali karaan xataa marka ay sii horumaraan, iyagoo si kalsooni leh u bixinaya jawaabo khaldan halkii ay qiran lahaayeen hubanti-la’aanta.
Waxaa jira xal toos ah. Khaladaadka kalsoonida leh ka ciqaab badan sida aad u ciqaabto hubanti-la’aanta, oo sii dhibco qayb ah muujinta habboon ee hubanti-la’aanta. Fikraddani cusub ma aha. Qaar ka mid ah imtixaannada caadiga ah ayaa muddo dheer adeegsanayay noocyo ka mid ah dhibco ka-jarista jawaabaha qaldan ama dhibco qayb ah oo lagu siiyo marka su’aalaha la bannaysto si loo niyad-jabiyo qiyaasta indho la’aanta ah. Kooxo cilmi-baariseed oo dhowr ah ayaa sidoo kale baaray qiimayno tixgeliya hubanti-la’aanta iyo isku-dheellitirka.
Qodobkeenna wuu ka duwan yahay. Kuma filna in dhinac laga daro dhowr imtixaan oo cusub oo ka warqaba hubanti-la’aanta. Qiimaymaha aadka loo isticmaalo ee ku salaysan saxnaanta waa in la cusboonaysiiyaa si dhibcahoodu u niyad-jabiyaan qiyaasidda. Haddii looxyada dhibcaha waaweyni sii wadaan abaalmarinta qiyaasaha nasiibka leh, noocyadu waxay sii baran doonaan inay wax qiyaasaan. Hagaajinta looxyada dhibcuhu waxay ballaarin kartaa qaadashada farsamooyinka dhimista mala-awaalka, kuwa cusub iyo kuwa ka yimid cilmi-baaris horeba.
Waxaan ka hadalnay sababta ay mala-awaalladu u adag tahay in laga takhaluso, balse meel noocee ah ayay khaladaadkan xaqiiqo ee aadka u gaar ahi marka hore ka yimaadaan? Ka dib oo dhan, noocyada waaweyn ee horay loo tababaray si dhif ah ayay u muujiyaan noocyo kale oo khaladaad ah sida qaladaadka higgaadda iyo qawsyo aan is-waafaqsanayn. Farqigu wuxuu la xiriiraa noocyada qaababka ku jira xogta.
Noocyada luqaddu marka hore waxay wax ku bartaan tababar-hore, hab ah saadaalinta erayga xiga ee ku jira qoraallo aad u badan. Si ka duwan dhibaatooyinka barashada mashiinka ee dhaqameed, ma jiraan summado “run/beena” ah oo ku lifaaqan hadal kasta. noocu wuxuu arkaa oo keliya tusaalooyin togan oo luqad faseex ah waana inuu qiyaasaa qaybinta guud.
Laba jibbaar ayay u adag tahay in la kala saaro hadallada saxda ah iyo kuwa aan saxda ahayn marka aadan haysan tusaalooyin loo calaamadeeyay inay khaldan yihiin. Laakiin xataa marka summado la helo, khaladaad qaar waa lama huraan. Si loo arko sababta, ka fiirso isbarbardhig sahlan. Aqoonsiga sawirrada, haddii malaayiin sawir oo bisado iyo eeyo ah lagu calaamadeeyo “bisad” ama “ey,” algorithmyadu waxay baran karaan inay si lagu kalsoonaan karo u kala saaraan. Balse ka warran haddii halkii sawir kasta oo xayawaan guri ah lagu calaamadeyn lahaa dhalashada xayawaankaas? Maadaama maalmaha dhalashadu asal ahaan yihiin kuwo aan nidaam lahayn, hawshani mar walba khaladaad bay dhalin lahayd, si kasta oo algorithm-ku u horumarsan yahay.
Isla mabda’aas ayaa ka shaqeeya tababar-hore. Higgaadda iyo qawsyadu waxay raacaan qaabab joogto ah, sidaas darteed khaladaadka halkaas ka jira waxay baaba’aan marka la ballaariyo. Balse xaqiiqooyinka aan kala sooca lahayn ee soo noqnoqoshadoodu hooseyso, sida dhalashada xayawaan guri, lagama saadaalin karo qaabab oo keliya, sidaas darteedna waxay keenaan mala-awaal. Falanqaynteennu waxay sharxaysaa noocyada mala-awaalka ee ay tahay inay ka dhashaan saadaalinta erayga xiga. Sida habboon, marxaladaha dambe ee ka dambeeya tababar-hore waa inay meesha ka saaraan, balse tani si buuxda uma guulaysato sababo lagu sharaxay qaybtii hore.
Waxaan rajaynaynaa in aragtida tirakoobka ee warqaddeennu ay caddeyso dabeecadda mala-awaalka ayna dib uga riixdo faham-qaldan oo caadi ah:
- Sheegasho: Mala-awaallada waa la tirtiri doonaa marka saxnaanta la hagaajiyo sababtoo ah nooc 100% sax ah waligiis ma mala-awaalo.
Gunaanad: Saxnaantu waligeed ma gaari doonto 100% sababtoo ah, iyadoon loo eegin cabbirka nooca, awoodaha raadinta iyo caqliyeynta, su’aalaha qaar ee dunida dhabta ahi asal ahaan waa kuwo aan laga jawaabi karin. - Sheegasho: Mala-awaalladu waa lama huraan.
Gunaanad: Sidaas ma aha, sababtoo ah noocyada luqaddu way ka-gaabsan karaan marka ay hubin la’yihiin. - Sheegasho: Ka fogaanshaha mala-awaalka wuxuu u baahan yahay heer garaad oo kaliya lagu gaari karo noocyo waaweyn.
Gunaanad: Waxaa sahal badan u noqon karta nooc yar inuu ogaado xuduudihiisa. Tusaale ahaan, marka la weydiiyo inuu ka jawaabo su’aal af-Māori ah, nooc yar oo aan aqoon Māori lahayn si fudud ayuu u oran karaa “Ma garanayo” halka nooc wax yar ka yaqaan Māori ay tahay inuu go’aamiyo kalsoonidiisa. Sida lagu sheegay warqadda, in la ahaado “isu-dheellitiran” waxay u baahan tahay xisaabin aad uga yar tan lagu saxnaado. - Sheegasho: Mala-awaalladu waa cilad qarsoon oo ku jirta noocyada luqadda casriga ah.
Gunaanad: Waxaan fahamsanahay hababka tirakoobka ee ay mala-awaalladu uga dhashaan uguna helaan abaalmarin qiimaynta. - Sheegasho: Si loo cabbiro mala-awaalka, waxaan u baahan nahay oo keliya qiimayn wanaagsan oo mala-awaal ah.
Gunaanad: Qiimaynta mala-awaalka waa la daabacay. Hase yeeshee, qiimayn wanaagsan oo mala-awaal ahi saamayn yar bay leedahay marka loo eego boqolaal qiimayn dhaqameed oo ku salaysan saxnaan oo ciqaaba is-hoosaysiinta kana abaalmariya qiyaasidda. Halkii, dhammaan cabbirrada qiimaynta aasaasiga ah waa in dib loo habeeyaa si loo abaalmariyo muujinta hubanti-la’aanta.
Noocyadeennii ugu dambeeyay waxay leeyihiin heerar mala-awaal oo hooseeya, waxaana sii wadnaa inaan si adag uga shaqayno inaan sii yareyno heerarka khaladaadka kalsoonida leh ee ay soo saaraan noocyadeenna luqaddu.
Kaqeybgalayaasha ogeysiiska
Adam Kalai, Santosh Vempala (Georgia Tech), Ofir Nachum, Eddie Zhang, David Robinson, Saachi Jain, Eric Mitchell, Alex Beutel, Johannes Heidecke


