Soo bandhigista wakiilka ChatGPT: isku xirka cilmi baarista iyo ficilka
ChatGPT hadda wuu fikirayaa oo wuu ficilayaa, isaga oo si firfircoon uga dooranaya qalab xirfado wakiilnimo leh si uu kuugu dhammaystiro hawlaha isagoo adeegsanaya kombiyuutarkiisa.
ChatGPT hadda wuxuu kuu qaban karaa shaqo isaga oo adeegsanaya kombiyuutarkiisa, kuna maareynaya hawlo adag bilow ilaa dhammaad.
Waxaad hadda ka codsan kartaa ChatGPT inuu qabto dalabyo sida “fiiri jadwalkayga oo iiga waran kulammada macaamiisha ee soo socda adigoo ku salaynaya wararkii dhowaa,” “qorshee oo soo iibso waxyaabaha lagu sameeyo quraac Jabaaniis ah oo afar qof ah,” iyo “falanqee saddex tartame oo samee bandhig slide ah.” ChatGPT wuxuu si caqli leh u dhex mari doonaa websaydhada, u shaandhayn doonaa natiijooyinka, ku weydiin doonaa inaad si ammaan ah u gasho marka loo baahdo, wuu socodsiin doonaa koodh, falanqayn buu samayn doonaa, xitaa wuxuu kuu soo gudbin doonaa bandhigyo slide iyo xaashiyo tifaftiran karo oo soo koobaya waxa uu helay.
Xudunta awooddan cusub waxaa ah nidaam wakiilnimo oo mideysan. Waxay isu keentaa saddex awoodood oo horumarro hore ah: awoodda Operator ee la falgalka websaydhada, xirfadda cilmi baarista qotada dheer ee isku-dubaridka macluumaadka, iyo garaadka ChatGPT iyo fudaydkiisa wada-sheekaysiga.
ChatGPT wuxuu u fuliyaa hawlahan isaga oo adeegsanaya kombiyuutarkiisa dalwadda ah, si dabacsan ugu kala wareegaya caqliyeynta iyo ficilka si uu u maareeyo qulqul-shaqooyin adag bilow ilaa dhammaad, dhammaantoodna ku salaysan tilmaamahaaga.
Tan ugu muhiimsan, adiga ayaa mar walba gacanta ku haya. ChatGPT wuxuu codsadaa oggolaansho ka hor inta uusan qaadin tallaabooyin cawaaqib leh, waxaadna si fudud u joojin kartaa, ula wareegi kartaa biraawsarka, ama u joojin kartaa hawlaha wakhti kasta.
Laga bilaabo maanta, isticmaaleyaasha Pro, Plus, iyo Team waxay si toos ah uga hawlgelin karaan awoodaha cusub ee wakiilnimo ee ChatGPT iyagoo ka maraya hoos-u-dhaca qalabka ee goobta farriinta, kuna dooranaya ‘agent mode’ wakhti kasta oo wada sheekaysi kasta ah.
Inkasta oo wakiilka ChatGPT uu durba yahay qalab awood leh oo lagu maareeyo hawlo adag, daahfurka maanta waa bilowga oo keliya. Waxaan sii wadi doonnaa inaan si joogto ah ugu darno horumarinno muhiim ah, annagoo ka dhigeyna mid ka awood badan oo faa’iido u leh dad badan muddo ka dib.
Hore, Operator iyo cilmi baarista qotada dheer mid kastaa wuxuu lahaa awoodo u gaar ah: Operator wuxuu ku duubi karay, ku gujin karay, kuna qori karay webka, halka cilmi baarista qotada dheer ay ku fiicnayd falanqaynta iyo soo koobidda macluumaadka. Laakiin waxay si fiican uga shaqayn jireen xaalado kala duwan: Operator ma geli karin falanqayn qoto dheer ama ma qori karin warbixino faahfaahsan, cilmi baarista qotada dheerna lama falgeli karin websaydhada si ay natiijooyinka u sii saxdo ama u gasho waxyaabo u baahan xaqiijin isticmaale. Xaqiiqdii, waxaan aragnay in su’aalo badan oo isticmaalayaashu ku tijaabiyeen Operator ay dhab ahaan ku habboonaayeen cilmi baarista qotada dheer, sidaas darteed waxaan isu keenay kuwii ugu fiicnaa ee labadaba.
Annagoo awoodahan is-dhammaystiraya ku dhex darnay ChatGPT oo soo bandhignay qalabyo dheeraad ah, waxaan furnay awoodo gebi ahaanba cusub oo ku jira hal nooc. Hadda wuxuu si firfircoon ula falgeli karaa websaydhada—wuxuu gujin karaa, shaandhayn karaa, oo ururin karaa natiijooyin ka saxan oo hufan. Waxa kale oo aad si dabiici ah uga gudbi kartaa wada sheekaysi fudud una gudbi kartaa codsashada ficillo si toos ah isla sheekadaas gudaheeda.
Waxaan ku qalabaynay wakiilka ChatGPT xirmo qalabyo ah: biraawsar muuqaal ah oo webka kula falgala iyada oo loo marayo garaafik-isticmaale, biraawsar qoraal ku salaysan oo loogu talagalay su’aalaha webka ee fudud ee ku salaysan caqliyeynta, terminal, iyo marin API oo toos ah. Wakiilku wuxuu sidoo kale ka faa’iidaysan karaa xirayaasha ChatGPT(ku furmaa daaqad cusub), kuwaas oo kuu oggolaanaya inaad ku xirto abka sida Gmail iyo Github si ChatGPT uu u helo macluumaad la xiriira weydiimahaaga uguna isticmaalo jawaabihiisa. Waxa kale oo aad geli kartaa websaydh kasta adigoo la wareegaya biraawsarka, taas oo u oggolaanaysa inuu si qoto dheer oo ballaaran ugu shaqeeyo cilmi baaristiisa iyo fulinta hawshiisa. In ChatGPT la siiyo waddooyinkan kala duwan ee uu ku heli karo uguna falgeli karo macluumaadka webka waxay ka dhigan tahay inuu dooran karo jidka ugu habboon si uu hawlaha ugu qabto si hufan. Tusaale ahaan, wuxuu xogta jadwalkaaga uga ururin karaa API, si hufan ugu caqliyeyn karaa tiro badan oo qoraal ah isaga oo adeegsanaya biraawsarka qoraalka ku salaysan, isla mar ahaantaana awood u leh inuu muuqaal ahaan ula falgalo websaydhada inta badan loogu talagalay dadka.
Dhammaan tan waxaa lagu sameeyaa isaga oo adeegsanaya kombiyuutarkiisa dalwadda ah, kaas oo xafida macnaha guud ee lagama maarmaanka u ah hawsha, xitaa marka qalabyo badan la adeegsado—noocku wuxuu dooran karaa inuu bog ku furo biraawsarka qoraalka ama kan muuqaalka, ka soo dejiyo fayl webka, ku maamulo isagoo ammar ku socodsiinaya terminal-ka, kadibna mar kale natiijada ugu eego biraawsarka muuqaalka. Noocku wuxuu la qabsanayaa habkiisa si uu hawlaha ugu fuliyo xawaare, saxnaan, iyo hufnaan.
Wakiilka ChatGPT waxaa loo naqshadeeyay qulqul-shaqooyin soo noqnoqda oo iskaashi leh, isagoo aad uga isdhexgal badan ugana dabacsan noocyadii hore. Marka ChatGPT shaqaynayo, waxaad joojin kartaa wakhti kasta si aad u caddeyso tilmaamahaaga, ugu leexiso natiijooyinka aad rabto, ama hawsha gebi ahaanba u beddesho. Wuxuu ka sii wadi doonaa halkii uu ka joogsaday, haddana wata macluumaadka cusub, balse aan luminayn horumarkii hore. Sidoo kale, ChatGPT laftiisu wuxuu si firfircoon kaaga raadin karaa faahfaahin dheeraad ah marka loo baahdo si loo hubiyo in hawshu wali la jaanqaaddo yoolalkaaga. Haddii hawl ay qaadato waqti ka badan intii la filayay ama ay u muuqato inay ku dheggan tahay, waad hakinin kartaa, ka codsan kartaa soo koobid horumar, ama gebi ahaanba joojin kartaa oo aad heli kartaa natiijooyin qayb ah. Haddii aad taleefankaaga ku haysato abka ChatGPT, wuxuu kuu soo diri doonaa ogeysiis marka uu hawshaada dhammaystiro.
Awoodahan wakiilnimo ee mideysan waxay si weyn u kordhiyaan faa’iidada ChatGPT ee duruufaha maalinlaha ah iyo kuwa xirfadeedba. Shaqada, waxaad otomaatig ka dhigi kartaa hawlo soo noqnoqda, sida u beddelidda screenshots ama dashboards bandhigyo ka kooban xubno vector ah oo la tafatiri karo, dib-u-habeynta kulamada, qorshaynta iyo qabashada offsites, iyo cusboonaysiinta xaashiyaha xisaabaadka xog maaliyadeed cusub iyadoo la ilaalinayo qaabeyntii hore. Noloshaada gaarka ah, waxaad u adeegsan kartaa si fudud qorshaynta iyo qabashada safarro, diyaarinta iyo qabashada xaflado casho oo dhan, ama raadinta khabiiro iyo jadwaleynta ballamo.
Awoodaha sare ee noocka waxaa ka tarjumaya waxqabadkiisa heerka ugu sarreeya (SOTA) ee qiimeynaha cabbira awoodaha daalacashada webka iyo dhammaystirka hawlaha nolosha dhabta ah.
Marka laga eego Humanity’s Last Exam(ku furmaa daaqad cusub)*, qiimeyn cabbiraysa waxqabadka AI ee maaddooyin badan oo kala duwan iyadoo la adeegsanayo su’aalo heer khubaro ah, nooca awoodda siiya wakiilka ChatGPT wuxuu gaarayaa pass@1 SOTA cusub oo ah 41.6. Sababtoo ah wakiilku si firfircoon ayuu u qorsheeyaa oo wuxuu doortaa qalabkiisa, wuxuu hal hawl u wajihi karaa siyaabo kala duwan marka la ordo marar kala duwan. Markii aan tan ku ballaadhinnay istaraatiijiyad sahlan oo isbarbar-socod ah—annagoo hal mar wada socodsiinayna ilaa siddeed isku day oo ka dibna dooranayna midka leh kalsoonida ugu sarreysa ee uu isagu sheegtay—dhibcaha HLE ee wakiilku waxay kor ugu kacaan 44.4.
FrontierMath** waa bartilmaameedka xisaabeed ee ugu adag ee la yaqaan, oo leh dhibaatooyin cusub oo aan la daabicin kuwaas oo inta badan ku qaata saacado ama xitaa maalmo xisaabyahannada khibradda leh inay xalliyaan. Adeegsiga qalabka, sida helitaanka terminal loogu socodsiiyo koodhka, wakiilka ChatGPT wuxuu gaarayaa saxnaan 27.4%, isagoo si weyn uga sarreeya labada nooc ee hore.
Waxaan sidoo kale ku qiimeynay noocka bartilmaameedyo lagu dayday hawlo adag oo nolosha dhabta ah. Bartilmaameed gudaha ah oo loogu talagalay in lagu qiimeeyo waxqabadka noocka ee hawlaha aqooneed ee adag ee dhaqaale ahaan qiimo leh, wax-soo-saarka wakiilka ChatGPT wuxuu la mid yahay ama ka fiican yahay kan dadka ku dhowaad kala bar kiisaska, iyada oo la eegayo waqtiyo kala duwan oo dhammaystirka hawsha ah, halka uu si weyn uga sarreeyo o3 iyo o4-mini. Wax-soo-saarka noocka waxaa qiimeeya khubaro iyagoo barbar dhiga saldhigyo bini’aadan oo tayo sare leh oo ay diyaariyeen dadka ugu waxqabadka fiican goob kasta. Hawlahan, oo laga soo ururiyay khubaro ka kala socda shaqooyin iyo warshado kala duwan, waxay u egyihiin shaqo xirfadeed oo nolosha dhabta ah—sida diyaarinta falanqayn tartan oo ku saabsan bixiyeyaasha daryeel degdeg ah ee dalabka ku yimaada, dhisidda jadwal amortization faahfaahsan, iyo aqoonsiga ceelal biyo oo macquul ah oo loogu talagalay xarun cusub oo hydrogen cagaaran ah.
Marka laga eego DSBench(ku furmaa daaqad cusub), oo loo sameeyay in lagu qiimeeyo wakiillada hawlo cilmi-baaris xogeed oo dhab ah oo daboolaya falanqaynta xogta iyo qaabaynta, wakiilka ChatGPT si muuqata ayuu uga sarreeyaa waxqabadka aadanaha farqi weyn.
Marka laga eego SpreadsheetBench, oo qiimeeya noocyada awooddooda tafatirka xaashiyaha xisaabta ee ka yimid xaalado nolosha dhabta ah, wakiilka ChatGPT wuxuu si weyn uga sarreeyaa noocyada jira. Marka la siiyo awood uu si toos ah ugu tafatiro xaashiyaha, wakiilka ChatGPT wuxuu helaa dhibco ka sii sarreeya oo ah 45.5%, marka loo eego 20.0% ee Copilot in Excel.
Habraaca: Qorayaasha SpreadsheetBench waxay adeegsadeen deegaan Windows ah oo wata Microsoft Excel si ay u qiimeeyaan xaashiyaha. Annagu waxaan adeegsanay deegaan OSX ah iyo LibreOffice, taas oo keeni karta kala duwanaansho yar oo qiimeyn ah. Tusaale ahaan, qorayaashu waxay heleen Overall Hard restriction oo ah 15.02% ee GPT‑4o, annaguna waxaan helnay 13.38%. Waxaan adeegsanay bartilmaameedka dhammaystiran ee 912 su’aalood.
Bartilmaameed gudaha ah oo cabbira awoodda noocka ee uu ku qaban karo hawlaha qaabaynta ee falanqeeyaha bangiyada maalgashiga ee sannadka koowaad ilaa saddexaad —sida isu-geynta nooc maaliyadeed saddex-bayaan ah oo shirkad Fortune 500 ah leh qaabeyn iyo xigashooyin sax ah, ama dhisidda nooc leveraged buyout ah oo loogu talagalay take-private—nooca awoodda siiya wakiilka ChatGPT si weyn ayuu uga sarreeyaa cilmi baarista qotada dheer iyo o3. Hawl kasta waxaa lagu qiimeeyaa boqolaal shuruudood oo la xiriira saxnaanta iyo adeegsiga qaacidooyinka.
Waxaan sidoo kale ku qiimeynay wakiilka ChatGPT BrowseComp, oo ah bartilmaameed aan horraantii sannadkan daabacnay kaas oo cabbira awoodda wakiillada daalacashada ee helitaanka macluumaad adag in laga helo webka. Noocku wuxuu dhigay SOTA cusub oo ah 68.9%, taas oo 17.4 dhibcood boqolkiiba ka sarreysa cilmi baarista qotada dheer.
Ugu dambayn, marka laga eego WebArena(ku furmaa daaqad cusub), oo ah bartilmaameed loogu talagalay in lagu qiimeeyo waxqabadka wakiillada daalacashada webka ee dhammaystirka hawlaha webka ee nolosha dhabta ah, noocku wuxuu ka fiican yahay CUA (Wakiilka Isticmaalka Kombiyuutarka) ee ku shaqeeya o3 (nooca awoodda siiya Operator).
Waxaad si toos ah uga hawlgelin kartaa awoodaha cusub ee wakiilnimo ee ChatGPT adiga oo ka maraya hoos-u-dhaca qalabka ee goobta farriinta, kuna dooranaya ‘agent mode’ wakhti kasta oo wada sheekaysi kasta ah. Si fudud u sharax hawsha aad rabto—ha noqoto samaynta cilmi baaris qotada dheer, abuurista bandhig slide ah, ama gudbinta kharashaad. Inta uu fulinayo hawshaada, sheeko-sharraxaad ka muuqata shaashadda ayaa ku tusaysa waxa saxda ah ee ChatGPT samaynayo. Waad joojin kartaa oo waad la wareegi kartaa biraawsarka mar kasta oo loo baahdo, si loo hubiyo in hawluhu la jaanqaadaan yoolalkaaga.
Wakiilka ChatGPT wuxuu geli karaa xirayaashaada, taas oo u oggolaanaysa inuu la midoobo qulqul-shaqooyinkaaga oo uu helo macluumaad khuseeya oo ficil lagu qaadi karo. Marka xaqiijin la sameeyo, xirayaashani waxay u oggolaanayaan ChatGPT inuu arko macluumaad oo uu sameeyo waxyaabo sida inuu kuu soo koobo sanduuqaaga maalintaas ama helo waqtiyo aad bannaan tahay kulan—si kastaba, si uu ficil uga qaado goobahan, weli waxaa lagu weydiin doonaa inaad gasho adiga oo la wareegaya biraawsarka.
Intaa waxaa dheer, waxaad jadwalayn kartaa hawlaha la dhammaystiray inay si toos ah u soo noqnoqdaan, sida samaynta warbixin cabbirro toddobaadle ah subax kasta oo Isniin ah.
Daahfurkani wuxuu calaamadeynayaa markii ugu horreysay ee isticmaalayaashu ka codsan karaan ChatGPT inuu ficillo ka sameeyo webka. Tani waxay soo kordhinaysaa khataro cusub, gaar ahaan sababta oo ah wakiilka ChatGPT wuxuu si toos ah ula shaqayn karaa xogtaada, ha noqoto macluumaad laga helay xirayaasha ama websaydhada aad ku gelisay takeover mode. Waxaan xoojinay xakamayntii adkayd ee ka timid hordhaca cilmi-baarista Operator waxaanan ku darnay ilaalinno la xiriira caqabadaha sida maaraynta macluumaad xasaasi ah oo ku jira webka tooska ah, gaarsiinta isticmaale ee ballaaran, iyo marin shabakad terminal oo (xaddidan). Inkasta oo yareyntani si weyn u dhimayso khatarta, qalabka la ballaariyay ee wakiilka ChatGPT iyo gaarsiinta isticmaale ee ka weyn waxay ka dhigan tahay in guud ahaan muuqaalkiisa khatartu ka sarreeyo.
Waxaan si gaar ah diiradda u saarnay ilaalinta wakiilka ChatGPT ee ka dhanka ah faragelinta xaasidnimada leh ee loo maro prompt injection, taas oo guud ahaan khatar u ah nidaamyada wakiilnimada, waxaana si waafaqsan u diyaarinay yareyn ballaaran. Weerarka weydiinta waa isku dayo ay cid saddexaad ku maamulayso hab-dhaqankiisa iyada oo loo marayo tilmaamo xunxun oo wakiilka ChatGPT uu kala kulmi karo webka inta uu hawl fulinayo. Tusaale ahaan, weydiin xun oo lagu qariyay bog web, sida xubno aan muuqan ama metadata, ayaa khiyaami karta wakiilka si uu u qaado ficillo aan la doonayn, sida inuu la wadaago xog gaar ah oo ka timid xire weeraryahanka, ama inuu ficil waxyeello leh ka sameeyo goob uu isticmaaluhu galay. Sababtoo ah wakiilka ChatGPT wuxuu qaadi karaa ficillo toos ah, weerarrada guulaysta waxay yeelan karaan saameyn weyn oo waxay keenaan khataro ka sarreeya.
Waxaan tababarnay oo tijaabinay wakiilka si uu u garto ugana hortago weerarka weydiinta, marka lagu daro isticmaalka kormeer si si degdeg ah loo ogaado loogana jawaabo weerarrada weydiinta. Ku qasbidda xaqiijin cad oo isticmaale ka hor ficillada cawaaqibka leh waxay sii yaraynaysaa khatarta waxyeellada ee weerarradan, isticmaalayaashuna way soo faragelin karaan hawlaha marka loo baahdo iyagoo la wareegaya ama hakad gelinaya. Isticmaalayaashu waa inay miisaamaan isweydaarsiyadan marka ay go’aansanayaan macluumaadka ay siinayaan wakiilka, sidoo kalena qaadaan tallaabooyin ay ku yareynayaan la kulankooda khatarahan, sida daminta xirayaasha marka aan loogu baahnayn hawl.
Waxaan sidoo kale hirgelinay yareyn la xiriirta khaladaadka noocka, gaar ahaan maaddaama noocku hadda qaban karo hawlo saameeya dunida dhabta ah:
- Xaqiijin cad oo isticmaale: ChatGPT waxaa loo tababaray inuu si cad kuu waydiiyo oggolaanshahaaga ka hor inta uusan qaadin ficillo leh cawaaqib nolosha dhabta ah, sida wax iibsi.
- Kormeer firfircoon (“Watch Mode”): Hawlo muhiim ah qaarkood, sida dirista iimayllo, waxay u baahan yihiin kormeerkaaga firfircoon.
- Yareyn khatar oo firfircoon: ChatGPT waxaa loo tababaray inuu si firfircoon u diido hawlo khatar sare leh sida wareejinta bangiga.
Ugu dambayn, waxaan soo bandhignay xakamaynno dheeraad ah si loo xaddido xogta uu noocku heli karo:
- Xakamaynta asturnaanta: Hal gujin oo ku jirta dejimaha ChatGPT, waxaad ku tirtiri kartaa dhammaan xogta daalacashada oo aad isla markiiba uga bixi kartaa dhammaan fadhiyada firfircoon ee websaydhada. Haddii kale, cookies-ku way sii jiraan iyagoo ku salaysan siyaasadaha cookie ee goob kasta oo la booqday, taas oo ka dhigi karta booqashooyinka soo noqnoqda kuwo ka hufan.
- Qaabka la wareegidda biraawsarka ee ammaan ah: Markaad webka kula falgasho biraawsarka ChatGPT (“takeover mode”), gelintaadu waa kuwo gaar ah. ChatGPT ma ururiyo mana kaydiyo wax xog ah oo aad geliso inta lagu jiro fadhiyadan, sida ereyada sirta ah, sababtoo ah noocku uma baahna, waana ka ammaan badan tahay haddii uusan waligiis arag.
Iyada oo awoodaha noocku kordheen, waxaan go’aansannay inaan ula dhaqanno wakiilka ChatGPT sidii awood sare oo bayooloji iyo kiimiko ah sida ku cad Qaab-dhismeedka Diyaar-garowga againnna, annagoo hawlgelinayna ilaalinnada la xiriira. Inkasta oo aynaan haysan caddeyn sugan oo muujinaysa in noocku si macno leh uga caawin karo qof bilow ah inuu abuuro waxyeello bayooloji oo daran—taas oo ah heerkeena awood sare—waxaan muujinaynaa taxaddar oo hadda hirgelinayna ilaalinnada loo baahan yahay. Sidaas darteed, noocan wuxuu leeyahay xidhmadii badbaado ee ugu dhammaystirnayd ilaa hadda oo leh ilaalinno la xoojiyay oo dhanka bayoolojiga ah: qaabaynta khatarta oo dhammaystiran, tababar diidmo oo dual-use ah, kala-soocayaal iyo kormeerayaal caqliyeyn oo mar walba shidan, iyo dhuumo fulin oo cad.
Marka laga soo tago shaqadayada lagu ammaan gelinayo wakiilka ChatGPT, waxaan ognahay in biosafety-ga lakabyaysan uu ugu fiican yahay marka ilaalinnadu ka baxsan yihiin hal shaybaar oo keliya, sidaas darteed waxaan iskaashi la sameynaa nidaamka oo dhan si loo xoojiyo difaacyada. Laga soo bilaabo maalintii koowaad waxaan la shaqaynaynay khubaro dibadeed oo biosecurity ah, machadyo badbaado, iyo cilmi-baarayaal jaamacadeed si ay u qaabeeyaan nooca khatarta, qiimeynta, iyo siyaasadaha. Dib-u-eegayaal ku tababaran bayooloji ayaa xaqiijiyay xogta qiimeyntayada, khubaro domain ah oo red team ahna waxay tijaabiyeen ilaalinnada xaalado dhab ah. Horaantii bishan waxaan qabannay aqoon-is-weydaarsi Biodefense ah oo ay la yeesheen khubaro ka socota dowladda, jaamacadaha, shaybaarrada qaranka, iyo NGO-yada si loo dedejiyo iskaashiga loona hormariyo cilmi-baarista biodefense ee ay awood siiso AI. Waxaan sii wadi doonnaa iskaashi caalami ah si aan uga hormarno khataraha soo baxaya.
Ka akhri wax badan oo ku saabsan habkeenna adag ee badbaadada ee nooca wakiilnimada mideysan ee ku jira kaarka siistamka. Waxaan sidoo kale daahfureynaa barnaamij bug bounty ah si aan u helno una sixi karno khataraha nolosha dhabta ah.
Wakiilka ChatGPT wuxuu bilaabayaa in maanta loo daahfuro Pro, Plus, iyo Team; Pro wuxuu heli doonaa gelitaan ka hor dhammaadka maalinta, halka isticmaaleyaasha Plus iyo Team ay heli doonaan gelitaan maalmaha soo socda. Isticmaaleyaasha Enterprise iyo Education waxay heli doonaan gelitaan toddobaadyada soo socda. Isticmaaleyaasha Pro waxay helaan 400 farriimood bishii, halka isticmaaleyaasha kale ee lacag bixiya ay helaan 40 farriimood bishii, iyadoo isticmaal dheeraad ahna lagu heli karo xulashooyin dabacsan oo ku salaysan credit.
Weli waxaan ka shaqaynaynaa suurtagelinta gelitaanka Aagga Dhaqaalaha Yurub iyo Switzerland.
Goobta hordhaca cilmi-baarista Operator waxay sii shaqayn doontaa dhowr toddobaad oo kale, ka dibna waa la joojin doonaa. Cilmi baarista qotada dheer waa qayb ka mid ah awoodaha wakiilka ChatGPT. Haddii aad doorbidayso astaanta asalka ah ee cilmi baarista qotada dheer—taas oo socodsiinteedu waqti dheeraad ah qaadan karto balse si caadi ah u bixisa jawaabo faahfaahsan oo qoto dheer—wali waad geli kartaa adigoo ka dooranaya “deep research” liiska hoos-u-dhaca ee goobta farriinta.
Wakiilka ChatGPT weli wuxuu ku jiraa marxaladihiisii hore. Wuxuu awood u leeyahay inuu qabto hawlo adag oo kala duwan, laakiin wali wuu khaldami karaa.
Inkasta oo aan aragno awood weyn oo ku jirta kartidiisa samaynta bandhigyada slide-ka, shaqadani hadda waxay ku jirtaa beta. Waqtigan xaadirka ah, wax-soo-saarku mararka qaarkood wuxuu dareen ahaan noqon karaa mid aasaasi ah marka la eego qaabeynta iyo dhammaystirka, gaar ahaan marka laga bilaabayo iyada oo aan jirin dukumenti hore. Waxaan diiradda saarnay awoodaha bilowga ah ee noocka abuurista agab si nidaamsan u abaabula macluumaadka oo leh socod iyo qaab ku habboon bandhigyada, oo wata xubno sida qoraal, jaantusyo, sawirro, iyo qaabab si asal ahaan ah oo fudud loo tafatiri karo marka la dhoofiyo, annagoo hagaajinayna qaab-dhismeedka iyo dabacsanaanta. Hadda, sidoo kale waxaa jira mararka qaarkood kala duwanaansho u dhexeeya slides-ka ku jira daawadayaasha iyo powerpoint-ka la dhoofiyay oo aan ka shaqaynayno yareyntiisa. Intaa waxaa dheer, in kasta oo aad hadda soo gelin karto xaashi jirta si ChatGPT u tafatiro ama ugu adeegsado qaab ahaan, awooddan wali looma hayo bandhigyada slide-ka. Durba waxaan tababaraynaa nooca xiga ee abuurista slideshow-ga ChatGPT si uu u soo saaro wax-soo-saar aad u dhammaystiran oo casri ah, leh awoodo ballaaran iyo qaabeyn la hagaajiyay.
Guud ahaan, waxaan filaynaa horumar joogto ah oo ku yimaada hufnaanta, qoto dheerida, iyo kala-duwanaanshaha wakiilka ChatGPT muddo ka dib, oo ay ku jiraan isdhexgallo ka sii siman maadaama aan sii wadno hagaajinta heerka kormeerka looga baahan yahay isticmaalaha si uu uga sii faa’iido badnaado iyadoo la hubinayo inuu ammaan yahay in la isticmaalo.
SpreadsheetBench | ||||
Nooc | Deegaanka qiimeynta | Xaddidaad jilicsan (%): Heer unug | Xaddidaad jilicsan (%): Heer xaashi | Xaddidaad jilicsan (%): Guud ahaan |
GPT‑4o | Windows, Excel | 15.03 | 23.65 | 18.35 |
Copilot in Excel | Windows, Excel | 23.33 | 15.00 | 20.00 |
GPT‑4o | OSX, LibreOffice | 15.86 | 18.33 | 16.81 |
OpenAI o3 | OSX, LibreOffice | 22.40 | 24.60 | 23.25 |
ChatGPT agent | OSX, LibreOffice | 38.27 | 30.48 | 35.27 |
ChatGPT agent with .xlsx | OSX, LibreOffice | 50.56 | 37.51 | 45.54 |
Aadanaha | 75.56 | 65.00 | 71.33 |
Qoraa
Qoraallada hoose
* Marka la suurtageliyo daalacashada, noocku mararka qaarkood wuxuu internetka ka heli karaa jawaabaha saxda ah, tusaale ahaan, isagoo akhrinaya blog-yo leh tusaalooyin dhibaatooyin ka yimid dataset. Waxaan yareynaa walaacyada ku saabsan khiyaanada noocka marka uu daalacanayo annagoo adeegsanayna laba istaraatiijiyadood:
1. Domains la xannibay oo aan ku aragnay noocka isagoo ka khiyaanaynaya hore.
2. Waxaan adeegsannay nooc dheeraad ah oo ah kormeere si uu u eego dhammaan output token-yada qalabka ee isku day kasta si loo aqoonsado dabeecad shaki leh. Dabeecadda shakiga leh waxaa lagu qeexaa "bog, fayl, ama snippet ujeeddadiisa ugu weyn ay tahay inuu bixiyo jawaabta saxda ah ee su’aashan gaarka ah—tusaale ahaan, furaha qiimeynta rasmiga ah, gist “solutions” oo la faafiyay, ama dood soo xiganaysa jawaabta la dhammeeyay eray-eray." Dabeecadda aan dhibta lahayn waxaa lagu qeexaa "Khayraad kasta oo la isku hallayn karo oo qof dadaal badan sameeya uu la tashan karo (dukumenti, buugaag tilmaameed, waraaqo cilmiyeed, maqaallo sumcad leh) xitaa haddii uu si lama filaan ah u hayo jawaabta saxda ah." Isku day kasta oo kormeeruhu u arko rollout-ka shaki leh waxaa loo tiriyaa khalad. Inta badan muunadaha ku dhacay hubintan waxay ahaayeen dhibaatooyin ay xalalkooda saxda ah ka yaalleen ilo badan oo internetka ah oo aan la xiriirin HLE.
**OpenAI waxay marin gaar ah u leedahay 237 ka mid ah 290 su’aalood oo gaar ah oo ku jira dataset-ka Tier 1-3. Su’aalaha FrontierMath tier 4 laguma darin qiimeyntan. Natiijooyinka waxaa loo qiimeeyay sida celceliska 16 isku day oo lagu jawaabayo su’aal kasta. Natiijooyinka wakiilka ChatGPT waxaa soo saaray OpenAI, waxaa qiimeeyay Epoch AI, iyadoo la haysto biraawsar iyo marin terminal, iyo xaddid ah 128K token jawaab kasta. Qiimeynaha OpenAI o4-mini iyo o3 waxaa soo saaray oo qiimeeyay Epoch AI, iyadoo aan la hayn biraawsar iyo marin terminal, iyadoo la adeegsanayo python scripts iyada oo loo marayo xusida function-ka, iyo xaddid ah 100K token jawaab kasta.
*** Oracle@64 waxay tixraacdaa dhibcaha ugu fiican ee laga gaaray 64 socod oo muunad ah, oo lagu doortay iyadoo la adeegsanayo ground truth (taas oo ah, waxaan doorannaa isku dayga dhibcaha ugu sarreeya hawl kasta iyadoo lagu salaynayo waxqabadka dhabta ah ee la qiimeeyay). Waxaan soo sheegnaa celceliska dhibcahan ugu fiican ee hawl kasta marka la eego dhammaan hawlaha. Cabbirkani wuxuu muujinayaa awoodda ugu sarreysa ee noocka iyo kala duwanaanshaha waxqabadka hawsha—wuxuu tusayaa sida noocku u awood badnaan karo marka uu guulaysto iyo inuu tilmaamo meel lagu horumarin karo joogtaynta iyadoo la sii tababarayo. Si ka duwan cabbirrada caadiga ah ee “best of N”, kuwaas oo ku xusha kalsoonida noocka, oracle@64 waxay u isticmaashaa ground truth xulashada waxayna khusaysaa hawlo lagu qiimeeyo miisaan joogto ah oo 0–1 ah halkii ay ka ahaan lahaayeen guul/khasaaro laba-geesood ah.


