New AI classifier for indicating AI-written text

Laga bilaabo Luulyo 20, 2023, kala-soocaha AI mar dambe lama heli karo sababo la xiriira heerkiisa saxnaaneed ee hooseeya. Waxaan ka shaqaynaynaa inaan ku darno jawaab-celinta, waxaana hadda baadhaynaa farsamooyin il-raadis oo qoraalka ah oo ka waxtar badan, sidoo kalena waxaan go’aan ku gaarnay inaan horumarinno oo hirgelinno hannaano u sahlaya isticmaalayaasha inay fahmaan haddii maqal ama muuqaal ay AI-soo-saartay.
Waxaan tababarnay kala-sooce si uu u kala saaro qoraalka uu aadamigu qoray iyo qoraalka ay AIdo qoreen oo ka yimid adeeg-bixiyeyaal kala duwan. In kasta oo aanay suurtagal ahayn in si lagu kalsoonaan karo loo ogaado dhammaan qoraalka AI-qortay, waxaan rumaysanahay in kala-soocayaal wanaagsan ay gacan ka geysan karaan yaraynta sheegashooyinka khaldan ee ah in qoraal AI-soo-saartay uu bini’aadam qoray: tusaale ahaan, wadista ololayaal xog-khaldan oo iswada, isticmaalka agabka AI ee khiyaano waxbarasho, iyo u dhigista chatbot AI ah sidii qof bini’aadam ah.
Kala-soocahayagu si buuxda looguma kalsoonaan karo. Qiimaynteenna ku saabsan “challenge set” oo qoraallo Ingiriisi ah, kala-soocahayagu si sax ah ayuu u aqoonsadaa 26% qoraalka AI-qortay (true positives) inuu yahay “u badan tahay AI-qortay,” halka uu qoraalka dadku qoreen si khaldan ugu calaamadeeyo AI-qortay 9% wakhtiga (false positives). Kalsoonida kala-soocahayagu badanaa way sii fiicnaataa marka dhererka qoraalka gelintu kordho. Marka loo eego kala-soocihii aan hore u sii daynnay(ku furmaa daaqad cusub), kala-soocahan cusub si weyn ayuu uga kalsooni badan yahay qoraalka ka yimaadda nidaamyo AI oo ka cusub.
Waxaan kala-soocahan ka dhigaynaa mid dadweynuhu heli karo si aan jawaab-celin uga helno bal in agab aan qummanayn oo sidan oo kale ahi faa’iido leeyihiin iyo in kale. Shaqadayada ku saabsan ogaanshaha qoraalka AI-soo-saartay way sii socon doontaa, waxaana rajaynaynaa inaan mustaqbalka wadaagno habab ka sii wanaagsan.
Isku day kala-soocahayaga bilaashka ah ee weli socod-ku-jira adigu:
Kala-soocahayagu waxa uu leeyahay xaddidaado muhiim ah oo dhowr ah. Looma baahna in loo adeegsado aaladda koowaad ee go’aan-qaadashada, balse waa in loo adeegsadaa sidii kaabid habab kale oo lagu go’aamiyo halka uu qoraal ka yimid.
- Kala-soocuhu aad buu ugu kalsooni yar yahay qoraallada gaagaaban (ka hooseeya 1,000 xaraf). Xitaa qoraallada dhaadheer mararka qaarkood si khaldan ayuu u calaamadeeyaa kala-soocuhu.
- Mararka qaar qoraal uu aadami qoray ayaa si khaldan balse si kalsooni leh loogu calaamadeeyaa AI-qortay kala-soocahayaga.
- Waxaan ku talinaynaa in kala-soocaha loo isticmaalo oo keliya qoraalka Ingiriisiga ah. Waxqabadkiisu si weyn ayuu uga liitaa luqadaha kale, lagumana kalsoonaan karo koodhka.
- Qoraalka aad loo saadaalin karo si lagu kalsoonaan karo looma aqoonsan karo. Tusaale ahaan, suurtagal ma aha in la saadaaliyo in liiska 1,000-ka tirooyin asal ah ee ugu horreeya ay AI qortay ama dad qoreen, sababtoo ah jawaabta saxda ahi mar walba waa isku mid.
- Qoraalka AI-qortay waa la tafatiri karaa si uu uga baxsado kala-soocaha. Kala-soocayaal sida kan annaga oo kale ah waa la cusboonaysiin karaa oo dib ayaa loo tababari karaa iyadoo lagu salaynayo weerarrada guulaysta, balse ma cadda in ogaanshuhu faa’iido leeyahay muddada fog.
- Kala-soocayaasha ku salaysan shabakadaha neerfaha waxaa la ogyahay inay si liidata isugu dheellitiran yihiin meel ka baxsan xogtooda tababarka. Gelinno aad uga duwan qoraalka ku jira xog-ururintayada tababarka, kala-soocuhu mararka qaar si aad u badan ayuu ugu kalsoonaadaa saadaal khaldan.
Kala-soocahayagu waa nooc luqadeed si gaar ah loogu habeeyey xog-ururin ka kooban lammaanayaal qoraal uu aadami qoray iyo qoraal AI-qortay oo ku saabsan isla mowduuca. Waxaan xog-ururintan ka soo ururinnay ilo kala duwan oo aan rumaysanahay inay dad qoreen, sida xogta pretraining-ka iyo muujinno bini’aadmi oo ku saabsan weydiimo loo gudbiyey InstructGPT. Waxaan u qaybinay qoraal kasta weydiin iyo jawaab. Weydiimahan waxaan ka soo saarnay jawaabo ka yimid noocyo luqadeed kala duwan oo annaga iyo ururro kale tababareen. App-keenna webka, waxaan hagaajinnaa xadka kalsoonida si aan u hayno heerka false positive-ka mid hooseeya; si kale haddii loo dhigo, qoraalka waxaan u calaamadinnaa inuu u badan yahay AI-qortay oo keliya haddii kala-soocuhu aad ugu kalsoon yahay.
Waxaan garawsannahay in aqoonsiga qoraalka AI-qortay uu noqday qodob muhiim ah oo ay ka doodayaan barayaashu, sidoo kalena ay si la mid ah muhiim u tahay in la garwaaqsado xuduudaha iyo saamaynta kala-soocayaasha qoraalka AI-soo-saartay ee fasalka. Waxaan diyaarinay khayraad hordhac ah(ku furmaa daaqad cusub) oo ku saabsan adeegsiga ChatGPT ee barayaasha, kaas oo qeexaya qaar ka mid ah isticmaalka iyo xaddidaadaha iyo tixgelinnada la xiriira. Inkasta oo khayraadkani diiradda saarayo barayaasha, waxaan filaynaa in kala-soocahayaga iyo agabka la xiriira ee kala-soocayaashu ay saamayn ku yeelan doonaan suxufiyiinta, cilmi-baarayaasha xog-sax/xog-khaldan, iyo kooxo kale.
Waxaan la shaqaynaynaa barayaasha ku sugan Maraykanka si aan u baranno waxa ay ku arkayaan fasalladooda iyo si aan uga wada hadalno awoodaha iyo xaddidaadaha ChatGPT, waxaanan sii ballaadhin doonnaa gaarsiintayada inta aan wax baranayno. Kuwani waa wada-hadallo muhiim ah oo la yeelanayo maadaama qayb ka mid ah himiladeennu tahay in si ammaan ah loo hirgeliyo noocyada luqadeed ee waaweyn, annagoo xiriir toos ah la leh bulshooyinka ay arrintani saamaysay.
Haddii arrimahani si toos ah kuu saameeyaan (oo ay ku jiraan balse aan ku koobnayn macallimiin, maamulayaal, waalidiin, arday, iyo bixiyeyaasha adeegyada waxbarashada), fadlan na sii jawaab-celin adigoo adeegsanaya foomkan(ku furmaa daaqad cusub). Jawaab-celin toos ah oo ku saabsan khayraadka hordhaca ah(ku furmaa daaqad cusub) waa waxtar, sidoo kale waxaan soo dhowaynaynaa khayraad kasta oo ay barayaashu diyaarinayaan ama ay waxtar u arkeen (tusaale, hagayaasha koorsada, xeerka sharafta iyo cusboonaysiinta siyaasadaha, agab isdhexgal ah, barnaamijyada aqoonta AI).
Qorayaasha
Ka qayb-qaatayaal
Michael Lampe, Joanne Jang, Pamela Mishkin, Andrew Mayne, Henrique Ponde de Oliveira Pinto, Valerie Balcom, Michelle Pokrass, Jeff Belgum, Madelaine Boyd, Heather Schmidt, Sherwin Wu, Logan Kilpatrick, Thomas Degry


