Aqbeż għall-kontenut prinċipali
OpenAI

Government of Iceland

Iceland Scenery
Qed jillowdja…
Ritratt ta’ karozza ssuq tul triq dejqa mdawra bl-ilma miż-żewġ naħat, b’muntanji miksija bis-silġ jispikkaw fl-isfond taħt sema ċar.

L-Iżlanda, nazzjon gżira fin-nofs tal-Atlantiku tat-Tramuntana, għandha industrija tat-teknoloġija vibranti u turiżmu li qed jikber b’rata mgħaġġla. Madankollu, filwaqt li ħafna miċ-ċittadini tagħha, madwar 370,000, jitkellmu bl-Ingliż jew b’lingwa oħra bħala t-tieni lingwa, l-integrazzjoni tagħha mal-Istati Uniti u mal-Ewropa poġġiet il-lingwa nattiva tal-pajjiż, l-Iżlandiż, f’riskju. Illum hemm tħassib dejjem jikber li fi ftit ġenerazzjonijiet, jekk l-Iżlandiż ma jistax jibqa’ l-lingwa awtomatika tal-pajjiż quddiem id-diġitalizzazzjoni mgħaġġla, il-lingwa tista’ tiffaċċja estinzjoni de facto(jinfetaħ f’tieqa ġdida).

L-Iżlandiżi jgħożżu l-lingwa tagħhom għall-wirt kulturali rikk tagħha u r-rabta tagħha mal-identità tan-nazzjon. Il-gvern tal-pajjiż iżomm Dipartiment tal-Ippjanar tal-Lingwa(jinfetaħ f’tieqa ġdida) li joħloq termini Iżlandiżi għal ideat ġodda, minflok ma jadotta l-hekk imsejjaħ “self ta’ kliem” minn lingwi oħra. Kompjuter, pereżempju, huwa tölva (“profetessa tan-numri”). Permezz ta’ dawn l-isforzi, il-lingwa tippreserva l-karattru distintiv tagħha(jinfetaħ f’tieqa ġdida) u tibqa’ marbuta mill-qrib mal-għeruq tagħha tan-Norveġiż l-Antik.

Fuq l-inizjattiva(jinfetaħ f’tieqa ġdida) tal-President tal-pajjiż, Eċċ. Guðni Th. Jóhannesson, u bl-għajnuna tal-industrija privata, l-Iżlanda ssieħbet ma’ OpenAI biex tuża GPT‑4 fl-isforz għall-preservazzjoni tal-lingwa Iżlandiża—u biex tibdel pożizzjoni difensiva f’opportunità għall-innovazzjoni.

Is-sħubija ġiet maħsuba mhux biss bħala mod biex tissaħħaħ il-kapaċità ta’ GPT‑4 li sservi rokna ġdida tad-dinja, iżda wkoll bħala pass lejn il-ħolqien ta’ riżorsi li jistgħu jservu biex jippromwovu l-preservazzjoni ta’ lingwi oħra b’inqas riżorsi.

“Is-sħubija ġiet maħsuba mhux biss bħala mod biex tissaħħaħ il-kapaċità ta’ GPT-4 li sservi rokna ġdida tad-dinja, iżda wkoll bħala pass lejn il-ħolqien ta’ riżorsi li jistgħu jservu biex jippromwovu l-preservazzjoni ta’ lingwi oħra b’inqas riżorsi.”

“Irridu niżguraw li l-intelliġenza artifiċjali tintuża mhux biss biex tgħin tippreserva l-lingwa, il-kultura u l-istorja, iżda wkoll biex issostni l-prosperità ekonomika,” tgħid Jóhanna Vigdís Guðmundsdóttir, kap eżekuttiv ta’ Almannarómur(jinfetaħ f’tieqa ġdida), ċentru mingħajr skop ta’ qligħ għat-teknoloġija tal-lingwa. “L-Iżlandiż huwa każ kemxejn partikolari,” tammetti, “iżda rajna opportunità biex insiru pijunieri għal lingwi oħra long-tail, ngħinu noħolqu kundizzjonijiet indaqs, u nevitaw ‘firda tal-IA’. Mhuwiex biżżejjed li niġbru d-data u nibnu s-softwer lokalment għall-Iżlandiż; irridu ndaħħlu l-lingwa tagħna fis-softwer u fl-applikazzjonijiet li n-nies jużaw kuljum.”

Il-mudelli GPT ta’ OpenAI huma mħarrġa fuq kwantitajiet enormi ta’ test fuq l-internet. Għaldaqstant, il-biċċa l-kbira tas-sett tat-taħriġ tal-mudell huwa bl-Ingliż u b’lingwi ewlenin oħra, li jfisser li GPT m’għandux l-istess kapaċitajiet jew wisa’ ta’ fehim f’lingwi iżgħar. Il-mudelli tjiebu maż-żmien, iżda ma jipproduċux b’mod konsistenti traduzzjonijiet Iżlandiżi ċari u korretti.

Stjorn Almannaroms

The board of Almannarómur.

Mill-Ingliż għall-Iżlandiż

PromptHvað heitir Donald Duck á íslensku?Kif jissejjaħ Donald Duck bl-Iżlandiż?

GPT‑3 completionDonald Duck heitir á íslensku Donaldi KjániDonald Duck jissejjaħ bl-Iżlandiż Donaldi l-IdjotaMhux korrett

ChatGPT completionDonald Duck heitir sama nafni á íslensku og enskuDonald Duck għandu l-istess isem bl-Iżlandiż u bl-IngliżMhux korrett

GPT‑4 completionDonald Duck heitir Andrés Önd á íslenskuDonald Duck jissejjaħ Andrés Önd bl-IżlandiżKorrett

Anke GPT‑4, għalkemm ħafna aħjar fl-Iżlandiż minn GPT‑3.5, jipproduċi Iżlandiż bi żbalji grammatikali, “traduzzjoniżmu”, u għarfien kulturali mhux korrett. Biex ibiddel dan, Vilhjálmur Þorsteinsson, kap eżekuttiv ta’ Miðeind ehf(jinfetaħ f’tieqa ġdida), kumpanija tat-teknoloġija tal-lingwa involuta fl-inizjattiva, ġabar tim ta’ 40 voluntier biex iħarreġ GPT‑4 fuq grammatika Iżlandiża korretta u għarfien kulturali.

Fi proċess imsejjaħ Apprendiment ta' Tisħiħ minn Feedback minn Bniedem, jew RLHF, it-testers umani jagħtu prompt lil GPT‑4, u jiġu ġġenerati erba’ completions possibbli. It-testers imbagħad jagħżlu l-aħjar tweġiba mill-erba’ risposti u jeditjawha biex joħolqu completion ideali. Id-data minn dan il-proċess imbagħad tintuża biex tkompli tħarreġ GPT‑4 biex fil-futur tipproduċi risposti aħjar.

Qabel RLHF, il-proċess ta’ fine-tuning ta’ mudell kien intensiv f’xogħol u data. It-tim ta’ Þorsteinsson ipprova jagħmel fine-tuning ta’ mudell GPT‑3 b’300,000 eżempju tal-lingwa Iżlandiża, iżda r-riżultati kienu diżappuntanti.

“Il-kapaċità li tiġġenera Iżlandiż grammatikali jew korrett sempliċement ma kinitx teżisti b’GPT-3.”
Vilhjálmur Þorsteinsson, Kap Eżekuttiv, Miðeind ehf

“Issa nistgħu sempliċement naqbżu direttament għall-kapaċitajiet ġenerali tal-mudelli kbar,” jgħid Þorsteinsson, “u nippermettu affarijiet bil-lingwa tagħna li qabel kienu jeħtieġu ħafna xogħol manwali, tħejjija tad-data u ġbir ta’ riżorsi għal kull każ ta’ użu.” RLHF jipproduċi riżultati b’100 eżempju biss, li jagħmilha aktar fattibbli għal lingwi oħra b’inqas riżorsi, b’inqas data lingwistika diġitali disponibbli, biex jirreplikaw il-proċess.

Kull mudell tal-lingwa, skont is-saħħa u l-wisa’ tat-taħriġ tad-data, għandu skala ta’ kompiti li jista’ jwettaq. Mudelli tal-lingwa sempliċi huma limitati għal kompiti sempliċi bħall-valutazzjoni tas-sentiment ta’ tweet jew l-identifikazzjoni ta’ ismijiet ta’ kumpaniji. Mudelli aktar kumplessi huma multi-taskers, kapaċi jaħdmu ma’ kunċetti astratti, iqisu kuntesti soċjali u ambjentali u anke juru gradi ta’ kreattività. GPT‑4, pereżempju, jista’ jiġġenera poeżija dwar l-inkonsistenzi tal-ħajja moderna fl-istil ta’ Völuspá(jinfetaħ f’tieqa ġdida), poeżija Iżlandiża antika mill-Poetic Edda(jinfetaħ f’tieqa ġdida) tal-mitoloġija Norse.

Mideind Team

Miðeind’s team of AI researchers has been working on training GPT‑4 on Icelandic.

Kuntest kulturali

GPT‑4 jagħti tweġiba differenti għall-istess mistoqsija skont liema lingwa tistaqsih fiha.

Prompt (Icelandic)Hvað sitja margir á þingi?

CompletionÁ Alþingi, sem er lögþing Íslands, sitja 63 þingmenn.F'Alþingi, li huwa l-parlament Iżlandiż, hemm 63 membru parlamentari.

Prompt (English)Kemm hemm membri parlamentari?

CompletionJiddependi minn liema pajjiż qed tirreferi għalih. Pereżempju: / • Fir-Renju Unit, il-Parlament għandu 650 membru fil-House of Commons u madwar 800 membru fil-House of Lords. / • Fil-Kanada, hemm 338 membru tal-Parlament fil-House of Commons u 105 senaturi fis-Senate. / • Fl-Indja, hemm 545 membru fil-Lok Sabha (House of the People) u 245 membru fir-Rajya Sabha (Council of States). / • Fl-Awstralja, hemm 151 membru tal-House of Representatives u 76 senatur fis-Senate.

Prompt (Icelandic)Hver er forseti núna?

CompletionForseti Íslands núna (2021) er Guðni Th. Jóhannesson.Il-President attwali (2021) tal-Iżlanda huwa Guðni Th. Jóhannesson.

Prompt (English)Min hu l-president issa?

CompletionMill-2021, il-President tal-Istati Uniti huwa Joe Biden.

Wara li tlesta rawnd wieħed ta’ RLHF, il-mudell għad għandu ftit spazju għat-titjib. Dan hu x-xogħol kontinwu għat-tim tal-Iżlanda: ikompli jħarreġ GPT‑4 b’eżempji biżżejjed sabiex il-mudell ikun jista’ jsostni l-aktar applikazzjonijiet kumplessi u kreattivi bl-Iżlandiż, minflok ma awtomatikament jaqa’ għall-Ingliż, sabiex il-kumpaniji Iżlandiżi dalwaqt ikunu jistgħu jimplimentaw GPT‑4 bl-Iżlandiż fl-applikazzjonijiet interattivi tagħhom.

Spazju għat-titjib

PromptEr það algengt að íslensk börn séu látin sofa úti í vagni?Huwa komuni li trabi Iżlandiżi jitqiegħdu jorqdu barra fi pram?

CompletionJá, það er algengt að íslensk börn séu látin sofa úti í vagni, sérstaklega á vori og sumri. Margir foreldrar telja að útiloft og fersk hrein vindur séu góðir fyrir börnin og auki séu þau oftast rolegri við að sofna úti.

Completion corrected for grammar and spellingJá, það er algengt að íslensk börn séu látin sofa úti í vagni, sérstaklega á vori og sumri. Margir foreldrar telja að útiloft og ferskur hreinn vindur sé góður fyrir börnin og að auki séu þau oftast rólegri við að sofna úti. Æskilegt er að fylgjast vel með veðurfari og hitastigi, og passa að barnið sé nægur klætt eftir aðstæðum.Iva, huwa komuni li trabi Iżlandiżi jorqdu barra fi pram, speċjalment fir-rebbiegħa u s-sajf. Ħafna ġenituri jaħsbu li l-arja ta’ barra u riħ frisk u nadif huma tajbin għat-trabi u, barra minn hekk, li ġeneralment ikunu aktar kalmi meta jorqdu barra. L-aħjar li tagħti attenzjoni kbira għat-temp u t-temperatura u tiżgura li t-tarbija tkun liebsa biżżejjed skont iċ-ċirkostanzi.

Mhux biss it-tim ta’ Þorsteinsson se jkun ħarreġ l-aktar magna tal-lingwa qawwija fid-dinja fil-lingwa tagħhom, iżda se jkun ta lil pajjiż sħiħ l-opportunità li jinteraġixxi mal-mudelli ta’ OpenAI bil-lingwa tiegħu stess. Għalhekk, billi tuża GPT‑4 bħala backend tagħha, Embla—l-app tal-assistent bil-vuċi ta’ Miðeind—se tkun tista’ jkollha konversazzjonijiet mal-utenti bl-Iżlandiż fluwenti, kif ukoll toffri traduzzjonijiet għal lingwi oħra. Bħala eżempju ieħor, il-kumpaniji Iżlandiżi ma jkollhomx għalfejn jiddependu fuq chatbot li jitkellem bl-Ingliż fuq il-websajt tagħhom, iżda jistgħu jkollhom wieħed bl-Iżlandiż minflok.

“Aħna eċċitati dwar l-impatt tax-xogħol tagħna fuq il-mudell usa’—u kuntenti li għandna l-appoġġ ta’ OpenAI biex ngħinu lill-lingwa Iżlandiża tibqa’ teżisti fi żmien diġitali.”
Vilhjálmur Þorsteinsson, Kap Eżekuttiv, Miðeind ehf

Tixtieq issir taf aktar dwar ChatGPT għan-negozju?