મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI
લોડિંગ…
સ્વચ્છ આકાશ હેઠળ પાછળ હિમાચ્છાદિત પર્વતો ઊભા હોય અને બંને બાજુ પાણીથી ઘેરાયેલા સંકરા માર્ગ પર ચાલતી કારનો ફોટોગ્રાફ.

ઉત્તર એટલાન્ટિકના મધ્યમાં આવેલો ટાપુ દેશ આઇસલેન્ડ પાસે જીવંત ટેક્નોલોજી ઉદ્યોગ અને ફૂલતો-ફાલતો પર્યટન ક્ષેત્ર છે. તેમ છતાં, તેના આશરે 370,000 નાગરિકોમાંથી મોટા ભાગના અંગ્રેજી અથવા બીજી ભાષા બોલે છે, અને યુનાઇટેડ સ્ટેટ્સ અને યુરોપ સાથેના તેના એકીકરણને કારણે દેશની મૂળ ભાષા આઇસલેન્ડિક જોખમમાં આવી છે. આજે ચિંતા વધી રહી છે કે થોડા પેઢીઓમાં, જો ઝડપી ડિજિટાઇઝેશન સામે આઇસલેન્ડિક દેશની ડિફૉલ્ટ ભાષા તરીકે ટકી ન શકે, તો ભાષા વાસ્તવિક લુપ્તતા(નવી વિન્ડોમાં ખૂલે છે) નો સામનો કરી શકે છે.

આઇસલેન્ડના લોકો પોતાની ભાષાને તેની સમૃદ્ધ સાંસ્કૃતિક વારસા અને રાષ્ટ્રની ઓળખ સાથેના સંબંધ માટે ખૂબ જ માને છે. દેશની સરકાર ભાષા આયોજન વિભાગ જાળવે છે(નવી વિન્ડોમાં ખૂલે છે), જે અન્ય ભાષાઓમાંથી કહેવાતા “લોનવર્ડ્સ” અપનાવવા બદલે નવા વિચારો માટે આઇસલેન્ડિક શબ્દો ગઢે છે. ઉદાહરણ તરીકે, કમ્પ્યુટર ને tölva (“સંખ્યા ભવિષ્યવક્ત્રી”) કહેવામાં આવે છે. આ પ્રયાસો દ્વારા, ભાષા તેનો વિશિષ્ટ સ્વભાવ જાળવે છે(નવી વિન્ડોમાં ખૂલે છે) અને તેની જૂની નોર્સ મૂળ સાથે નજીકથી જોડાયેલી રહે છે.

દેશના રાષ્ટ્રપતિ, HE Guðni Th. Jóhannesson, ની પહેલ(નવી વિન્ડોમાં ખૂલે છે) પર અને ખાનગી ઉદ્યોગની મદદથી, આઇસલેન્ડે આઇસલેન્ડિક ભાષાના સંરક્ષણ પ્રયાસમાં GPT‑4 નો ઉપયોગ કરવા OpenAI સાથે ભાગીદારી કરી છે, અને રક્ષણાત્મક સ્થિતિને નવીનતાની તકમાં ફેરવી છે.

આ ભાગીદારીની કલ્પના માત્ર GPT‑4 ની ક્ષમતા વધારીને વિશ્વના નવા ખૂણે સેવા આપવા માટે જ નહોતી, પરંતુ અન્ય ઓછા-સ્રોત ભાષાઓના સંરક્ષણને પ્રોત્સાહન આપનારા સ્રોતો બનાવવાની દિશામાં એક પગથિયા તરીકે પણ હતી.

“ભાગીદારીની કલ્પના માત્ર GPT-4 ની ક્ષમતા વધારીને વિશ્વના નવા ખૂણે સેવા આપવા માટે જ નહોતી, પરંતુ અન્ય ઓછા-સ્રોત ભાષાઓના સંરક્ષણને પ્રોત્સાહન આપી શકે એવા સ્રોતો બનાવવાની દિશામાં એક પગથિયા તરીકે પણ હતી.”

Jóhanna Vigdís Guðmundsdóttir, ગેરલાભકારી ભાષા ટેક્નોલોજી કેન્દ્ર Almannarómur(નવી વિન્ડોમાં ખૂલે છે) ની મુખ્ય કાર્યકારી અધિકારી, કહે છે, “અમે ખાતરી કરવા માંગીએ છીએ કે કૃત્રિમ બુદ્ધિનો ઉપયોગ માત્ર ભાષા, સંસ્કૃતિ અને ઇતિહાસ જાળવવામાં મદદ માટે જ નહીં, પરંતુ આર્થિક સમૃદ્ધિને આધાર આપવા માટે પણ થાય.” તે સ્વીકારે છે, “આઇસલેન્ડિક થોડી અનોખી પરિસ્થિતિ છે, પરંતુ અમે અન્ય લાંબી-પૂંછડી ભાષાઓ માટે માર્ગદર્શક બનવાની, સમાન તકનું મેદાન બનાવવાની અને ‘AI divide’ ટાળવાની તક જોઈ. માત્ર ડેટા એકત્ર કરવું અને આઇસલેન્ડિક માટે સ્થાનિક રીતે સોફ્ટવેર બનાવવું પૂરતું નથી; અમારી ભાષાને લોકો દરરોજ ઉપયોગ કરતા સોફ્ટવેર અને એપ્લિકેશન્સમાં લાવવી પડશે.”

OpenAI ના GPT મોડલને ઇન્ટરનેટ પરના વિશાળ પ્રમાણના લખાણ પર તાલીમ આપવામાં આવે છે. પરિણામે, મોડલના તાલીમ સેટનો મોટો ભાગ અંગ્રેજી અને અન્ય મુખ્ય ભાષાઓમાં છે, જેના કારણે GPT ને નાની ભાષાઓમાં સમાન ક્ષમતા અથવા સમજણનો વ્યાપ મળતો નથી. સમય સાથે મોડલમાં સુધારો થયો છે, પરંતુ તે સતત સ્પષ્ટ અને સાચા આઇસલેન્ડિક અનુવાદો ઉત્પન્ન કરતા નથી.

Stjorn Almannaroms

The board of Almannarómur.

અંગ્રેજીથી આઇસલેન્ડિક

પ્રોમ્પ્ટHvað heitir Donald Duck á íslensku?આઇસલેન્ડિકમાં Donald Duck ને શું કહેવાય છે?

GPT‑3 પૂર્ણતાDonald Duck heitir á íslensku Donaldi Kjániઆઇસલેન્ડિકમાં Donald Duck ને Donaldi the Fool કહેવાય છેખોટું

ChatGPT પૂર્ણતાDonald Duck heitir sama nafni á íslensku og enskuઆઇસલેન્ડિક અને અંગ્રેજીમાં Donald Duck નું નામ એકસરખું છેખોટું

GPT‑4 પૂર્ણતાDonald Duck heitir Andrés Önd á íslenskuઆઇસલેન્ડિકમાં Donald Duck ને Andrés Önd કહેવાય છેસાચું

GPT‑3.5 કરતાં આઇસલેન્ડિકમાં ઘણું સારું હોવા છતાં GPT‑4 પણ વ્યાકરણની ભૂલો, “અનુવાદીય ભાષાશૈલી”, અને ખોટા સાંસ્કૃતિક જ્ઞાન સાથે આઇસલેન્ડિક ઉત્પન્ન કરે છે. આ બદલવા માટે, પહેલ સાથે જોડાયેલી ભાષા ટેક્નોલોજી કંપની Miðeind ehf(નવી વિન્ડોમાં ખૂલે છે) ના મુખ્ય કાર્યકારી Vilhjálmur Þorsteinsson એ 40 સ્વયંસેવકોની ટીમ બનાવી, જેથી GPT‑4 ને યોગ્ય આઇસલેન્ડિક વ્યાકરણ અને સાંસ્કૃતિક જ્ઞાન પર તાલીમ આપી શકાય.

રીઇન્ફોર્સમેન્ટ લર્નિંગ ફ્રોમ હ્યુમન ફીડબેક, અથવા RLHF, કહેવાતી પ્રક્રિયામાં માનવીય પરીક્ષકો GPT‑4 ને એક પ્રોમ્પ્ટ આપે છે અને ચાર સંભવિત પૂર્ણતાઓ જનરેટ થાય છે. ત્યારબાદ પરીક્ષકો ચાર પ્રતિભાવોમાંથી શ્રેષ્ઠ જવાબ પસંદ કરે છે અને તેને સંપાદિત કરીને આદર્શ પૂર્ણતા બનાવે છે. આ પ્રક્રિયાનો ડેટા પછી ભવિષ્યમાં વધુ સારા પ્રતિભાવ આપવા માટે GPT‑4 ને વધુ તાલીમ આપવા માટે વપરાય છે.

RLHF પહેલાં, મોડલને ફાઇન-ટ્યુન કરવાની પ્રક્રિયા ભારે શ્રમ અને ડેટાની માંગ કરતી હતી. Þorsteinsson ની ટીમે 300,000 આઇસલેન્ડિક ભાષાના ઉદાહરણો સાથે GPT‑3 મોડલને ફાઇન-ટ્યુન કરવાનો પ્રયાસ કર્યો, પરંતુ પરિણામો નિરાશાજનક રહ્યા.

“GPT-3 સાથે વ્યાકરણસર અથવા સાચી આઇસલેન્ડિક બનાવવાની ક્ષમતા હતી જ નહીં.”
Vilhjálmur Þorsteinsson, મુખ્ય કાર્યકારી, Miðeind ehf

Þorsteinsson કહે છે, “હવે અમે સીધા જ મોટા મોડલની સામાન્ય ક્ષમતાઓ સુધી પહોંચી શકીએ છીએ,” અને “અમારી ભાષા સાથે એવી બાબતો શક્ય બનાવી શકીએ છીએ, જેણે પહેલાં દરેક ઉપયોગ કેસ માટે ઘણું મેન્યુઅલ શ્રમ, ડેટા તૈયારી અને સ્રોતોનું સંકલન માંગતું હતું.” RLHF માત્ર 100 ઉદાહરણો સાથે પરિણામ આપે છે, જેનાથી ઓછા ડિજિટલ ભાષા ડેટા ધરાવતી અન્ય ઓછા-સ્રોત ભાષાઓ માટે પણ આ પ્રક્રિયા પુનરાવર્તિત કરવી વધુ શક્ય બને છે.

કોઈપણ ભાષા મોડલ, ડેટા તાલીમની શક્તિ અને વ્યાપ પર આધાર રાખીને, તે કરી શકે એવા કાર્યોનું એક પ્રમાણ ધરાવે છે. સરળ ભાષા મોડલ ટ્વીટની ભાવના આંકવા અથવા કંપનીના નામ ઓળખવા જેવા સરળ કાર્યો સુધી મર્યાદિત હોય છે. વધુ જટિલ મોડલ બહુ-કાર્યક્ષમ હોય છે, જે અભિધારાત્મક સંકલ્પનાઓ સાથે કામ કરી શકે છે, સામાજિક અને પર્યાવરણીય સંદર્ભોને ધ્યાનમાં લઈ શકે છે અને સર્જનાત્મકતાના સ્તરો પણ દર્શાવી શકે છે. ઉદાહરણ તરીકે, GPT‑4 નોર્સ પુરાણકથાની Völuspá(નવી વિન્ડોમાં ખૂલે છે) શૈલીમાં, જે Poetic Edda(નવી વિન્ડોમાં ખૂલે છે) નો પ્રાચીન આઇસલેન્ડિક કાવ્ય છે, આધુનિક જીવનની અનિશ્ચિતતાઓ વિશે કવિતા બનાવી શકે છે.

Mideind Team

Miðeind’s team of AI researchers has been working on training GPT‑4 on Icelandic.

સાંસ્કૃતિક સંદર્ભ

એક જ પ્રશ્નનો GPT‑4 જુદી ભાષામાં પૂછો તો જુદો જવાબ આપે છે.

પ્રોમ્પ્ટ (આઇસલેન્ડિક)Hvað sitja margir á þingi?

પૂર્ણતાÁ Alþingi, sem er lögþing Íslands, sitja 63 þingmenn.આઇસલેન્ડની સંસદ Alþingi માં 63 સાંસદો છે.

પ્રોમ્પ્ટ (અંગ્રેજી)સાંસદો કેટલા છે?

પૂર્ણતાતે તમે કયા દેશની વાત કરો છો તેના પર નિર્ભર છે. ઉદાહરણ તરીકે: / • યુનાઇટેડ કિંગડમમાં, સંસદમાં હાઉસ ઑફ કોમન્સમાં 650 સભ્યો અને હાઉસ ઑફ લોર્ડ્સમાં આશરે 800 સભ્યો છે. / • કેનેડામાં, હાઉસ ઑફ કોમન્સમાં સંસદના 338 સભ્યો અને સેનેટમાં 105 સેનેટર છે. / • ભારતમાં, લોકસભામાં 545 સભ્યો અને રાજ્યસભામાં 245 સભ્યો છે. / • ઓસ્ટ્રેલિયામાં, હાઉસ ઑફ રિપ્રેઝન્ટેટિવ્સમાં 151 સભ્યો અને સેનેટમાં 76 સેનેટર છે.

પ્રોમ્પ્ટ (આઇસલેન્ડિક)Hver er forseti núna?

પૂર્ણતાForseti Íslands núna (2021) er Guðni Th. Jóhannesson.આઇસલેન્ડના વર્તમાન (2021) રાષ્ટ્રપતિ Guðni Th. Jóhannesson છે.

પ્રોમ્પ્ટ (અંગ્રેજી)હાલમાં રાષ્ટ્રપતિ કોણ છે?

પૂર્ણતા2021 મુજબ, યુનાઇટેડ સ્ટેટ્સના રાષ્ટ્રપતિ Joe Biden છે.

RLHF નો એક રાઉન્ડ પૂર્ણ થયા પછી પણ, મોડલમાં હજી થોડું સુધારાનો અવકાશ છે. આ આઇસલેન્ડ ટીમનું ચાલુ કામ છે: GPT‑4 ને પૂરતા ઉદાહરણોથી આગળ તાલીમ આપવી જેથી મોડલ અંગ્રેજીને ડિફૉલ્ટ તરીકે અપનાવવાના બદલે આઇસલેન્ડિકમાં સૌથી જટિલ અને સર્જનાત્મક એપ્લિકેશન્સ ચલાવી શકે, જેથી આઇસલેન્ડિક કંપનીઓ ટૂંક સમયમાં તેમની ઇન્ટરેક્ટિવ એપ્લિકેશન્સમાં GPT‑4 ને આઇસલેન્ડિકમાં તૈનાત કરી શકે.

સુધારાનો અવકાશ

પ્રોમ્પ્ટEr það algengt að íslensk börn séu látin sofa úti í vagni?શું આઇસલેન્ડિક બાળકોને પ્રામમાં બહાર ઊંઘાડવું સામાન્ય છે?

પૂર્ણતાJá, það er algengt að íslensk börn séu látin sofa úti í vagni, sérstaklega á vori og sumri. Margir foreldrar telja að útiloft og fersk hrein vindur séu góðir fyrir börnin og auki séu þau oftast rolegri við að sofna úti. Æskilegt er að fylgjast vel með veðurfari og hitastigi, og passa að barnið sé nægur klætt eftir aðstæðum.

વ્યાકરણ અને જોડણી માટે સુધારેલી પૂર્ણતાJá, það er algengt að íslensk börn séu látin sofa úti í vagni, sérstaklega á vori og sumri. Margir foreldrar telja að útiloft og ferskur hreinn vindur sé góður fyrir börnin og að auki séu þau oftast rólegri við að sofna úti. Æskilegt er að fylgjast vel með veðurfari og hitastigi, og passa að barnið sé nægur klætt eftir aðstæðum.હા, આઇસલેન્ડિક બાળકોને પ્રામમાં બહાર ઝોકું કરાવવું સામાન્ય છે, ખાસ કરીને વસંત અને ઉનાળામાં. ઘણા માતા-પિતા માને છે કે બહારની હવા અને તાજી સ્વચ્છ પવન બાળકો માટે સારી છે અને વધુમાં, તેઓ બહાર ઊંઘે ત્યારે સામાન્ય રીતે વધુ શાંત હોય છે. હવામાન અને તાપમાન પર નજીકથી ધ્યાન આપવું અને પરિસ્થિતિ મુજબ બાળકને પૂરતા કપડા પહેરેલા છે તેની ખાતરી કરવી શ્રેષ્ઠ છે.

Þorsteinsson ની ટીમે માત્ર વિશ્વના સૌથી શક્તિશાળી ભાષા એન્જિનને તેમની ભાષામાં તાલીમ આપેલી નહીં હોય, પરંતુ આખા દેશને OpenAI ના મોડલ સાથે પોતાની જ ભાષામાં સંવાદ કરવાની તક પણ આપી હશે. આ રીતે, GPT‑4 ને તેના બેકએન્ડ તરીકે વાપરીને, Embla—Miðeind ની વૉઇસ અસિસ્ટન્ટ એપ—વપરાશકર્તાઓ સાથે પ્રવાહી આઇસલેન્ડિકમાં વાતચીત કરી શકશે, તેમજ અન્ય ભાષાઓમાં અનુવાદ પણ આપી શકશે. બીજા ઉદાહરણ તરીકે, આઇસલેન્ડિક કંપનીઓને હવે પોતાની વેબસાઇટ પર અંગ્રેજી બોલતા ચેટબોટ પર નિર્ભર રહેવું નહીં પડે, પરંતુ તેના બદલે આઇસલેન્ડિકમાં ચેટબોટ રાખી શકશે.

“અમારા કાર્યનો મોટા મોડલ પર શું અસર પડશે તે અંગે અમે ઉત્સાહિત છીએ અને ડિજિટલ યુગમાં આઇસલેન્ડિક ભાષાને જીવંત રાખવામાં મદદ કરવા OpenAI ના સમર્થનથી ખુશ છીએ.”
Vilhjálmur Þorsteinsson, મુખ્ય કાર્યકારી, Miðeind ehf

શું તમે બિઝનેસ માટે ChatGPT વિશે વધુ જાણવા ઇચ્છો છો?