ChatGPT እና የእኛ መሠረታዊ ሞዴሎች እንዴት እንደሚጎለብቱ
ሞዴሎቻችንን እንዴት እንደምናዘጋጅ እና እንደ ChatGPT ባሉ ምርቶች ላይ እንዴት እንደምንተገብራቸው የበለጠ ይወቁ
ChatGPT የሚያሠሩ ሞዴሎችን ጨምሮ የOpenAI መሠረታዊ ሞዴሎች የጎለበቱት ሦስት ዋና ዋና የመረጃ ምንጮችን በመጠቀም ነው፦ (1) በበይነ መረብ ላይ በይፋ ከሚገኝ መረጃ፣ (2) ከሦስተኛ ወገኖች ጋር አጋር በመሆን የምናገኘው መረጃ፣ እና (3) የእኛ ተጠቃሚዎች ወይም የሰው አሠልጣኞች እና ተመራማሪዎች ከሰጡት ወይም ካመነጩት መረጃ ነው።
ይህ ጽሑፍ ሞዴሎቻችንን ለማዘጋጀት እንዲረዳ የተጠቀምነውን ይፋዊ መረጃ እና ለግላዊነት ሕጎች ተገዢ በመሆን ያንን መረጃ እንዴት እንደምንሰበስብ እና እንደምንጠቀምበት አጠቃላይ ዕይታ ያቀርባል። የእኛን ሞዴሎች ለማስተማር ጥቅም ላይ ከዋሉ የChatGPT ውይይቶች እንዴት መርጠው መውጣት ይችላሉ የሚለውን ጨምሮ ከአገልግሎቶቻችን ተጠቃሚዎች እንዴት መረጃ እንደምንሰበስብ እና እንደምንጠቀም ለመረዳት፣ እባክዎ የእኛን የግላዊነት ፖሊሲ እና ይህንን ጽሑፍ ይመልከቱ።
ChatGPT በበይነመረብ ሊደርሱት የሚችሉት ሰው ሰራሽ አስተውሎት-ተኮር አገልግሎት ነው። ChatGPTን መረጃዎችን ለማደራጀት ወይም ለማጠቃለል፣ ትርጉም ላይ ለማገዝ፣ ምስልን ለመተንተን ወይም ለማመንጨት፣ ፈጠራን ለማነሳሳት እና ሀሳቦችን ለማፍለቅ፣ እንዲሁም የዕለት ከዕለት ተግባራት ላይ ለማገዝ ለመሳሰሉ የተለያዩ ተግባራት ሊጠቀሙበት ይችላሉ። ChatGPT የተጠቃሚውን ጥያቄዎች እና መመሪያዎች እንዲረዳ እና ምላሽ እንዲሰጥ በሚያስችል መንገድ ተዘጋጅቷል። ይህን የሚያደርገው እንደ ጽሑፍ፣ ምስል፣ ድምጽ ወይም ተንቀሳቃሽ ምስል የመሳሰሉ ተቀምጠው ያሉ በርካታ መረጃዎችን በመገምገም፣ እንዲሁም በመረጃዎቹ ውስጥ ካሉ ግንኙነቶች በመማር ነው። ለምሳሌ፣ ሞዴሉ ቃላት በሌሎች ቃላት አውድ ውስጥ እንዴት እንደሚመጡ በመማር ከዚያም ለተጠቃሚ ጥያቄ በምላሹ ሊታይ የሚችለውን ቀጣዩ ሊሆን የሚችለውን ቃል እና ከዚያ በኋላ የሚመጣውን እያንዳንዱን ተከታታይ ቃል አስቀድሞ ለመገመት የተማረውን ነገር ይጠቀማል። እንዲሁም ሞዴሎች በሥልጠና ውሂብ ውስጥ እንዴት ምስል የሚፈጥሩት ፒክስሎች እርስ በርስ እንዲሁም ከሚገልጿቸው መግለጫዎች ጋር እንደሚዛመዱ በመማር እንደ ምስል የመሳሰሉ ሌሎች የመረጃ ዓይነቶችን ለማመንጨት ይማራሉ።
እንደ ምሳሌ፣ በሞዴል ትምህርት ሂደት ("ሥልጠና" ተብሎ ይጠራል) ወቅት፣ አንድ ሞዴል የሚከተለውን አረፍተ ነገር ለመጨረስ እንዲሞክር ልናደርግ እንችላለን፦ "ወደ ግራ ከመታጠፍ ይልቅ፣ ወደ___ ታጠፈች።" ከሥልጠና በፊት፣ ሞዴሉ በዘፈቀደ ቃላት ምላሽ የሚሰጥ ይሆናል ነገር ግን እና ብዙ የጽሑፍ መስመሮች በሚያነብበት እና በሚማርበት ጊዜ የዚህን አይነት አረፍተ ነገር በተሻለ መልኩ ይረዳል እና የሚቀጥለውን ቃል ይበልጥ በትክክል መገመት ይችላል። ከዚያም ይህንን ሂደት በጣም ትላልቅ ብዛት ባላቸው አረፍተ ነገሮች ውስጥ ይደግማል።
በዚህ አረፍተ ነገር ውስጥ ቀጥሎ ሊመጡ የሚችሉ ብዙ ቃላቶች ስላሉ (ለምሳሌ ወደ ግራ ከመታጠፍ ይልቅ ወደ "ቀኝ"፣ "ቀኝ ኋላ" ወይም ወደ "ኋላ" ዞረች)፣ አንድ ሞዴል ምላሽ በሚሰጥበት መንገድ የዘፈቀደነት ባህሪ አለ፣ እና በብዙ አጋጣሚዎች ሞዴሎቻችን ተመሳሳይ ጥያቄን በተለያየ መንገድ ይመልሳሉ።
የማሽን ትምህርት ሞዴሎች "ክብደቶች" ወይም "መለኪያዎች" ተብለው ከሚጠሩ ትላልቅ የቁጥሮች ህብረ ቁምፊዎች እና እነዚያን ቁጥሮች ከሚተረጉም እና ከሚያስፈጽም ኮድ የተሠሩ ናቸው። ሞዴሎች ከተማሩበት ቦታ የመረጃ ቅጂዎችን አይዙም ወይም አያከማቹም። ይልቁኑ፣ አንድ ሞዴል በሚማርበት ጊዜ ሞዴሉን የሠሩት የተወሰኑ ቁጥሮች የተማረውን ነገር ለማንጸባረቅ በትንሹ ይቀየራሉ። ከላይ በተጠቀሰው ምሳሌ ላይ፣ ሞዴሉ በዘፈቀደ የተሳሳቱ ቃላትን ከመገመት ወደ ይበልጥ ትክክለኛ የሆኑ ቃላቶችን ወደ መገመት እንዲሻሻል ያገዘውን መረጃ ገምግሟል፣ ነገር ግን በራሱ በሞዴሉ ውስጥ የተከሰተው ነገር ሁሉ የተከሰተው ቁጥሮቹ በትንሹ በመቀየራቸው ነው። ሞዴሉ የገመገማቸውን አረፍተ ነገሮች፣ ምስሎች ወይም ድምጽ አላከማችም ወይም አልገለበጠም።
ከላይ እንደተጠቀሰው፣ ChatGPT እና ሌሎች አገልግሎቶቻችን የጎለበቱት (1) በበይነ መረብ ላይ በይፋ ከሚገኝ መረጃ፣ (2) ከሦስተኛ ወገኖች ጋር አጋር በመሆን የምናገኘው መረጃ፣ እና (3) የእኛ ተጠቃሚዎች ወይም የሰው አሠልጣኞች እና ተመራማሪዎች ከሰጡት ወይም ካመነጩት መረጃ ነው። በመጀመሪያ ደረጃ ይህ ጽሑፍ የሚያተኩረው፦ በበይነመረብ ላይ በይፋ ተገኚ በሆነ መረጃ ላይ ነው።
ለዚህ የመረጃ ስብስብ፣ በበይነ መረብ ላይ በነጻ እና በግልጽ ይፋዊ የሆነ መረጃ ብቻ እንጠቀማለን - ለምሳሌ፣ ያለ ደንበኝነት ምዝገባ ክፍያ የድር ጣቢያ ይዘት ማግኘት ከማይፈቅዱ ሥርዐቶች ወይም "ከጸለምተኛ አሳሽ" የመጣ መሆኑን የምናውቀውን መረጃ አንፈልግም። ሞዴሎቻችን እንዲማሩ ወይም ውጤት እንዲሰጡ ለማንፈልጋቸውን መረጃዎች ማጣሪያዎችን እንተገብራለን እንዲሁም መረጃን እናስወግዳለን፣ ለምሳሌ የጥላቻ ንግግር፣ የአዋቂ ይዘት፣ በይበልጥ የግል መረጃን የሚያጠቃልሉ ጣቢያዎችን እና አይፈለጌ መልዕክቶች። ከዚያም ሞዴሎቻችንን ለማስተማር መረጃውን እንጠቀማለን።
በበይነ መረቡ ላይ ያለው ከፍተኛ መጠን ያለው ውሂብ ከሰዎች ጋር ይዛመዳል ስለዚህ የሥልጠና መረጃችን እንደ አጋጣሚ ሆኖ የግል መረጃን ያካትታል። ሞዴሎቻችንን ለማሰልጠን በንቃት የግል መረጃን አንፈልግም።
የሥልጠና መረጃዎችን ሞዴሎቻችን እንደ የመተንበይ፣ ምክንያት የመስጠት፣ እና ችግሮችን የመፍታት ችሎታ የመሳሰሉ እውቀቶችን ለማስተማር ብቻ ነው የምንጠቀመው። ስለ ሰዎች መገለጫዎችን ለመፍጠር፣ እነሱን ለማነጋገር፣ ለእነሱ ለማስተዋወቅ፣ ማንኛውንም ነገር ለእነሱ ለመሸጥ ለመሞከር ወይም ራሱን መረጃውን ለመሸጥ በስልጠና መረጃ ውስጥ ማንኛውንም የግል መረጃ አልተጠቀምንም ወደፊትም አንጠቀምም።
ሞዴሎቻችን በቋንቋ እና በአረፍተ ነገሮች ውስጥ ተስማሚ የሆኑ እንደ ስሞች እና አድራሻዎች ያሉ ነገሮችን ለመረዳት ወይም ስለ ታዋቂ ሰዎች እና ይፋዊ ምስሎችን ለማወቅ ከግል መረጃ ሊማሩ ይችላሉ። ይህ ሞዴሎቻችን ተዛማጅ ምላሾችን በማቅረብ እንዲሻሻሉ ያደርጋቸዋል።
እንዲሁም ሞዴሎቻችንን በምናሰለጥንበት ጊዜ የግል መረጃ መሰናዳትን ለመቀነስ እርምጃዎችን እንወስዳለን። ለምሳሌ፣ ትልልቅ መጠን ያለውን የግል መረጃ የሚያጠቃልሉ ድር ጣቢያዎችን አስወግደን ሞዴሎቻችን ስለ ሰዎች የግል ወይም ሚስጥራዊ መረጃ ጥያቄዎችን ውድቅ እንዲያደርጉ እናሰለጥናለን።
የሥልጠና መረጃን በሕጋዊ መንገድ እንጠቀማለን። መሠረታዊ ሞዴሎቻችን ጉልህ ጥቅሞችን የሚሰጡ ብዙ መተግበሪያዎች አሏቸው እና ሰዎች ይዘት እንዲፈጥሩ፣ የደንበኞችን አገልግሎት እንዲያሻሽሉ፣ ሶፍትዌሮችን እንዲያዘጋጁ፣ ትምህርት እንዲያበጁ፣ ሳይንሳዊ ምርምርን እንዲደግፉ እና ሌሎችንም እንዲያደርጉ አሁንም እያገዙ ነው። እነዚህ ጥቅማጥቅሞች ሞዴሎቹን ለማስተማር ከፍተኛ መጠን ያለው መረጃ ከሌለ እውን ሊሆኑ አይችሉም። በተጨማሪም፣ የሥልጠና መረጃ አጠቃቀማችን በግለሰቦች ላይ አሉታዊ ተጽዕኖ ለማሳደር የታሰበ አይደለም እና የዚህ የሥልጠና መረጃ የመጀመሪያ ምንጮች አስቀድመው ለህዝብ ይፋ ይደረጋሉ። ለእነዚህ ምክንያቶች፣ በእኛ የግላዊነት ፖሊሲ ላይ በበለጠ ዝርዝር እንደተገለጸው በሥልጠና መረጃ ውስጥ የተካተተውን የግል መረጃ አሰባሰብ እና አጠቃቀም እንደ GDPR ባሉ የግላዊነት ሕጎች ሥር ባሉ ሕጋዊ ፍላጎቶች ላይ እንመሠረታለን። እንዲሁም ይህንን መረጃ በሕጋዊ መንገድ እና ሃላፊነት በተሞላበት መልኩ እየሰበሰብን እና እየተጠቀምን እንደሆነ ለማረጋገጥ እንዲረዳ የውሂብ ጥበቃ ተጽዕኖ ግምገማ አጠናቅቀናል።
ለተቃውሞ ጥያቄዎች እና ተመሳሳይ መብቶች ምላሽ እንሰጣለን። ቋንቋ በመማር ምክንያት፣ የChatGPT ምላሾች አንዳንድ ጊዜ የግል መረጃቸው ይፋዊ በይነመረብ ላይ ብዙ ጊዜ የታዩ ግለሰቦችን የግል መረጃን ሊያካትቱ ይችላሉ (ለምሳሌ፣ ታዋቂ ሰዎች)። በተወሰኑ ግዛቶች ውስጥ የሚገኙ ግለሰቦች በእኛ የግላዊነት ፖርታል(በአዲስ መስኮት ውስጥ ይክፈታል) በኩል ሞዴሎቻችን የእነሱን የግል መረጃ ማሰናዳታቸውን መቃወም ወይም ሌላ የውሂብ ባለቤት መብቶች ጥያቄዎችን ማቅረብ ይችላሉ። እንዲሁም እነዚህን መብቶች dsar@openai.com በማነጋገር መጠቀም ይችላሉ።
በግላዊነት መብቶች መሠረት አንዳንድ መብቶች ፍጹም ላይሆኑ እንደሚችሉ እባክዎ ይወቁ። ጥያቄን ውድቅ ለማድረግ ሕጋዊ ምክንያት ካለን ጥያቄን ውድቅ ልናደርግ እንችላለን። ይሁን እንጂ፣ ለግል መረጃ ጥበቃ ቅድሚያ ለመስጠት እና ሁሉንም የሚመለከታቸው የግላዊነት ሕጎችን ለማክበር እንጥራለን። ለአንድ ጉዳይ በበቂ ሁኔታ መፍትሄ እንዳልሰጠን ከተሰማዎት፣ የአካባቢዎ ተቆጣጣሪ ባለስልጣን ጋር ቅሬታ የማቅረብ መብት አለዎት።
ድር ጣቢያችንን፣ መተግበሪያዎቻችንን፣ እና አገልግሎቶቻችንን በሚጠቀሙ ጊዜ ከእርስዎ ወይም ስለ እርስዎ የምንሰበስበውን የግል መረጃ በተመለከተ ስለ OpenAI ተግባራት የበለጠ መረጃ ለማግኘት እባክዎ የእኛን የግላዊነት ፖሊሲ ይመልከቱ።