መርፌ ጥያቄዎችን መረዳት፦ ግንባር ቀደም የደኅንነት ተግዳሮት
የኤ.አይ መሣሪያዎች ለጥያቄዎች ምላሽ ከመስጠት አልፈው መሥራት ጀምረዋል። እነሱ አሁን ድሩን ማሰስ፣ በምርምር ላይ መርዳት፣ ጉዞዎችን ማቀድ እና ምርቶችን መግዛት የሚችሉ ሆኗል። በሌሎች መተግበሪያዎች ውስጥ ውሂብዎን የመድረስ እና በእርስዎ ምትክ እርምጃዎችን የመውሰድ ችሎታቸው እየጨመረ ሲሄድ፣ አዳዲስ የደህንነት ተግዳሮቶች ብቅ የሚሉ ይሆናል። ከእነዚህ አንዱ በእጅጉ ትኩረት የምናደርበት መርፌ ጥያቄዎች ነው።
መርፌ ጥያቄ ለውይይት ኤ.አይ የተወሰነ የማህበራዊ ምሕንድስና ጥቃት አይነት ነው። የመጀመሪያዎቹ ኤ.አይ ስርዓቶች በአንድ ተጠቃሚ እና በአንድ የኤ.አይ ወኪል መካከል የሚደረጉ ውይይቶች ነበሩ። ዛሬ ባሉ የኤ.አይ ምርቶች ውስጥ ውይይትዎ ኢንተርኔትን ጨምሮ ከብዙ ምንጮች የተገኘ ይዘትን ሊያካትት የሚችል ይሆናል። ሶስተኛ ወገን (ተጠቃሚም እና ኤ.አይም ያልሆነ) በውይይቱ አውድ ውስጥ ተንኮል አዘል መመሪያዎችን በማስገባት ሞዴሉን ሊያሳስት ይችላል የሚለው ሀሳብ "መርፌ ጥያቄ" ወደሚለው ቃል አመራ።
ልክ በድር ላይ የሚደረጉ የፊሺንግ ኢሜይሎች ወይም ማጭበርበሮች ሰዎች ጥንቃቄ የሚያስፈልገው መረጃዎችን እንዲሰጡ ለማታለል እንደሚሞክሩ ሁሉ፣ መርፌ ጥያቄዎች ኤ.አይዎችን እርስዎ ያልጠየቁትን ነገር እንዲያደርጉ ለማታለል የሚሞክሩ ይሆናል።
አንድን ኤ.አይ በመስመር ላይ የዕረፍት ጊዜ ምርምር ለማድረግ እንዲረዳዎ ጠይቀው ይህን ሲያደርግ፣ በድረ-ገጽ ላይ የተደበቁ አሳሳች ይዘቶች ወይም ጎጂ መመሪያዎች ያጋጥመዋል፣ ለምሳሌ በዝርዝር ላይ በተሰጡ አስተያየቶች ወይም በግምገማዎች ላይ። ይዘቱ የተሳሳተ ዝርዝር እንዲመክር ወይም የክሬዲት ካርድ መረጃዎን እንዲሰርቅ በማድረግ ኤ.አይን ለማታለል በጥንቃቄ ሊዘጋጅ ይችላል።
እነዚህ ጥቂት የ"መርፌ ጥያቄ" ጥቃቶች ምሳሌዎች ናቸው—ብዙውን ጊዜ እንደ ድረ-ገጽ፣ ሰነድ ወይም ኢሜይል ባሉ መደበኛ ይዘቶች ውስጥ የሚደበቁ አንድን ሰው ለማታለል ዲዛይን የተደረጉ ጎጂ መመሪያዎች።
ኤ.አይ የበለጠ ጥንቃቄ የሚያስፈልገው ውሂቦችን የማግኘት እና የበለጠ ተነሳሽነት እና ረጅም ስራዎችን የመውሰድ እድል ሲኖረው እነዚህ አደጋዎች የሚጨምሩ ይሆናል።
ማጠቃለያ | የኤ.አይ እንዲያደርግ የጠየቁት | አጥቂው የሚያደርገው ነገር | ጥቃቱ ከተሳካ ሊከሰት የሚችል ውጤት |
ኤ.አይን አፓርታማዎች እንዲፈልግ ጠይቀው በመርፌ ጥያቄዎች ምክንያት ለእርስዎ በጣም ጥሩ ያልሆነውን ዝርዝር ወዲያውኑ እንዲመክር ሊደረግ ይችላል። | አንዳንድ የተሰጡ መስፈርቶችን በመጠቀም አፓርታማዎችን እንዲፈልግ ኤ.አይን ይጠይቃሉ። | ተጠቃሚው የገለጸውን ምርጫ ከግምት ውስጥ ሳያስገባ የእሱ ማስታወቂያ እንዲመረጥ እንደሚያስፈልግ ኤ.አይን ለማሳሳት አጥቂው በአፓርታማ ማስታወቂያው ውስጥ የመርፌ ጥያቄ ጥቃትን አካቷል። | ጥቃቱ ከተሳካ፣ ኤ.አይ በምርጫዎችዎ ላይ በመመስረት ከምርጫዎ በታች የሆነ የአፓርትመንት ዝርዝር በስህተት ሊመክር ይችላል። |
የኤ.አይ ወኪል ከአንድ ሌሊት ለኢሜይሎችዎ ምላሽ እንዲሰጥ ጠይቀው ነገር ግን የባንክ መግለጫዎችዎን ሊያካፍል ይችላል። | ዛሬ ጠዋት ስራ ስለበዛብዎ የኤ.አይ ወኪል በአጠቃላይ ከሌሊት ጀምሮ ለኢሜይሎችዎ ምላሽ እንዲሰጥ ይጠይቃሉ። ከታች ያለውን “በተቻለ ጊዜ ለወኪል ግልጽ መመሪያዎችን ይስጡ” የሚለውን ይመልከቱ | አጥቂው የባንክ መግለጫዎችዎን ለማግኘት እና ለአጥቂው ለማጋራት ሞዴሉን የሚያታልል የተሳሳተ መረጃ የያዘ ኢሜይል ይልክልዎታል። | ጥቃቱ ከተሳካ፣ ወኪሉ በኢሜልዎ ውስጥ እንደ የባንክ መግለጫዎች ያሉ ማንኛውንም ነገር ሊፈልግ (ለተግባሩ መዳረሻ የሰጡዋቸውን) እንዲሁም ለአጥቂው ሊያጋራ ይችላል። |
መርፌ ጥያቄን መከላከል በኤ.አይ ኢንዱስትሪ ውስጥ ፈታኝ እና በOpenAI ውስጥ ዋና ትኩረት ነው። ጠላቶች የእንደዚህ አይነት ጥቃቶች መፈጠራቸውን እንደሚቀጥሉ ብንጠብቅም፣ አንድ ሰው እነሱን ለማሳሳት በንቃት ቢሞክርም እንኳ የተጠቃሚውን የታሰበውን ተግባር ለማከናወን ዲዛይን የተደረጉ መከላከያዎችን እየገነባን እንገኛለን። የAGI ጥቅሞችን ደህንነቱ በተጠበቀ ሁኔታ ለማሳካት ይህ ችሎታ አስፈላጊ ነው።
ተጠቃሚዎቻችንን ለመጠበቅ እና ሞዴሎቻችንን ለእነዚህ ጥቃቶች የተሻለ መቋቋም እንዲችሉ ለማገዝ፣ የሚከተሉትን ጨምሮ ባለብዙ-ንብርብር አቀራረብን የምንወስድ ይሆናል፦
መርፌ ጥያቄዎችን የሚያውቅ እና በእነሱ የማይሸወድ ኤ.አይ የምንፈልግ ይሆናል። ይሁን እንጂ፣ ለጠላት ጥቃቶች ጠንካራ መሆን ለማሽን መማሪያ እና ለኤ.አይ ) ለረጅም ጊዜ የቆየ ተግዳሮት ነው፣ ይህም ይህንን አስቸጋሪ እና ክፍት ችግር የሚያደርገው ይሆናል። የሚታመኑ እና የማይታመኑ መመሪያዎችን የሚለዩ ሞዴሎችን ለመፍጠር የመመሪያ ተዋረድ የተባለ ጥናት አዘጋጅተን እንገኛለን። ሞዴሎቹ የመርፌ ጥያቄዎች ቅጦችን በተሻለ ሁኔታ እንዲያውቁ እና ችላ እንዲሏቸው ወይም ለተጠቃሚዎች እንዲጠቁሙ ለማድረግ አዳዲስ አቀራረቦችን ማዘጋጀታችንን የምንቀጥል ይሆናል። ከምንጠቀምባቸው ዘዴዎች አንዱ አዳዲስ የመርፌ ጥያቄ ጥቃቶችን ለመፍጠር ለዓመታት ስናጠና(በአዲስ መስኮት ውስጥ ይክፈታል) የቆየነው የራስ-ሰር በእሳት መፈተን ነው።
ፈጣን የመርፌ ጥያቄ ጥቃቶችን ለመለየት እና ለማገድ በርካታ የራስ-ሰር በኤ.አይ-የሚሰሩ ተቆጣጣሪዎችን አዘጋጅተናል። ምክንያቱም እኛ የምናገኛቸውን ማንኛውንም አዳዲስ ጥቃቶች በቅልጥፍና ለመከልከል በፍጥነት ሊዘመኑ የሚችሉ በመሆናቸው እነዚህ የደህንነት ስልጠና አቀራረቦችን የሚያሟሉ ይሆናል። እነዚህ ተቆጣጣሪዎች በተጠቃሚዎቻችን ላይ ሊከሰቱ የሚችሉ ፈጣን የመርፌ ጥያቄ ጥቃቶችን ለመለየት ብቻ ሳይሆን እነዚያ ጥቃቶች በዱር ውስጥ ከመሰማራታቸው በፊት መድረካችንን በመጠቀም የጠላት የመርፌ ጥያቄ ምርምር እና ሙከራዎችን እንድንከታተል የሚያስችሉን ይሆናል።
የተጠቃሚ ውሂብን ለመጠበቅ የሚረዱ የተለያዩ ተደራራቢ የደኅንነት ጥበቃዎችን በመጠቀም ምርቶቻችንን እና መሠረተ ልማታችንን ዲዛይን አድርገናል። በሚቀጥሉት ልጥፎች ውስጥ በበለጠ ቴክኒካዊ ዝርዝር የምንመረምራቸው እነዚህ ባህሪያት በእያንዳንዱ ምርት ላይ ተመስርተው የተዘጋጁ ናቸው። ለምሳሌ፣ የማይታመኑ ጣቢያዎችን ለማስቀረት እንዲረዳዎ፣ በተለይም እኛ እንዳንመዝግባቸው የሚጠይቁ ድረ-ገጾችች(በአዲስ መስኮት ውስጥ ይክፈታል) ላይ፣ ከመጎብኘታቸው በፊት በChatGPT ውስጥ አንዳንድ አገናኞችን እንዲፈቅዱ የምንጠይቅዎ ይሆናል። የእኛ ኤ.አይ ሌሎች ፕሮግራሞችን ወይም ኮድን ለማካሄድ መሣሪያዎችን ሲጠቀም (እንደ Canvas ወይም የልማት መሳሪያችን Codex)፣ ሞዴሉ የመርፌ ጥያቄ ውጤት ሊሆኑ የሚችሉ ጎጂ ለውጦችን እንዳያደርግ ለመከላከል ሳንድቦክሲንግ የሚባል ለይቶ የመከልከል ዘዴ የምንጠቀም ይሆናል።
ተጠቃሚዎች ራሳቸውን እንዲጠብቁ ለማገዝ በምርቶቻችን ውስጥ አብሮ የተሰሩ መቆጣጠሪያዎችን የምናክል ይሆናል። ለምሳሌ፣ በChatGPT Atlas ውስጥ፣ ChatGPT ወኪል ወደ ጣቢያዎች ሳይገባ ተግባራትን እንዲጀምር የሚያስችለውን ከመለያ መውጣት ሁነታ መምረጥ የሚችሉ ይሆናል። የChatGPT ወኪል እንደ ግዢ ማጠናቀቅ ያሉ ጥንቃቄ የሚያስፈልጋቸው እርምጃዎችን ከመውሰዱ በፊት ቆም ብሎ ማረጋገጫ የሚጠይቅ ይሆናል። ወኪል ጥንቃቄ በሚፈልግባቸው ድረ-ገጾች ላይ በሚሰራበት ወቅት የጣቢያውን ጥንቃቄ የሚፈልግ ባህሪ የሚያስታውቅ እና ወኪሉ ስራውን ሲያከናውን እንዲያዩ ትር ማንቃትን የሚጠይቅ “የመመልከቻ ሁነታ” ተግባራዊ አድርገናል። ጥንቃቄ የሚፈልግ መረጃ ካለው ትር ከወጡ ወኪሉ የሚያቆም ይሆናል። ይህ ወኪሉ ምን አይነት እርምጃዎችን እያከናወነ እንዳለ ማወቅዎን—እና መቆጣጠርዎን—የሚያረጋግጥ ይሆናል።
መከላከያችንን ለመፈተሽ እና ለማሻሻል፣ የአጥቂ ባህሪን ለማስመሰል እና ደኅንነታችንን ለማሻሻል አዳዲስ መንገዶችን ለማግኘት ከውስጥም ከውጭም ቡድኖች ጋር ሰፊ በእሳት መፈተንን እንተገብራለን። ይህ በተለይ በመርፌ ጥያቄ ላይ ያተኮሩ በሺዎች የሚቆጠሩ ሰዓታትን የሚያካትት ይሆናል። አዳዲስ ቴክኒኮችን እና ጥቃቶችን ስናገኝ፣ ቡድኖቻችን የደኅንነት ተጋላጭነቶችን በንቃት የሚፈቱ እንዲሁም የሞዴል ጥቃት ቅነሳዎቻችንን የሚያሻሽሉ ይሆናል።
በቀና-እምነት የሚተማመኑ የደኅንነት ተመራማሪዎች አዳዲስ የመርፌ ጥያቄ ቴክኒኮችን እና ጥቃቶችን እንድናገኝ እንዲረዱን ለማበረታታት፣ የሳንካ አደን ፕሮግራማችንን(በአዲስ መስኮት ውስጥ ይክፈታል) በመጠቀም ያልተፈለገ የተጠቃሚ ውሂብ መጋለጥን ሊያስከትል የሚችል ተጨባጭ የጥቃት መንገድ ሲያሳዩ የገንዘብ ሽልማቶችን የምናቀርብ ይሆናል። እነዚህን ችግሮች በፍጥነት እንድንፈታ እና መከላከያዎቻችንን የበለጠ እንድናጠናክር የውጭ አስተዋፅዖ አበርካቾችን ችግሩን እንዲያቀርቡልን የምናበረታታ ይሆናል።
ተጠቃሚዎች በእውቀት ላይ የተመሠረተ ውሳኔ እንዲሰጡ የተወሰኑ የምርት ባህሪያትን በመጠቀም ስለሚያስከትሉት አደጋ የምናስተምር ይሆናል። ለምሳሌ፣ ChatGPTን ከሌሎች መተግበሪያዎች ጋር ሲያገናኙ ምን ዓይነት ውሂብ ሊደረስበት እንደሚችል፣ እንዴት ጥቅም ላይ እንደሚውል፣ እና እንደ አንድ ድረ-ገጽ ውሂብዎን ለመስረቅ መሞክር ያሉ ሊከሰቱ የሚችሉ አደጋዎች ምን እንደሆኑ የምናብራራ ሲሆን በተጨማሪም እንዴት የበለጠ ደኅንነት ማረጋገጥ እንደሚችሉ ለመማር አገናኝ የምናቀርብ ይሆናል። እንዲሁም ለድርጅቶች የትኞቹ ባህሪያት ተጠቃሚዎች በስራ ቦታቸው ውስጥ ሊያነቁ ወይም ሊጠቀሙባቸው እንደሚችሉ ቁጥጥር የምንሰጥ ይሆናል።
መርፌ ጥያቄ በጊዜ ሂደት መሻሻልን እንደሚቀጥል የምንጠብቀው ግንባር ቀደም የደኅንነት ተግዳሮት ነው። አዳዲስ የእውቀት እና የችሎታ ደረጃዎች ቴክኖሎጂ፣ ኅብረተሰብ እና የአደጋ ቅነሳ ስትራቴጂ በጋራ እንዲዳብሩ የሚጠይቁ ይሆናል። እንደ 2000ዎቹ መጀመሪያ ላይ እንደነበሩት የኮምፒውተር ቫይረሶች፣ ሁሉም ሰው መርፌ ጥያቄዎች የሚያስከትሉትን ስጋት እና አደጋውን እንዴት መቋቋም እንደሚቻል መረዳት አስፈላጊ ነው ብለን የምናስብ ሲሆን ይህም ሁላችንም ከዚህ ቴክኖሎጂ ደህንነቱ በተጠበቀ ሁኔታ ተጠቃሚ በመሆን መማር እንድንችል ያደርገናል። በእርስዎ ምትክ ሊሰሩ የሚችሉ ኤ.አይ እና ወኪላዊ ባህሪያትን ሲጠቀሙ ውሂብዎን በተሻለ ሁኔታ እንዲጠበቅ ማወቅ እና ጥንቃቄ ማድረግ የሚረዳ ይሆናል።
በተቻለ መጠን፣ ወኪሉ ሥራውን ለማከናወን የሚፈልገውን ጥንቃቄ የሚፈልግ ውሂብ ወይም ማስረጃ ብቻ እንዲያይ መገደብ ያስፈልጋል። ለምሳሌ፣ የዕረፍት ጊዜ ምርምር ለማድረግ በChatGPT Atlas ውስጥ የወኪል ሁነታን ሲጠቀሙ ወኪሉ ምርምር ብቻ የሚያደርግ ከሆነ እና በመለያ መግባት የማያስፈልገው ከሆነ፣ "ከመለያዎ ወጥተዋል” የሚለውን ሁነታ ይጠቀሙ።
እኛ አብዛኛውን ጊዜ ወኪሎች እንደ ግዢ ማጠናቀቅ ወይም ኢሜይል መላክ ያሉ አንዳንድ ተፅዕኖ ፈጣሪ እርምጃዎችን ከመውሰዳቸው በፊት ከእርስዎ የመጨረሻ ማረጋገጫ እንዲያገኙ አድርገን ዲዛይን የምናደርጋቸው ይሆናል። አንድ ወኪል አንድን ድርጊት እንዲያረጋግጡ ሲጠይቅዎ፣ ድርጊቱ ትክክል መስሎ መታየቱን እና የሚጋራው ማንኛውም መረጃ በዚያ አውድ ውስጥ ለማጋራት ተገቢ መሆኑን በጥንቃቄ ያረጋግጡ።
አንድ ወኪል እንደ ባንክዎ ባሉ ጥንቃቄ በሚያስፈልጋቸው ጣቢያዎች ላይ ሲሰራ፣ ወኪሉ ስራውን ሲያከናውን ይመልከቱ። ይህ ማለት እጅዎን መሪው ላይ በማድረግ ራስን-የሚያሽከረክር መኪናን ከመቆጣጠር ጋር ተመሳሳይ ነው።
እንደ "ኢሜይሎቼን ገምግም እና የሚያስፈልገውን እርምጃ ውሰድ" ያሉ በጣም ሰፊ መመሪያዎችን ለአንድ ወኪል መስጠት የተደበቁ ተንኮል አዘል ይዘቶች ሞዴሉን እንዲያሳስቱ ቀላል ያደርገዋል፣ ምንም እንኳን ጥንቃቄ የሚፈልጉ እርምጃዎችን ከመውሰዱ በፊት እርስዎ ጋር እንዲያረጋግጥ ዲዛይን የተደረገ ቢሆንም።
ወኪልዎ የተወሰኑ ነገሮችን እንዲያከናውን መጠየቅ እና እንደ ኢሜይል ያሉ ጎጂ ሊሆኑ የሚችሉ ትዕዛዞችን እንዲከተል ሰፊ ነፃነት አለመስጠት የተሻለ ይሆናል። ይህ ጥቃቶች እንደማይከሰቱ ዋስትና ባይሰጥም አጥቂዎች ስኬታማ እንዲሆኑ ግን አስቸጋሪ የሚያደርገው ይሆናል።
የኤ.አይ ቴክኖሎጂ እያደገ ሲሄድ አዳዲስ አደጋዎች እና መከላከያዎች ብቅ የሚሉ ይሆናል። ስለ ምርጥ ልምዶች ለማወቅ ከOpenAI እና ከሌሎች ታማኝ ምንጮች የተገኙ ዝማኔዎችን ይከተሉ።
የመርፌ ጥያቄ ግንባር ቀደም እና የምርምር ችግር ተግዳሮት ሆኖ የቀጠለ ሲሆን ልክ እንደተለመዱ የኢንተርኔት ማጭበርበሮች፣ ሥራችን ቀጣይነት እንደሚኖረው እንጠብቃለን። ይህንን ዘዴ በአጥቂዎች ጉልህ በሆነ መንገድ መጠቀምን እስካሁን ባናይም፣ ጠላቶች ኤ.አይ እነዚህን ጥቃቶች እንዲያምን ለማድረግ ከፍተኛ ጊዜ እና ሀብት ያጠፋሉ ብለን የምንጠብቅ ይሆናል። ምርቶቻችንን ደህንነታቸው የተጠበቀ ለማድረግ በከፍተኛ ኢንቨስት ማድረጋችንን እና በዚህ ስጋት ላይ ያለውን የኤ.አይን ጥንካሬ ለማሳደግ ምርምር ማድረጋችንን የምንቀጥል ይሆናል። በዚህ አካባቢ በደህንነት ሥራችን ላይ እየተደረገ ያለውን እድገት ጨምሮ ተጨማሪ መረጃዎች ስናገኝ ወቅታዊ መረጃዎችን የምናጋራ ይሆናል። ለምሳሌ፣ የእርስዎ ኤ.አይ ከበይነመረብ ጋር በሚኖረው ግንኙነት ከእርስዎ ውይይት መረጃ የሚያስተላልፍ መሆኑን እንዴት እንደምንለይ ተጨማሪ ዝርዝሮችን የሚገልጽ በቅርቡ የምናሳትመውን ሪፖርት በመገንባት ላይ እንገኛለን።
ዓላማችን እነዚህን ስርዓቶች ከታማኝ እና ደህንነትን ከሚያውቅ የሥራ ባልደረባ ወይም ወዳጅ ጋር በሚመሳሰል መልኩ አስተማማኝ እና ደህንነታቸው የተጠበቀ እንዲሆኑ ማድረግ ይሆናል። ከእውነተኛው ዓለም አጠቃቀም መማርን፣ ደህንነቱ በተጠበቀ ሁኔታ መድገምን እና ቴክኖሎጂው እየገፋ ሲሄድ የተማርነውን ማሳተምን የምንቀጥል ይሆናል።


