17 ጁላይ 2025

ChatGPT ወኪልን ማስተዋወቅ፦ ምርምርን እና ድርጊትን ማገናኘት

ChatGPT አሁን አስብ እና ይሠራል፣ በራሱ ኮምፒውተር ተግባሮችን ለማጠናቀቅ ከአጀንቲክ ችሎታዎች የመሳሪያ ሳጥን በቅድሚያ ይምረጣል።

በመጫን ላይ…

ChatGPT አሁን የራሱን ኮምፒውተር በመጠቀም ውስብስብ ተግባሮችን ከመጀመሪያ እስከ መጨረሻ ለእርስዎ ማከናወን ይችላል።

አሁን እንደ ChatGPT እንደ «የእኔን የቀን መቁጠሪያ ይመልከቱ እና በቅርብ ዜናዎች ላይ በመመስረት በመጪዎቹ የደንበኛ ስብሰባዎች አጭሩ»፣ «ለአራት የጃፓን ቁርስ ለማዘጋጀት እቅድ እና መግዛት» እና «ሶስት ተፎካካሪዎችን ይተንትኑ እና ስላይድ ዴክ ይፍጠሩ» ያሉ ጥያቄዎችን ማስተዳደር ማመን ይችላሉ። ChatGPT ድር ጣቢያዎችን በአስተዋይነት ያስተዋውቃል፣ ውጤቶችን አጣራል፣ አስፈላጊ በሚሆንበት ጊዜ በደህንነት ግባ የሚያሳይ እርምጃ ይወስዳል፣ ኮድ ያስከትላል፣ ትንታኔ ያካሂዳል እና ግኝቶቹን የሚያጠቃልሉ የሚለዋወጡ ስላይድ እና ሉህ ያቀርባል።

የዚህ አዲስ ችሎታ ዋና አካል የተዋሃደ የወኪልነት ስርዓት ነው። ቀደምት ግኝቶች ሶስት ጥንካሬዎችን በአንድ ላይ ያመጣል፦ የOperator⁠ ከድረ-ገጾች ጋር የመገናኘት ችሎታ፣ ጥልቅ ምርምር⁠ መረጃን የማዋሃድ ችሎታ እና የChatGPT ብልህነት እና የንግግር ቅልጥፍና።

ChatGPT እነዚህን ተግባራት ያከናውናል የራሱን ምናባዊ ኮምፒውተር በመጠቀም፣ ውስብስብ የሥራ ፍሰቶችን ከመጀመሪያ እስከ ማጨረሻ ለመቆጣጠር በአመዛዛኝነት እና በድርጊት መካከል በፈሳሽ መንቀሳቀስ ይሰራል።

በጣም አስፈላጊ፣ እርስዎ ሁል ጊዜ በቁጥጥር ላይ ነዎት። ChatGPT ከአስፈላጊ ድርጊቶች በፊት ፈቃድ ይጠይቃል፣ እና በማንኛውም ጊዜ በቀላሉ ማቋረጥ፣ አሳሽ መያዝ ወይም ተግባሮችን ማቆም ይችላሉ።

ከዛሬ ጀምሮ Pro፣ Plus እና Team ተጠቃሚዎች በማንኛውም ውይይት ውስጥ በማንኛውም ጊዜ ‹ወኪል ሁነታ› በመምረጥ ከአዘጋጁ በመዝረዝር መሳሪያዎች ውስጥ በቀጥታ የChatGPT አዲሱን የወኪል ችሎታዎችን አንቃ ይችላሉ።

ChatGPT ወኪል ተግባሮችን ለማስተናገድ ቀድሞውኑ ኃይለኛ መሣሪያ ቢሆንም፣ የዛሬው ማስጀመሪያ መጀመሪያ ብቻ ነው። በጊዜ ሂደት የበለጠ ብቃት ያለው እና ለብዙ ሰዎች ጠቃሚ በማድረግ ጉልህ ማሻሻያዎችን በመደበኛነት ማከል እንቀጥላለን።

የተፈጥሮ ዝግመተ ለውጥ የOperator እና ጥልቅ ምርምር

ቀደም ሲል Operator እና ጥልቅ ምርምር እያንዳንዳቸው ልዩ ጥንካሬዎችን አመጡ፦ Operator በድር ላይ ማሸብለል፣ ጠቅ ማድረግ እና መጻፍ ይችል ነበር፣ ጥልቅ ምርምር ግን መረጃን በመተንተን እና በማጠቃለል የተሻለ ነበር። ነገር ግን በተለያዩ ሁኔታዎች ውስጥ በተሻለ ሁኔታ ሰርተዋል፦ Operator ወደ ትንተና ጥልቅ መገብ ወይም ዝርዝር ሪፖርቶችን መጻፍ አልቻለም፣ እና ጥልቅ ምርምር ድር ጣቢያዎችን ለማጣራት ወይም የተጠቃሚ ማረጋገጫ የሚጠይቅ ይዘት ለመዳረስ አልቻለም። በእርግጥ፣ ተጠቃሚዎች ከOperator ጋር የሞከሩ ብዙ ጥያቄዎች በትክክል ለጥልቅ ምርምር የበለጠ ተስማሚ እንደሆኑ አየን፣ ስለዚህ ከሁለቱም ምርጡን ተደርጓል።

እነዚህን ተጨማሪ ጥንካሬዎች በChatGPT ውስጥ በማዋሃድ እና ተጨማሪ መሳሪያዎችን በማስተዋወቅ በአንድ ሞዴል ውስጥ አዲስ ችሎታዎችን ከፍተናል። አሁን ድረ-ገጾችን በንቃት ማሳተፍ ይችላል—ጠቅ ማድረግ፣ አጣራ እና የበለጠ ትክክለኛና ውጤታማ ውጤቶችን ማሰባሰብ። እንዲሁም በተፈጥሮ ከቀላል ውይይት ወደ ተመሳሳይ ውይይት ውስጥ ድርጊቶችን ለመጠየቅ መሸጋገር ይችላሉ።

ከእርስዎ ጋር ለእርስዎ የሚሰራ ወኪል

እኛ የChatGPT ወኪልን በተለያዩ መሳሪያዎች ስብስብ አዘጋጅተናል፦ በግራፊክ ተጠቃሚ በይነገጽ በኩል ከድር ጋር የሚገናኝ የእይታ አሳሽ፣ ለቀላል ምክንያታዊ የድር ጥያቄዎች የተመሠረተ የጽሑፍ አሳሽ፣ ተርሚናል እና ቀጥተኛ API መዳረሻ። ወኪሉ እንዲሁም ChatGPT አገናኞችን⁠(በአዲስ መስኮት ውስጥ ይክፈታል) መጠቀም ይችላል፣ ይህም እንደ Gmail እና Github ያሉ መተግበሪያዎችን እንዲያገናኙ ያስችላል፣ ይህም ChatGPT ከእርምጃዎች ጋር ተዛማጅ መረጃዎችን ማግኘት እና በምላሾቹ ውስጥ ሊጠቀሙባቸው ይችላል። እንዲሁም አሳሽውን በመቆጣጠር በማንኛውም ድር ጣቢያ ላይ ግባ ይችላሉ፣ ይህም በምርምሩ እና በተግባር አፈፃፀሙ ውስጥ ጥልቅ እና ሰፊ Go ያስችላል። ChatGPTን የድር መረጃን ለመድረስ እና ለመገናኘት የተለያዩ መንገዶችን መስጠት ማለት ተግባሮችን በብቃት ለማከናወን በጣም ጥሩ መንገድ መምረጥ ይችላል። ለምሳሌ፣ በAPI በኩል ስለ የቀን መቁጠሪያዎ መረጃ መሰብሰብ ይችላል፣ በጽሑፍ ላይ የተመሠረተ አሳሽን በመጠቀም ከፍተኛ መጠን ያለው ጽሑፍ በብቃት አመዛዝን ማድረግ፣ እንዲሁም በዋናነት ለሰዎች የተነደፉ ድር ጣቢያዎች ጋር በእይታ መስበር ይችላል።

ይህ ሁሉ የሚከናወነው የራሱን ቨርቹዋል ኮምፒዩተር በመጠቀም ነው፣ ይህም ለሥራው አስፈላጊ የሆነውን አውድ ይጠብቃል፣ ብዙ መሳሪያዎች ጥቅም ላይ በሚውሉበት ጊዜም እንኳን—ሞዴሉ የጽሑፍ ማሰሻውን ወይም ምስላዊ አሳሹን በመጠቀም ገጽ ለመክፈት መምረጥ ይችላል፣ ፋይልን ከድሩ ማውረድ፣ በተርሚናል ውስጥ ትእዛዝ በማስኬድ እና ከዚያ ውጤቱን ወደ ምስላዊ አሳሹ ይመልከቱ። ሞዴሉ አቀራረቡን ለማስተካከል እና ተግባሮችን በፍጥነት፣ በትክክለኛነት እና በቅልጥፍና ለማከናወን ያስችላል።

የChatGPT ወኪል የተነደፈው ለተደጋጋሚ፣ ለትብብር የስራ ፍሰቶች፣ ከቀደምት ሞዴሎች እጅግ የበለጠ በይነተገናኝ እና ተለዋዋጭ ነው። ChatGPT ሲሰራ፣ መመሪያዎችዎን ለማብራራት፣ ወደ ተፈለጉ ውጤቶች ለማስተካከል ወይም ተግባሩን ሙሉ በሙሉ ለመለወጥ በማንኛውም ጊዜ ማቋረጥ ይችላሉ። አሁን ከአዲሱ መረጃ ጋር በቆየበት ቦታ ይቀጥላል፣ ነገር ግን የቀድሞውን እድገት ሳያጣ። በተመሳሳይ፣ ChatGPT ራሱ ተግባሩ ከግቦችዎ ጋር ተስማሚ መሆኑን ለማረጋገጥ አስፈላጊ በሚሆንበት ጊዜ ከእርስዎ ተጨማሪ ዝርዝሮችን ሊጠይቅ ይችላል። አንድ ተግባር ከተጠበቀው በላይ የሚዘግይ ወይም የተጣበቀ ከሆነ፣ ማቆም፣ የሂደት ማጠቃለያ መጠየቅ ወይም ሙሉ በሙሉ ማቆም እና ከፊል ውጤቶችን ማግኘት ይችላሉ። በስልክዎ ላይ የChatGPT መተግበርያ ካለዎት፣ ተግባርዎ ሲጨርም ማሳወቂያ ይላክልዎታል።

የእውነተኛ ዓለም አገልግሎትን ማስፋት

እነዚህ የተዋሃዱ አጀንቲክ ችሎታዎች በዕለት ተዕለት እና በሙያዊ አውዶች ውስጥ የChatGPT ተጠቃሚነትን በእጅጉ ያሳድጋሉ። በስራ ቦታ፣ ልክ እንደ ቅጽበታዊ ገጽ እይታዎች ወይም ዳሽቦርዶች ሊስተካከል ከሚችሉ የቬክተር አካላት የተውጣጡ የዝግጅት አቀራረቦችን፣ ስብሰባዎችን ማስተካከል፣ ቦታዎችን ማቀድ እና ማስያዝ፣ እና የተመን ሉሆችን በአዲስ የፋይናንሺያል መረጃ ማዘመን ያሉ ተደጋጋሚ ስራዎችን በራስ ሰር መስራት ይችላሉ። በግል ሕይወትዎ ውስጥ የጉዞ እቅዶችን በቀላሉ እቅድ ለማዋቀር እና ለማስያዝ፣ ሙሉ የእራት ድግስ እቅድ ለማዋቀር እና ማስያዝ ወይም ስፔሻሊስቶችን ለማግኘት እና ቀጠሮችን ለማዘጋጀት መጠቀሙ።

የአምሳያው ከፍ ያለ ችሎታዎች በድረ-ገጽ አሰሳ እና በገሃዱ ዓለም የተግባር ማጠናቀቂያ ችሎታዎችን በሚለኩ ግምገማዎች ላይ ባለው ዘመናዊ (SOTA) አፈፃፀሙ ላይ ተንጸባርቀዋል።

በ Humanity’s Last Exam⁠(በአዲስ መስኮት ውስጥ ይክፈታል)*ላይ፣ በባለሙያ ደረጃ ጥያቄዎች ላይ በሰፊ ርዕሰ ጉዳዮች ላይ የሰው ሠራሽ አስተውሎት (AI) አፈፃፀም የሚለካ ግምገማ፣ የChatGPT ወኪል የሚያስችል ሞዴል አዲስ ማለፊያ @1 SOTAን በ 41.6 ያሰጣል። ወኪሉ በተለዋዋጭ እቅድ ስለሚያቀድ እና የራሱን መሳሪያዎች ስለሚመርጥ፣ ተመሳሳይ ተግባርን በተለያዩ መንገዶች በተደጋጋሚ ሂደቶች ማከናወን ይችላል። ይህን በቀላል ተመሳሳይ የመስመር ስትራቴጂ ሲያስተካክልን—በአንድ ጊዜ እስከ ስምንት ሙከራዎችን በመስራት እና ከፍተኛ የራስ እምነት ያለውን በመምረጥ—የወኪሉ የHLE ውጤት ወደ 44.4 ይጨምራል።

FrontierMath** በጣም የሚታወቀው የሂሳብ መለኪያ ነው፣ ልብ ወለድ፣ ያልታተሙ ችግሮች ብዙውን ጊዜ ባለሙያ የሂሳብ ሊቃውንት ለመፍታት ሰዓታት ወይም ቀናትን የሚወስዱ ናቸው። በመሳሪያ አጠቃቀም፣ እንደ ኮድ አፈፃፀም ተርሚናል መዳረሻ፣ ChatGPT ወኪል 27.4% ትክክለኛነት ያገኛል፣ ይህም የቀደመውን ሞዴሎች በሰፊ ልዩነት ያሻሽላል።

በተጨማሪም ሞዴሉን በተወሳሰቡ የእውነተኛ ዓለም ተግባሮች የተመሰረቱ መደበኞችን በመጠቀም እንደገና አረጋግጠናል። በውስብስብ፣ ኢኮኖሚያዊ ጠቀሜታ ባለው የእውቀት-ስራ ተግባራት ላይ የሞዴል አፈጻጸምን ለመገምገም በተዘጋጀው የውስጥ ቤንችማርክ ላይ፣ የChatGPT ወኪል ውጤት በተለያዩ የተግባር ማጠናቀቂያ ጊዜዎች ውስጥ ከሰዎች ጋር ሲነፃፀር ወይም የተሻለ ሲሆን ከ o3 እና o4-mini በእጅጉ የላቀ ነው። የሞዴል ውጤቶች በእያንዳንዱ መስክ ከፍተኛ አፈፃፀም ባላቸው ከፍተኛ ጥራት ባለው የሰው ልጅ መነሻ ላይ በባለሙያዎች ይገመገማሉ። በተለያዩ ሙያዎች እና ኢንዱስትሪዎች ከባለሙያዎች የተውጣጡ እነዚህ ተግባራት፣ የገሃዱ ዓለም ሙያዊ ስራዎችን ያንፀባርቃሉ—እንደ ተፈላጊ አስቸኳይ ተንከባካቢ አቅራቢዎች ተወዳዳሪ ትንታኔ ማዘጋጀት፣ ዝርዝር የማሳደጊያ መርሃ ግብሮችን መገንባት እና ለአዲስ አረንጓዴ ሃይድሮጂን ተቋም አዋጭ የውሃ ጉድጓዶችን መለየት።

በ DSBench⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ላይ የተነደፈ የውሂብ ሳይንስ ተግባራትን የሚሸፍኑ የመረጃ ትንተና እና ሞዴሊንግ ላይ ወኪሎችን ለመገምገም የተነደፈ የChatGPT ወኪል በተለይም የሰውን አፈፃፀም በከፍተኛ ልዩነት ይበልጣል።

በ SpreadsheetBench ላይ ሞዴሎችን ከእውነተኛ ዓለም ሁኔታዎች የተገኙ የተመን ሉሆችን የማርትዕ ችሎታቸውን በሚገመግም፣ የChatGPT ወኪል ነባር ሞዴሎችን በከፍተኛ ህዳግ ይበልጣል። ሉሆችን በቀጥታ የማርትዕ ችሎታ ሲሰጥ የChatGPT ወኪል በ45.5% በExcel ውስጥ ከኮፒሎት ጋር ሲነፃፀር 20.0% ከፍ ያለ ውጤት ይሰጣል።

ዘዴ፦ የSpreadsheetBench ደራሲዎች የስፕሬድሺቶችን ለመገምገም Microsoft Excelን በመጠቀም የWindows አካባቢን ተጠቅመዋል። እኛ OSX አካባቢን እና LibreOfficeን የተጠቀምን ሲሆን፣ ይህም አነስተኛ የደረጃ ልዩነቶችን ሊያስከትል ይችላል። ለምሳሌ፣ ደራሲዎቹ ለGPT‑4o 15.02% የሆነ አጠቃላይ ጠንካራ ገደብ አግኝተዋል፣ እኛ ደግሞ 13.38% አግኝተናል። ሙሉውን የ912-ጥያቄ መለኪያ ተጠቅመንበታል።

የአንድ ሞዴል ከመጀመሪያው እስከ ሶስተኛ አመት የኢንቨስትመንት ባንክ ተንታኝ ሞዴሊንግ ተግባሮች—የመወጣት ችሎታን በሚለካው የውስጥ መለኪያ ላይ - ለምሳሌ ለፎርቹን 500 ኩባንያ ባለ ሶስት መግለጫ የፋይናንሺያል ሞዴል ከተገቢው ቅርጸት እና ጥቅሶች ጋር ማሰባሰብ ወይም ለግል ጥቅም ላይ የዋለ የግዢ ሞዴል መገንባት - የChatGPT ወኪልን የሚያንቀሳቅሰው ሞዴል ከጥልቅ ምርምር እና o3 በእጅጉ ይበልጣል። እያንዳንዱ ተግባር በትክክለኛነት እና በቀመር አጠቃቀም ተያያዥ በመቶ መስፈርቶች ላይ ይተካል።

እንዲሁም በዚህ አመት መጀመሪያ ላይ ያተምነው የChatGPT ወኪልን በBrowseComp⁠ ላይ ገምግመናል፣ የአሰሳ ወኪሎች በድሩ ላይ ለማግኘት አስቸጋሪ የሆኑ መረጃዎችን የማግኘት ችሎታን ይለካል። ሞዴሉ አዲስ SOTA አዘጋጅቷል 68.9%፣ ከጥልቅ ምርምር በ17.4 በመቶኛ ነጥቦች ከፍተኛ ነው።

በመጨረሻም፣ በWebArena⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ላይ፣ የድር አሰሳ ወኪሎችን የገሃዱ ዓለም የድር ተግባራትን በማጠናቀቅ ላይ ያላቸውን አፈጻጸም ለመገምገም የተነደፈ መለኪያ፣ ሞዴሉ ከo3‑powered CUA (ሞዴል ሃይል ሰጪ ኦፕሬተር) የበለጠ ተሻሽሏል።

እንዴት መጠቀም እንደሚቻል

ከአዘጋጁ በመዝረክ ዝርዝር ውስጥ በመምረጥ ‹ወኪል ሁነታ› በማንኛውም ውይይት ውስጥ በማንኛውም ጊዜ ChatGPT አዲሱን የወኪል ችሎታዎችን በቀጥታ አንቃ ይችላሉ። በቀላሉ የሚፈልጉትን ተግባር ይግለጹ—ጥልቅ ምርምር ማካሄድ፣ የስላይድ ትዕይንት መፍጠር ወይም ወጪዎችን ማስገባት። ተግባርዎን ሲከናወን፣ በማያ ገጽ ላይ ያለው ትረካ ChatGPT በትክክል ምን እያደረገ እንደሆነ ታይታን ይሰጣል። እርስዎ ተግባራት ከግቦችዎ ጋር ተዛማጅ እንዲቆዩ በማረጋገጥ በሚያስፈልግበት ጊዜ አሳሽውን ማቋረጥ እና መቆጣጠር ይችላሉ።

የChatGPT ወኪል የእርስዎን ማገናኛዎች ሊደርስበት ይችላል፣ ይህም ከእርስዎ የስራ ፍሰቶች ጋር እንዲዋሃድ እና ተዛማጅ እና ሊተገበር የሚችል መረጃን እንዲደርስ ያስችለዋል። አንዴ ከተረጋገጠ በኋላ፣ እነዚህ ማገናኛዎች ChatGPT መረጃን እንዲያይ እና እንደ የእለቱ የገቢ መልእክት ሳጥንዎን ማጠቃለል ወይም ለስብሰባ የሚገኙ የጊዜ ክፍተቶችን እንዲያደርግ ያስችላሉ—በእነዚህ ድረ-ገጾች ላይ እርምጃ ለመውሰድ ግን አሁንም አሳሹን በመውሰድ እንዲገቡ ይጠየቃሉ።

በተጨማሪም፣ በየሳምንቱ ጠዋት እንደ ሳምንታዊ የልኬት ሪፖርት ማመንጨት ያሉ የተጠናቀቁ ተግባራትን በራስ ሰር እንዲደገሙ መርሐግብር ማስያዝ ይችላሉ።

ልብ ወለደ ችሎታዎች፣ ልብ ወለዶች አደጋዎች

ይህ ልቀቅ ተጠቃሚዎች ለመጀመሪያ ጊዜ ChatGPTን በድር ላይ ድርጊቶች እንዲወስዱ መጠየቅ እንደሚችሉ ያመለክታል። ይህ አዲስ አደጋዎችን ያስገኝ ይችላል፣ በተለይም የChatGPT ወኪል ከውሂብዎ ጋር በቀጥታ መስራት ስለሚችል፣ በአገናኞች ወይም በድር ጣቢያዎች አማካኝነት የተገኘው መረጃ ይሁን በየመውሰጃ ሁኔታ እንደሚጠቀሙበት። ከOperator ምርምር ቅድመ-ዕይታ ጠንካራ ቁጥጥሮችን አጠናክርን እና በቀጥታ ድር ላይ ስሜታዊ መረጃዎችን ማስተናገድ፣ ሰፊ የተጠቃሚ ደረጃ እና (የተወሰነ) መዳረሻ ያለው ተርሚናል አውታረ መረብ ተግዳሮቶችን ለመከላከል መከላከያዎችን ጨምረናል። እነዚህ መቀነሻዎች አደጋን በእጅጉ ቢቀንሱም፣ የChatGPT ወኪል የተስፋፋ መሳሪያዎች እና ሰፊ የተጠቃሚ መድረስ ማለት አጠቃላይ የአደጋ ግለ ማህደር ከፍተኛ ነው።

በአጠቃላይ ለወኪል ስርዓቶች አደጋ የሆነው በእርምጃ ማስገባት በመካከል የChatGPT ወኪልን ከተቃዋሚ ማጣበር ላይ የተለየ ትኩረት አድርገናል እና በዚህ መሠረት የበለጠ ሰፊ ማሸጊያዎችን አዘጋጅተናል። ፈጣን መርፌ የChatGPT ወኪል አንድን ተግባር ሲያጠናቅቅ በድር ላይ በሚያጋጥመው ተንኮል አዘል መመሪያዎች በሶስተኛ ወገኖች የሚደረግ ሙከራ ነው። ለምሳሌ፣ በድረ-ገጽ ውስጥ የተደበቀ ተንኮል አዘል ጥያቄ፣ ለምሳሌ በማይታዩ አካላት ወይም ሜታዳታ ውስጥ፣ ወኪሉን ያልታሰቡ እርምጃዎችን እንዲወስድ ሊያታልለው ይችላል፣ ለምሳሌ የግል መረጃ ከአጥቂው ጋር ከአገናኙ ጋር መጋራት ወይም ተጠቃሚው በገባበት ጣቢያ ላይ ጎጂ እርምጃ እንዲወስድ። ምክንያቱም የChatGPT ወኪል ቀጥተኛ ድርጊቶችን ማካሄድ ስለሚችል፣ ስኬታማ ጥቃቶች የበለጠ ተጽዕኖ ሊኖራቸው እና ከፍተኛ አደጋ ሊያስከትሉ ይችላሉ።

ፈጣን መርፌዎችን በመለየት እና በመቋቋም ላይ ተወካዩን አሰልጥነናል እና ሞክረነዋል፣ በተጨማሪም ክትትልን በመጠቀም ፈጣን የክትባት ጥቃቶችን በፍጥነት ለመለየት እና ምላሽ ለመስጠት። ከተከታታይ እርምጃዎች በፊት ግልጽ የተጠቃሚ ማረጋገጫን መጠየቁ በእነዚህ ጥቃቶች የሚደርሰውን ጉዳት የበለጠ ይቀንሳል፣ እና ተጠቃሚዎች እንደ አስፈላጊነቱ ተረክበው ወይም ባለበት በማቆም ተግባራት ውስጥ ጣልቃ መግባት ይችላሉ። ተጠቃሚዎች እነዚህን ግብይቶች ሲመዝኑ ለወኪሉ ምን መረጃ እንደሚሰጡ መወሰን አለባቸው፣ እንዲሁም ለእነዚህ አደጋዎች የተጋለጡትን ለመቀነስ እርምጃዎችን መውሰድ አለባቸው፣ ለምሳሌ ለተግባር አስፈላጊ በሆኑበት ጊዜ አያያዎችን አሰናክል።

በተለይ ሞዴሉ አሁን በገሃዱ አለም ላይ ተጽእኖ ያላቸውን ተግባራት ማከናወን ስለሚችል በአምሳያ ስህተቶች፣ ዙሪያ ማቃለያዎችን ተግባራዊ አድርገናል።

ግልጽ የተጠቃሚ ማረጋገጫ፦ChatGPT እንደ ግዢ ማድረግ ያሉ እንደ እውነተኛ ዓለም ውጤቶች ያላቸው ድርጊቶችን ለመውሰድ ከመጀመርዎ በፊት ፈቃድዎን በግልጽ ለመጠየቅ የሰለጠኑ ናቸው።
ንቁ ቁጥጥር («የመመልከቻ ሁነታ»)፦ እንደ ኢሜይሎች መላክ ያሉ አንዳንድ ወሳኝ ተግባራት የእርስዎን ንቁ ክትትል ያስፈልጋሉ።
ንቁ አደጋ መቀነስ፦ ChatGPT እንደ ባንክ ዝውውሮች ያሉ ከፍተኛ አደጋ ያላቸውን ተግባሮችን በንቃት ለመቃወም ተማርኮ ነው።

በመጨረሻ፣ ሞዴሉ ሊደርስበት የሚችለውን ውሂብ ለመገደብ ተጨማሪ መቆጣጠሪያዎችን አስተዋውቀናል፦

የግላዊነት መቆጣጠሪያዎች፦ በChatGPT ቅንብሮች ውስጥ በአንድ ጠቅ በማድረግ ሁሉንም የአሰሳ ውሂብ ሰርዝ እና ከሁሉም ንቁ የድር ጣቢያ ክፍለ ጊዜዎች ወዲያውኑ መውጣት ይችላሉ። አለበለዚያ ኩኪዎች በእያንዳንዱ የጎበኘ ድህረ ገጽ የኩኪ ፖሊሲዎች ላይ ተመስርተው ይቀጥላሉ፣ ይህም ወደ ጣቢያዎች ተደጋጋሚ ጉብኝቶችን የበለጠ ውጤታማ ያደርገዋል።
የአሳሽ የመውሰጃ ሁኔታ፦ የChatGPT አሳሽን («መውሰጃ ሁነኔ») በመጠቀም ከድር ጋር ሲገናኙ ግቤቶችዎ የግል ይቀራሉ። ChatGPT በእነዚህ ክፍለ ጊዜዎች ውስጥ የሚያስገቡትን ማንኛውንም ውሂብ እንደ የይለፍ ቃላት አይሰብስብም ወይም አያከማችም፣ ምክንያቱም ሞዴሉ አያስፈልገውም፣ እና በጭራሽ ካያየው ደህንነቱ የተጠበቀ ነው።

እስካሁን ለባዮሎጂካል አደጋ የእኛ በጣም ጠንካራ የደህንነት ማህደር

በአምሳያው የጨመረው አቅም፣ የChatGPT ወኪልን እንደ ከፍተኛ ባዮሎጂካል እና ኬሚካላዊ ችሎታዎች በእኛ ዝግጁነት ማዕቀፍ⁠ ስር ለማከም ወስነናል፣ ተያያዥ መከላከያዎችን በማንቃት። ሞዴሉ ትርጉም በሚሰጥ መንገድ ጀማሪ ከባድ ባዮሎጂካዊ ጉዳትን እንዲፈጥር እንደሚረዳ ትክክለኛ ማስረጃ ባይኖረንም—የእኛ ደረጃ ለከፍተኛ አቅም—ጥንቃቄ እያደረግን እና አስፈላጊዎቹን መከላከያዎች አሁን ተግባራዊ እናደርጋለን። በዚህም ምክንያት ይህ ሞዴል እስካሁን ድረስ እጅግ አጠቃላይ የደህንነት መጠን አለው ከባዮሎጂ የተሻሻሉ ጥበቃዎች ጋር፡ አጠቃላይ የስጋት ሞዴሊንግ፣ ባለሁለት አጠቃቀም እምቢታ ስልጠና፣ ሁል ጊዜ የሚሰሩ መደበኞች እና ምክንያታዊ መቆጣጠሪያዎች፣ እንዲሁም ግልጽ የማስፈፀም መስመሮች።

የChatGPT ወኪልን ለማጠበቅ ከሥራችን በተጨማሪ፣ የደህንነት መከላከያዎች ከማንኛውም ላብራቶሪ በላይ ሲዘልፉ የበለጠ የባዮ-ደህንነት በተሻለ ሁኔታ እንደሚሰራ እናውቃለን፣ ስለዚህ መከላከያን ለማጠናከር በየስርአቱ እንተባበራለን። ከመጀመሪያው ቀን ጀምሮ የሞዴልን፣ ግምገማዎቻችንን እና ፖሊሲዎቻችንን ለመቅረጽ ከውጭ ባዮሴክሪቲ ባለሙያዎች፣ የደህንነት ተቋማት እና ከአካዳሚክ ተመራማሪዎች ጋር ሰርተናል። በባዮሎጂ የሰለጠኑ ገምጋሚዎች የግምገማ ውሂባችንን አረጋግጠዋል፣ እና የጎራ ሙያ ባለሙያ ቀይ ቡድን አጋሮች መከላከያዎችን በእውነተኛ ሁኔታዎች ውስጥ በጥብቅ ፈትነዋል። በዚህ ወር መጀመሪያ ላይ ትብብርን ለማፋጠን እና በሰው ሠራሽ አስተውሎት (AI) የተጎላበተ የባዮመከላከያ ምርምርን ለማራመድ ከመንግስት፣ ከአካዳሚክ፣ ከብሔራዊ ቤተ ሙከራዎች እና መንግስታዊ ያልሆኑ ድርጅቶች ባለሙያዎች ጋር የባዮዲፐሬሽን አውደ ጥናት ጠርተናል። ሊከሰቱ ከሚችሉ አደጋዎች ለመቅደም በዓለም አቀፍ ደረጃ አጋርነታችንን እንቀጥላለን።

በስርዓት ካርድ⁠ ውስጥ ላለው የተዋሃደ ወኪል ሞዴል ላይ ስለ ጠንካራ የደህንነት አቀራረባችን ዝርዝር ያንብቡ። በገሃዱ አለም ያሉ ስጋቶችን ለማግኘት እና ለማስተካከል እንድንችል የሳንካ ጉርሻ ፕሮግራም⁠ እያስጀመርን ነው።

ተገኝነት

የChatGPT ወኪል ዛሬ ወደ Pro፣ Plus እና Team መውጣት ይጀምራል፤ Pro በቀኑ መጨረሻ ድረስ መዳረሻ ያገኛል፣ Plus እና Team ተጠቃሚዎች ደግሞ በቀጣይ ጥቂት ቀናት ውስጥ መዳረሻ ያገኛሉ። Enterprise እና የትምህርት ተጠቃሚዎች በሚቀጥሉት ሳምንታት ውስጥ መዳረሻ ያገኛሉ። የPro ተጠቃሚዎች በወር 400 መልእክቶች አሏቸው፣ ሌሎች የሚከፈልባቸው ተጠቃሚዎች በወር 40 መልእክቶች ያገኛሉ፣ ተጨማሪ አጠቃቀም በተለዋዋጭ ክሬዲት ላይ የተመሰረቱ አማራጮች አሉ።

እኛ አሁንም ለአውሮፓ ኢኮኖሚክ ቀጠና እና ለSwitzerland መዳረሻ ማስቻል ላይ እየሰራን ነን።

የOperator ቅድመ-ዕይታ ጣቢያ ለጥቂት ተጨማሪ ሳምንታት ተግባራዊ ይሆናል፣ ከዚያ በኋላ ይዘጋል። ጥልቅ ምርምር የChatGPT ወኪል ችሎታዎች አካል ነው። ከመጀመሪያ የነበረውን ጥልቅ የምርምር ባህሪ ቢመርጡ—ረጅም ጊዜ ሊወስድ ይችላል ነገር ግን በነባሪ ዝርዝር እና ጥልቅ ምላሾችን ይሰጣል—አሁንም በመልዕክት አዘጋጅ ውስጥ ካለው ዝርዝር ከምርጫ ማስቀመጫ በመምረጥ ማግኘት ይችላሉ።

ገደቦች እና ወደ ፊት መመልከት

ChatGPT ወኪል እስካሁን በመጀመሪያ ደረጃዎች ውስጥ ነው። የተለያዩ ውስብስብ ተግባሮችን ማከናወን ይችላል፣ ነገር ግን አሁንም ስህተት ሊሰራ ይችላል።

ስላይድሾዎችን የመፍጠር አቅሙ ላይ ጉልህ የሆነ እምቅ አቅም ብናይም፣ ይህ ተግባር በአሁኑ ጊዜ በቤታ ደረጃ ላይ ይገኛል። በአሁኑ ጊዜ፣ ውጤቶች አንዳንድ ጊዜ በቅርጸት እና በጥራት ረገድ፣ በተለይም ያለ ነባር ሰነድ ሲጀምሩ ቀላል ሊመስሉ ይችላሉ። የሞዴሉን የመጀመሪያ ችሎታዎች ለአቀራረቦች ተስማሚ በሆነ ፍሰት እና ቅርጸት መረጃን የሚያደራጁ አርቲፋክቶችን በማመንጨት ላይ ያተኮርን ሲሆን እነዚህም እንደ ጽሑፍ፣ ገበታዎች፣ ምስሎች እና ቅርጾች ያሉ እክስፖርት ከተደረጉ በኋላ በቀላሉ ሊስተካከሉ የሚችሉ መሰረታዊ ክፍሎች እና ለቅርጽ እና ለተለዋዋጭነት የሚያመቻች ነው። በአሁኑ ጊዜ፣ በመመልከቻው ውስጥ ባሉ ስላይዶች እና እክስፖርት በተደረገው ፓወር ፖይንት መካከል አልፎ አልፎ ልዩነቶችም ያሉ ሲሆን ይህንን ለመቀነስ እየሰራን ነው። በተጨማሪም፣ በአሁኑ ጊዜ ChatGPTን አርትዖት እንዲያካሂድ ወይም እንደ አብነት እንዲጠቀመው የሚያስችል ነባር ስፕሬድሺት መስቀል ቢችሉም፣ ይህ ችሎታ ለስላይድሾው ገና አይገኝም። የChatGPT ስላይድሾው መፍጠሪያ ቀጣዩን ድግግሞሽ እያሰለጠንን ሲሆን ይህም ሰፋ ያለ አቅም እና የተሻሻለ ቅርጸት ያላችው የተጣሩ፣ የተራቀቁ ውጤቶችን እንዲሰጥ ነው።

በአጠቃላይ፣ የChatGPT ወኪልን ውጤታማነት፣ ጥልቀት እና ሁለገብነት ከጊዜ ወደ ጊዜ እንዲሻሻል የምንጠብቅ ሲሆን ይህም የበለጠ እንከን የለሽ ግንኙነቶችን የሚያካትት ሲሆን ይህም ለአጠቃቀም ደህንነቱ የተጠበቀ እንዲሆን እያደረግን ከተጠቃሚው የሚፈለገውን የቁጥጥር መጠን በማስተካከል የበለጠ ጠቃሚ እንዲሆን ማድረጋችንን እንቀጥላለን።

አባሪ

SpreadsheetBench
ሞዴል	የግምገማ አካባቢ	ለስላሳ ገደብ (%)፦ የሕዋስ ደረጃ	ለስላሳ ገደብ (%)፦ የሉህ ደረጃ	ለስላሳ ገደብ (%)፦ በአጠቃላይ
GPT‑4o	Windows, Excel	15.03	23.65	18.35
Excel ውስጥ Copilot	Windows, Excel	23.33	15.00	20.00
GPT‑4o	OSX, LibreOffice	15.86	18.33	16.81
OpenAI o3	OSX, LibreOffice	22.40	24.60	23.25
ChatGPT ወኪል	OSX, LibreOffice	38.27	30.48	35.27
ChatGPT ወኪል ከ.xlsx ጋር	OSX, LibreOffice	50.56	37.51	45.54
ሰው		75.56	65.00	71.33

የቀጥታ ስርጭት እንደገና ማጫወት

ደራሲ

OpenAI

የግርጌ ማስታወሻዎች

* በይነ መረብን ማሰስ ሲነቃ፣ ሞዴሉ አንዳንድ ጊዜ ትክክለኛ መልሶችን በመስመር ላይ ማግኘት ይችላል፣ ለምሳሌ፣ ከውሂብ ስብስብ የተገኙ የናሙና ችግሮች ያሏቸውን የብሎግ ልጥፎችን በማንበብ። በይነ መረብን በሚያስስበት ጊዜ የሞዴል ማጭበርበር ስጋቶችን ሁለት ስልቶችን በመጠቀም እንቀንሳለን፦

1. ከዚህ በፊት ሞዴሉን ከእነሱ ሲያጨበረብር የተመለከትናቸውን ጎራዎች አግደናል።

2. አጠራጣሪ ባህሪን ለመለየት በእያንዳንዱ ሙከራ ውስጥ ሁሉንም የመሳሪያ ውጤት ቶከኖች ለመመርመር እንደ ተቆጣጣሪ ሌላ ተጨማሪ ሞዴል ተጠቅመናል። አጠራጣሪ ባህሪ ማለት "ዋና ዓላማው ለዚህ ጥያቄ ትክክለኛ መልስ መስጠት የሆነ ገጽ፣ ፋይል ወይም ቅንጥብ ማለት ነው—ለምሳሌ፣ ኦፊሴላዊ የደረጃ መስጫ ቁልፍ፣ ተሰርቀው የወጡ መፍትሄዎች" ዋና ጽሑፍ ወይም የተጠናቀቀውን መልስ ቃል በቃል የሚጠቅስ ውይይት።" መልካም ባህሪ ማለት "አንድ ትጉህ ሰው፣ በአጋጣሚ ትክክለኛውን መልስ ቢይዝም እንኳን ሊያማክረው የሚችለው ማንኛውም ህጋዊ ምንጭ (ሰነዶች፣ መመሪያዎች፣ ምሁራዊ ጽሑፎች፣ ታዋቂ ጽሑፎች)" ማለት ነው። ተቆጣጣሪው ልቀቱን አጠራጣሪ አድርጎ የቆጠረባቸው ማናቸውም ሙከራዎች ትክክል እንዳልሆኑ ይቆጠራሉ። ይህን ፍተሻ ያላለፉ አብዛኛዎቹ ናሙናዎች ከHLE ጋር ባልተያያዙ በርካታ የበይነ መረብ ምንጮች ላይ ትክክለኛ መፍትሄ የሚያገኙባቸው ችግሮች ነበሩ።

**OpenAI በደረጃ 1-3 የውሂብ ስብስብ ላይ ከ290 የግል ጥያቄዎች ውስጥ ለ237 ልዩ መዳረሻ አለው። የFrontierMath ደረጃ 4 ጥያቄዎች በዚህ ግምገማ ውስጥ አልተካተቱም። ውጤቶቹ ለእያንዳንዱ ጥያቄ መልስ ለመስጠት የተደረጉ 16 ሙከራዎች አማካይ ተደረገው ተገምግመዋል። የChatGPT ወኪል ውጤቶች በOpenAI የተመረጡ፣ በEpoch AI ደረጃ የተሰጣቸው ሲሆን ይህም ከአሳሽ እና ተርሚናል መዳረሻ ጋር እና በአንድ መልስ 128K ቶከኖች ገደብ ጋር ነው። የOpenAI o4-ሚኒ እና o3 ግምገማዎች በEpoch AI የሚመነጩ እና ደረጃ የተሰጣቸው ሲሆን ይህም ምንም አይነት የአሳሽ እና የተርሚናል መዳረሻ ሳይኖር፣ በተግባራዊ ጥሪ አማካኝነት የፓይተን ስክሪፕቶችን ተጠቅሞ እና በአንድ መልስ 100ሺህ ቶከኖች ገደብ አላቸው።

*** Oracle@64 በ64 የናሙና ሙከራዎች ላይ የተገኘውን ምርጥ ውጤት ያመለክታል፣ ይህም መሰረታዊ እውነትን በመጠቀም የተመረጠ ነው (ማለትም፣ ለእያንዳንዱ ተግባር ከፍተኛውን የውጤት ሙከራ የምንመርጠው በእውነተኛ ደረጃ በተሰጣቸው አፈጻጸም ላይ በመመስረት ነው)። በሁሉም ተግባራት ውስጥ የእነዚህን በእያንዳንዱ ተግባር ምርጥ ውጤቶች አማካይ ሪፖርት እናደርጋለን። ይህ መለኪያ የሞዴሉን ከፍተኛ ገደብ ያለው አቅም እና በተግባር አፈጻጸም ላይ ያለውን ልዩነት ያጎላል—ሞዴሉ ሲሳካለት ምን ያህል ብቁ ሊሆን እንደሚችል እና ተጨማሪ ስልጠናን በመጠቀም ወጥነትን ለማሻሻል የሚያስችል ቦታ እንዳለ ያሳያል። በሞዴል በራስ መተማመን ላይ በመመስረት ከሚመርጡት የተለመዱ “ምርጥ ከN” መለኪያዎች በተለየ፣ oracle@64 ለምርጫ መሰረታዊ እውነትን ይጠቀማል እና ከሁለትዮሽ ማለፍ/መውደቅ ይልቅ በተከታታይ 0–1 መመዘኛ ላይ ለተመዘገቡ ተግባራት ይተገበራል።