25 ማርች 2026

የOpenAI የደህንነት በግ ባውንቲ ፕሮግራምን ማስተዋወቅ

በOpenAI ውስጥ የደህንነት እና የአጠቃቀም ጉዳዮች ሙከራ

ዛሬ፣ OpenAI በምርቶቻችን ዙሪያ ያሉ የኤ.አይ አላግባብ አጠቃቀም እና የደህንነት ስጋቶችን መለየት ላይ ያተኮረ የሕዝብ የደህንነት የበግ ባውንቲ⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ፕሮግራም እያስጀመረ ነው። የኤ.አይ ቴክኖሎጂ በፍጥነት እያደገ ሲሄድ፣ አላግባብ ጥቅም ላይ ሊውል የሚችልበት መንገዶችም እንዲሁ ይጨምራሉ። ግባችን ስርዓቶቻችን ተጨባጭ ጉዳት ሊያስከትል ከሚችል አላግባብ አጠቃቀም ወይም በደል ደህንነታቸው የተጠበቀ ሆነው መቆየታቸውን ማረጋገጥ ነው።

ይህ አዲስ ፕሮግራም ምንም እንኳን ለደኅንነት ተጋላጭነት የተቀመጡትን መስፈርቶች ባያሟሉም የOpenAI የደኅንነት በግ ባውንቲ⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ጉልህ የሆኑ የብዝበዛ እና የደህንነት ስጋቶችን የሚያስከትሉ ጉዳዮችን ያሟላል። በዚህ ፕሮግራም አማካኝነት፣ ከደህንነት እና ጥበቃ ተመራማሪዎች ጋር አጋርነታችንን ለመቀጠል በጉጉት እንጠባበቃለን፤ ይህም በተለመዱ የደኅንነት ተጋላጭነቶች ክልል ውስጥ የማይወድቁ ነገር ግን እውነተኛ አደጋዎችን የሚያስከትሉ ጉዳዮችን እንድንለይ እና እንድንፈታ ይረዳናል። ግቤቶች በOpenAI የደህንነት እና ጥበቃ በግ ባውንቲ ቡድኖች በቅድሚያ ይመዘናሉ፣ እና እንደ ወሰኑ እና ባለቤትነቱ በሁለቱ ፕሮግራሞች መካከል እንደገና ሊመሩ ይችላሉ።

የፕሮግራሙ አጠቃላይ ዕይታ

አዲሱ የደህንነት በግ ባውንቲ⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ፕሮግራም ከዚህ በታች በተዘረዘሩት ለኤ.አይ ልዩ በሆኑ የደህንነት ሁኔታዎች ላይ ያተኩራል፡

MCPን ጨምሮ የኤጀንቲክ አደጋዎች

በሦስተኛ ወገን የሚደረግ ፈጣን መርፌ እና የውሂብ ስርቆት፦ የአጥቂ ጽሑፍ ጎጂ ድርጊት እንዲፈጽም ወይም የተጠቃሚውን ሚስጥራዊ መረጃ እንዲለቅ ለማታለል የተጎጂውን ኤጀንት (አሳሽ፣ የChatGPT ኤጀንት እና ተመሳሳይ ኤጀንቲክ ምርቶችን ጨምሮ) በእርግጠኝነት መቆጣጠር ሲችል። ይህ ባህሪ ቢያንስ 50% እንደገና መፈጠር የሚችል መሆን አለበት።
አንድ ኤጀንቲክ የOpenAI ምርት በOpenAI ድህረ ገጽ ላይ በስፋት የማይፈቀድ ድርጊት ያከናውናል።
አንድ ኤጀንቲክ የOpenAI ምርት ከላይ ያልተጠቀሰ ጎጂ ሊሆን የሚችል ድርጊት ያከናውናል። እዚህ ያሉ ተቀባይነት ያላቸው ሪፖርቶች አሳማኝ እና ተጨባጭ ጉዳትን ማመልከት አለባቸው።
የMCP አደጋን ለመፈተሽ የሚደረግ ማንኛውም ሙከራ ለማናቸውም የሦስተኛ ወገኖች የአገልግሎት ውሎች ተገዢ መሆን አለበት።

የOpenAI የባለቤትነት መረጃ

ከማመዛዘን ጋር የተያያዘ የባለቤትነት መረጃን የሚመልሱ የሞዴል ትውልዶች።
ሌሎች የOpenAI የባለቤትነት መረጃን የሚገልጡ ተጋላጭነቶች።

የመለያ እና የመድረክ ታማኝነት

በመለያ ታማኝነት እና መድረክ ታማኝነት ምልክቶች ውስጥ ያሉ ተጋላጭነቶች፣ እንደ ፀረ ራስ-ሰር መቆጣጠሪያዎችን ማለፍ፣ የመለያ ታማኝነት ምልክቶችን ማዛባት፣ የመለያ ገደቦችን/እገዳዎችን/ክልከላዎችን መሸሽ፣ እና ተመሳሳይ ጉዳዮች።
ተጠቃሚዎች ከተፈቀዱ ፈቃዶች አልፈው ባህሪያት፣ ውሂብ ወይም ተግባራትን እንዲደርሱ የሚያስችሉ ጉዳዮች ለ ደኅንነት በግ ባውንቲ⁠(በአዲስ መስኮት ውስጥ ይክፈታል) ሪፖርት መደረግ አለባቸው።

ጥሰቶች ለዚህ ፕሮግራም ከወሰን ውጭ ቢሆኑም፣ እኛ በየጊዜው በተወሰኑ የጉዳት አይነቶች ላይ ያተኮሩ የግል በግ ባውንቲ ዘመቻዎችን እናካሂዳለን፣ እነዚህም ChatGPT Agent⁠ እና GPT‑5⁠ ውስጥ ያሉ የBiorisk ይዘት ጉዳዮች ናቸው። ፍላጎት ያላቸው ተመራማሪዎች እነዚህ ፕሮግራሞች በሚኖሩበት ጊዜ እንዲያመለክቱ እንጋብዛለን።

ከላይ ከተዘረዘሩት ምድቦች ውጭ፣ ተመራማሪዎች በቀጥታ ወደ ተጠቃሚ ጉዳት የሚያመሩ ጉድለቶችን እና ተግባራዊ እና ግልጽ የማስተካከያ እርምጃዎችን ከለዩ፣ እነዚህ እንደ ጉዳዩ ለሽልማት ብቁ ከሆኑት ወሰን ውስጥ ሊቆጠሩ ይችላሉ። በግልጽ የሚታይ የደህንነት ወይም የአላግባብ አጠቃቀም ተጽዕኖ ሳይኖር አጠቃላይ የይዘት-ፖሊሲ ማለፎች ለዚህ ፕሮግራም ከወሰን ውጪ ናቸው። ለምሳሌ፣ ሞዴሉ ጨዋነት የጎደለው ቋንቋ እንዲጠቀም ወይም በፍለጋ ሞተሮች አማካኝነት በቀላሉ ሊገኝ የሚችል መረጃ እንዲመልስ የሚያደርጉ “ጥሰቶች” ከወሰን ውጪ ናቸው።

እንዴት መሳተፍ እንደሚቻል

ለመሳተፍ ፍላጎት ያላቸው ተመራማሪዎች በእኛ የደኅንነት በግ ባውንቲ ፕሮግራም⁠(በአዲስ መስኮት ውስጥ ይክፈታል) በኩል ማመልከት ይችላሉ። ደኅንነቱ የተጠበቀ የኤ.አይ ሥነ-ምህዳርን ለማሳካት ከተመራማሪዎች፣ ሥነ-ምግባር ካላቸው ጠላፊዎች እና ከደህንነት እና ጥበቃ ማህበረሰብ ጋር ጎን ለጎን ለመስራት በጉጉት እንጠባበቃለን።

2026

ደራሲ

OpenAI

ማንበብዎን ይቀጥሉ

ሁሉንም ይመልከቱ

OpenAI እና Hugging Face የደህንነት ክስተትን ይፈታሉ

ደኅንነትጁላይ 21 2026

Safety and alignment in an era of long-horizon models

ደህንነትጁላይ 20 2026

Why teens deserve access to safe AI — card image

ታዳጊዎች ደህንነቱ የተጠበቀ AI መዳረሻ ለምን ይገባቸዋል

ደህንነትጁላይ 16 2026