2026 ж. 25 наурыз

OpenAI қауіпсіздік қателері үшін сыйақы бағдарламасын таныстырады

OpenAI ауқымындағы қауіпсіздік пен теріс пайдалану мәселелерін тестілеу

Бүгін OpenAI өнімдеріміз бойынша ЖИ-ді теріс пайдалану мен қауіпсіздік тәуекелдерін анықтауға бағытталған жария Safety Bug Bounty⁠(жаңа терезеде ашылады) бағдарламасын іске қосады. ЖИ технологиясы қарқынды дамыған сайын, оны теріс пайдаланудың ықтимал жолдары да көбейеді. Біздің мақсатымыз — жүйелеріміз нақты зиянға әкелуі мүмкін қате пайдалану мен теріс пайдаланудан қауіпсіз әрі қорғалған күйде қалуын қамтамасыз ету.

Бұл жаңа бағдарлама OpenAI-дің Security Bug Bounty⁠(жаңа терезеде ашылады) бағдарламасын толықтырады: ол қауіпсіздік осалдығының өлшемдеріне сай келмесе де, елеулі теріс пайдалану мен қауіпсіздік тәуекелдерін тудыратын мәселелерді қабылдайды. Осы бағдарлама арқылы біз қауіпсіздік және қорғаныс зерттеушілерімен серіктестікті жалғастырып, дәстүрлі қауіпсіздік осалдықтарына жатпайтын, бірақ шынайы тәуекел тудыратын мәселелерді анықтап, шешуге көмектеседі деп үміттенеміз. Өтінімдерді OpenAI-дің Safety және Security Bug Bounty командалары іріктейді, әрі ауқымы мен жауапкершілігіне қарай олар екі бағдарламаның арасында қайта бағытталуы мүмкін.

Бағдарламаға шолу

Жаңа Safety Bug Bounty⁠(жаңа терезеде ашылады) бағдарламасы төменде берілген ЖИ-ге тән қауіпсіздік сценарийлеріне бағытталған:

MCP-ті қоса алғандағы агенттік тәуекелдер

Үшінші тараптың көмексөзге зиян келтіруі және деректерді сыртқа шығару: шабуылдаушы мәтіні жәбірленушінің агентін (соның ішінде Browser, ChatGPT Agent және ұқсас агенттік өнімдерді) сенімді түрде басып алып, оны зиянды әрекет жасауға не пайдаланушының құпия ақпаратын сыртқа шығаруға алдай алатын жағдай. Бұл әрекет кемінде 50% жағдайда қайталанып көрсетілуі керек.
OpenAI-дің агенттік өнімі OpenAI веб-сайтында тыйым салынған әрекетті ауқымды түрде орындайды.
OpenAI-дің агенттік өнімі жоғарыда аталмаған, ықтимал зиянды бір әрекетті орындайды. Мұндағы жарамды есептер ықтимал әрі елеулі зиянды көрсетуі тиіс.
MCP тәуекелін тестілеудің кез келгені кез келген үшінші тараптың қызмет көрсету шарттарына сай болуы керек.

OpenAI-дің меншікті ақпараты

ой қорытуға қатысты меншікті ақпаратты қайтаратын модель жауаптары.
OpenAI-дің басқа меншікті ақпаратын әшкерелейтін осалдықтар.

Аккаунт пен платформаның тұтастығы

Аккаунт тұтастығы мен платформа тұтастығы сигналдарындағы осалдықтар, мысалы автоматтандыруға қарсы бақылауларды айналып өту, аккаунт сенім сигналдарын бұрмалау, аккаунт шектеулерінен/тоқтатуларынан/бұғаттауларынан жалтару және ұқсас мәселелер.
Пайдаланушыларға рұқсат етілген өкілеттіктерден тыс мүмкіндіктерге, деректерге немесе функцияларға қол жеткізуге жол ашатын мәселелер Security Bug Bounty⁠(жаңа терезеде ашылады) бағдарламасына хабарлануы тиіс.

Jailbreak осы бағдарламаның аясынан тыс болғанымен, біз кейде белгілі бір зиян түрлеріне бағытталған жабық bug bounty науқандарын өткіземіз, мысалы ChatGPT Agent⁠ және GPT‑5⁠ ішіндегі биологиялық тәуекел мазмұны мәселелері. Қызығушылық танытқан зерттеушілерді мұндай бағдарламалар ашылған кезде өтініш беруге шақырамыз.

Жоғарыда аталған санаттардан тыс, егер зерттеушілер пайдаланушыға тікелей зиян келтіруге жол ашатын ақауларды және оларды түзетудің нақты, іске асатын, бөлек қадамдарын анықтаса, мұндай жағдайлар сыйақы ауқымында әр жағдай бойынша жеке қарастырылуы мүмкін. Қауіпсіздікке не теріс пайдалануға әсері дәлелденбеген контент саясатын жалпы айналып өтулер бұл бағдарламаның аясынан тыс. Мысалы, модельдің дөрекі тіл қолдануына немесе іздеу жүйелері арқылы оңай табылатын ақпаратты қайтаруына әкелетін «jailbreaks» бұл ауқымға кірмейді.

Қалай қатысуға болады

Қатысуға мүдделі зерттеушілер біздің Safety Bug Bounty⁠(жаңа терезеде ашылады) бағдарламасы арқылы өтініш бере алады. Біз зерттеушілермен, этикалық хакерлермен және қауіпсіздік пен қорғаныс қауымдастығымен бірге қауіпсіз ЖИ экожүйесін құру жолында жұмыс істеуді асыға күтеміз.

2026

Автор

OpenAI

Оқуды жалғастырыңыз

Барлығын қарау

OpenAI мен Hugging Face қауіпсіздік оқиғасын реттеуде

Қауіпсіздік2026 ж. 21 шіл.

Safety and alignment in an era of long-horizon models

Қауіпсіздік2026 ж. 20 шіл.

Why teens deserve access to safe AI

Қауіпсіздік2026 ж. 16 шіл.