Преминаване към основното съдържание
OpenAI

Представяме програмата на OpenAI за награди за откриване на бъгове, свързани с безопасността

Тестване за въпроси, свързани с безопасността и злоупотребите в OpenAI

Днес OpenAI стартира публична програма за награди за откриване на бъгове, свързани с безопасността(отваря се в нов прозорец), насочена към идентифициране на злоупотреби с ИИ и рискове за безопасността в нашите продукти. С бързото развитие на технологиите за ИИ се увеличават и потенциалните начини за злоупотреба с тях. Нашата цел е да гарантираме, че нашите системи са безопасни и защитени срещу неправомерна употреба или злоупотреба, които биха могли да доведат до реална вреда. 

Тази нова програма ще допълни програмата на OpenAI за награди за откриване на бъгове в сигурността(отваря се в нов прозорец), като приема проблеми, които представляват значителни рискове, свързани със злоупотреба и безопасност, дори ако не отговарят на критериите за уязвимост в сигурността. Чрез тази програма се надяваме да продължим да си сътрудничим с изследователи в областта на безопасността и сигурността, за да ни помагат да идентифицираме и решаваме проблеми, които не попадат в обхвата на традиционните уязвимости в сигурността, но все пак представляват реални рискове. Подадените сигнали ще бъдат класифицирани от екипите на OpenAI по програмата за награди за откриване на бъгове, свързани с безопасността и сигурността, и може да бъдат пренасочвани между двете програми в зависимост от обхвата и отговорността.

Общ преглед на програмата

Новата програма за награди за откриване на бъгове, свързани с безопасността(отваря се в нов прозорец), е насочена към специфичните за ИИ сценарии за безопасност, изброени по-долу:

Агентни рискове, включително MCP

  • Инжектиране на подкани от трета страна и ексфилтрация на данни: когато текст от нападател може надеждно да отвлече агент на жертвата (включително браузър, ChatGPT Agent и подобни агентни продукти), за да го подмами да извърши вредно действие или да разкрие чувствителната информация на потребителя. Поведението трябва да може да се възпроизведе поне в 50% от случаите. 
  • Агентен продукт на OpenAI извършва непозволено действие на уебсайта на OpenAI в голям мащаб.
  • Агентен продукт на OpenAI извършва потенциално вредно действие, което не е изброено по-горе. Валидните доклади тук трябва да посочват правдоподобна и съществена вреда.
  • Всяко тестване за риск, свързан с MCP, трябва да спазва условията за ползване на трети страни.

Авторска информация на OpenAI

  • Генерации на модел, които връщат патентована информация, свързана със структурирано анализиране.
  • Уязвимости, които разкриват друга патентована информация на OpenAI.

Цялост на акаунта и платформата

  • Уязвимости в сигналите за целостта на акаунта и платформата, като например заобикаляне на анти-автоматизационни контроли, манипулиране на сигнали за доверие в акаунта, избягване на ограничения, временно спиране или забрани на акаунта и подобни проблеми.
  • Проблеми, които позволяват на потребителите да получават достъп до функции, данни или функционалности извън разрешените им права за достъп, трябва да бъдат докладвани чрез програмата за награди за откриване на бъгове, свързани със сигурността(отваря се в нов прозорец).

Въпреки че „джейлбрейковете“ са извън обхвата на тази програма, ние периодично провеждаме частни кампании за награди за откриване на бъгове, насочени към определени видове вреди, като например проблеми със съдържание, свързано с биорискове, в ChatGPT Agent и GPT‑5. Каним заинтересованите изследователи да кандидатстват за тези програми, когато те станат достъпни. 

Извън изброените по-горе категории, ако изследователите установят недостатъци, които водят до преки рискове за потребителите и предлагат конкретни, приложими стъпки за отстраняването им, те могат да бъдат разглеждани като попадащи в обхвата на възнагражденията за всеки отделен случай. Общото заобикаляне на политиките за съдържание, което няма доказуемо въздействие върху безопасността или злоупотребата, не попада в обхвата на тази програма. Например „джейлбрейкове“, които водят до това моделът да използва груб език или да предоставя информация, която лесно може да бъде намерена чрез търсачки, не попадат в обхвата.

Как да участвате

Изследователите, които се интересуват от участие, могат да кандидатстват чрез нашата програма за награди за откриване на бъгове, свързани с безопасността(отваря се в нов прозорец). Очакваме с нетърпение да работим съвместно с изследователи, етични хакери и общността в областта на безопасността и сигурността в стремежа си да постигнем сигурна екосистема за ИИ.

Автор

OpenAI