Hoje, a OpenAI lança o Safety Bug Bounty(abre numa nova janela), um programa público centrado na identificação de abusos relacionados com IA e riscos de segurança em todos os nossos produtos. À medida que a tecnologia de IA evolui rapidamente, também evoluem as formas como pode ser utilizada indevidamente. O nosso objetivo é garantir que os nossos sistemas se mantêm seguros e protegidos contra utilizações indevidas ou abusos que possam causar danos concretos.
Este novo programa complementará o Security Bug Bounty(abre numa nova janela) da OpenAI, aceitando problemas que representem riscos relevantes de abuso e segurança, mesmo que não cumpram os critérios de uma vulnerabilidade de segurança. Através deste programa, esperamos continuar a colaborar com investigadores em segurança da IA e cibersegurança para nos ajudarem a identificar e resolver problemas que ficam fora das vulnerabilidades de segurança convencionais, mas que continuam a representar riscos reais. As submissões serão sujeitas a triagem pelas equipas do Safety Bug Bounty e do Security Bug Bounty da OpenAI, podendo ser encaminhadas entre os dois programas consoante o âmbito e a responsabilidade.
O novo programa Safety Bug Bounty(abre numa nova janela) centra-se nos cenários de segurança específicos da IA indicados abaixo:
Riscos agênticos, incluindo MCP
- Injeção de prompt por terceiros e exfiltração de dados: quando texto malicioso consegue, de forma fiável, sequestrar o agente de uma vítima (incluindo Browser, ChatGPT Agent e produtos agênticos semelhantes) para o levar a executar uma ação nociva ou a divulgar informações sensíveis do utilizador. O comportamento tem de ser reproduzível em, pelo menos, 50% das vezes.
- Um produto agêntico da OpenAI executa, em grande escala, uma ação não permitida no site da OpenAI.
- Um produto agêntico da OpenAI executa alguma ação potencialmente nociva não indicada acima. Os relatórios válidos aqui devem indicar danos plausíveis e significativos.
- Quaisquer testes de risco de MCP têm de cumprir os termos de serviço de quaisquer terceiros.
Informação proprietária da OpenAI
- Gerações do modelo que devolvem informação proprietária relacionada com o raciocínio.
- Vulnerabilidades que expõem outra informação proprietária da OpenAI.
Integridade da conta e da plataforma
- Vulnerabilidades nos sinais de integridade da conta e da plataforma, como contornar controlos anti-automação, manipular sinais de confiança da conta, contornar restrições/suspensões/banimentos de conta e problemas semelhantes.
- Os problemas que permitam aos utilizadores aceder a funcionalidades, dados ou capacidades além das permissões autorizadas devem ser comunicados ao Security Bug Bounty(abre numa nova janela).
Embora os jailbreaks estejam fora do âmbito deste programa, realizamos periodicamente campanhas privadas de bug bounty centradas em determinados tipos de danos, como questões de conteúdo de risco biológico no ChatGPT Agent e no GPT‑5. Convidamos os investigadores interessados a candidatarem-se a estes programas quando surgirem.
Fora das categorias indicadas acima, se os investigadores identificarem falhas que facilitem vias diretas para danos ao utilizador e para as quais existam medidas de remediação acionáveis e discretas, estas podem ser consideradas elegíveis para recompensa caso a caso. Formas genéricas de contornar as políticas de conteúdo sem impacto demonstrável em segurança ou abuso estão fora do âmbito deste programa. Por exemplo, «jailbreaks» que façam com que o modelo utilize linguagem rude ou devolva informação facilmente encontrável através de motores de busca estão fora do âmbito.
Os investigadores interessados em participar podem candidatar-se através do nosso programa Safety Bug Bounty(abre numa nova janela). Esperamos trabalhar lado a lado com investigadores, hackers éticos e a comunidade de segurança da IA e cibersegurança na promoção de um ecossistema de IA seguro.


