25 de março de 2026

Apresentamos o programa Safety Bug Bounty da OpenAI

Testes de segurança e abuso em toda a OpenAI

Hoje, a OpenAI está lançando um programa público Safety Bug Bounty⁠(abre em uma nova janela) voltado a identificar abuso de IA e riscos de segurança em nossos produtos. À medida que a tecnologia de IA evolui rapidamente, também evoluem as formas potenciais de uso indevido. Nosso objetivo é garantir que nossos sistemas permaneçam seguros e protegidos contra uso indevido ou abuso que possa levar a danos concretos.

Este novo programa complementará o Security Bug Bounty⁠(abre em uma nova janela) da OpenAI ao aceitar problemas que representem riscos relevantes de abuso e segurança, mesmo que não atendam aos critérios de uma vulnerabilidade de segurança. Por meio deste programa, esperamos continuar em parceria com pesquisadores de segurança e de segurança de IA para nos ajudar a identificar e tratar problemas que ficam fora das vulnerabilidades de segurança convencionais, mas ainda representam riscos reais. Os envios serão triados pelas equipes de Safety Bug Bounty e Security Bug Bounty da OpenAI e podem ser redirecionados entre os dois programas, dependendo do escopo e da responsabilidade.

Visão geral do programa

O novo programa Safety Bug Bounty⁠(abre em uma nova janela) se concentra em cenários de segurança específicos de IA listados abaixo:

Riscos com agentes, incluindo MCP

Injeção de prompt de terceiros e exfiltração de dados: quando texto do atacante consegue sequestrar de forma confiável o agente da vítima (incluindo Browser, ChatGPT Agent e produtos com agentes semelhantes) para enganá-lo e fazê-lo executar uma ação nociva ou vazar informações sensíveis do usuário. O comportamento deve ser reproduzível em pelo menos 50% das vezes.
Um produto da OpenAI com agentes executa uma ação não permitida no site da OpenAI em escala.
Um produto da OpenAI com agentes executa alguma ação potencialmente nociva não listada acima. Relatórios válidos aqui devem indicar um dano plausível e significativo.
Qualquer teste de risco de MCP deve cumprir os termos de serviço de terceiros.

Informações proprietárias da OpenAI

Respostas do modelo que retornem informações proprietárias relacionadas ao raciocínio.
Vulnerabilidades que exponham outras informações proprietárias da OpenAI.

Integridade de conta e plataforma

Vulnerabilidades em sinais de integridade de conta e de plataforma, como contornar controles anti-automação, manipular sinais de confiança da conta, burlar restrições/suspensões/banimentos de conta e problemas semelhantes.
Problemas que permitam que usuários acessem recursos, dados ou funcionalidades além das permissões autorizadas devem ser reportados ao Security Bug Bounty.⁠(abre em uma nova janela)

Embora jailbreaks estejam fora do escopo deste programa, realizamos periodicamente campanhas privadas de bug bounty focadas em certos tipos de dano, como problemas de conteúdo de risco biológico no ChatGPT Agent⁠ e no GPT‑5⁠. Convidamos pesquisadores interessados a se inscrever nesses programas quando eles forem abertos.

Fora das categorias listadas acima, se pesquisadores identificarem falhas que facilitem caminhos diretos para dano ao usuário e medidas de correção acionáveis e específicas, elas podem ser consideradas no escopo de recompensas caso a caso. Contornos gerais de políticas de conteúdo sem impacto demonstrável em segurança ou abuso estão fora do escopo deste programa. Por exemplo, "jailbreaks" que façam o modelo usar linguagem rude ou retornar informações facilmente encontráveis em mecanismos de busca estão fora do escopo.

Como participar

Pesquisadores interessados em participar podem se inscrever pelo nosso programa Safety Bug Bounty⁠(abre em uma nova janela). Estamos ansiosos para trabalhar ao lado de pesquisadores, hackers éticos e da comunidade de segurança e de segurança de IA na busca por um ecossistema de IA seguro.

2026

Autoria

OpenAI

Continuar lendo

Ver tudo

OpenAI e Hugging Face tratam incidente de segurança

Segurança21 de jul. de 2026

Safety and alignment in an era of long-horizon models

Segurança20 de jul. de 2026

Why teens deserve access to safe AI

Segurança16 de jul. de 2026