Oggi OpenAI lancia il programma pubblico Safety Bug Bounty(si apre in una nuova finestra) per individuare abusi dell’IA e rischi per la sicurezza nei propri prodotti. Con la rapida evoluzione dell’IA aumentano anche i modi in cui può essere usata impropriamente. Il nostro obiettivo è garantire sistemi sicuri e protetti da usi impropri o abusi che possono causare danni concreti.
Questo nuovo programma integrerà il Security Bug Bounty(si apre in una nuova finestra) di OpenAI e accetta segnalazioni di rischi reali legati ad abusi e sicurezza, anche se non rientrano nelle vulnerabilità classiche. Con questo programma vogliamo continuare a collaborare con ricercatori di sicurezza per individuare e risolvere problemi che non sono vulnerabilità tradizionali ma comportano comunque rischi reali. Le segnalazioni vengono analizzate dai team Safety e Security di OpenAI e possono essere riassegnate tra i programmi in base all’ambito e alla responsabilità.
Il nuovo programma Safety Bug Bounty(si apre in una nuova finestra) si concentra sugli scenari di sicurezza specifici dell’IA elencati di seguito:
Rischi agentici, incluso MCP
- Iniezione di prompt di terze parti ed esfiltrazione di dati: quando il testo di un attaccante riesce a compromettere l’agente di una vittima, inclusi browser, ChatGPT Agent e prodotti simili, inducendolo a compiere azioni dannose o a divulgare informazioni sensibili. Il comportamento deve essere riproducibile almeno nel 50% dei casi.
- Un prodotto agentico di OpenAI esegue su larga scala un’azione non consentita sul sito OpenAI.
- Un prodotto agentico di OpenAI compie un'azione potenzialmente dannosa non elencata sopra. Le segnalazioni valide devono dimostrare un danno plausibile e concreto.
- Qualsiasi test relativo al rischio MCP deve rispettare i termini di servizio delle terze parti coinvolte.
Informazioni proprietarie di OpenAI
- Generazioni del modello che restituiscono informazioni proprietarie legate al ragionamento.
- Vulnerabilità che espongono altre informazioni proprietarie di OpenAI.
Integrità degli account e della piattaforma
- Vulnerabilità nei segnali di integrità degli account e della piattaforma, come aggirare controlli anti-automazione, manipolare segnali di fiducia, eludere restrizioni, sospensioni o ban e problemi simili.
- I problemi che permettono di accedere a funzionalità, dati o contenuti oltre le autorizzazioni previste vanno segnalati al Security Bug Bounty(si apre in una nuova finestra).
I jailbreak non rientrano in questo programma. Periodicamente però organizziamo campagne private focalizzate su specifici tipi di rischio, come contenuti a rischio biologico in ChatGPT Agent e GPT‑5. Invitiamo i ricercatori interessati a candidarsi a questi programmi quando saranno disponibili.
Se individui difetti che creano percorsi diretti verso danni per gli utenti e includono azioni correttive concrete, possono essere valutati caso per caso per una ricompensa. Gli aggiramenti generici delle policy senza un impatto reale su sicurezza o abusi non rientrano nel programma. Ad esempio i jailbreak che portano a linguaggio offensivo o a informazioni facilmente reperibili online non sono inclusi.
I ricercatori interessati possono candidarsi tramite il programma Safety Bug Bounty(si apre in una nuova finestra). Vogliamo collaborare con ricercatori, hacker etici e la comunità della sicurezza per costruire un ecosistema IA più sicuro.


