25 marzo 2026

Ti presentiamo il programma OpenAI Safety Bug Bounty

Test per problemi di sicurezza e abusi su OpenAI

Oggi OpenAI lancia il programma pubblico Safety Bug Bounty⁠(si apre in una nuova finestra) per individuare abusi dell’IA e rischi per la sicurezza nei propri prodotti. Con la rapida evoluzione dell’IA aumentano anche i modi in cui può essere usata impropriamente. Il nostro obiettivo è garantire sistemi sicuri e protetti da usi impropri o abusi che possono causare danni concreti.

Questo nuovo programma integrerà il Security Bug Bounty⁠(si apre in una nuova finestra) di OpenAI e accetta segnalazioni di rischi reali legati ad abusi e sicurezza, anche se non rientrano nelle vulnerabilità classiche. Con questo programma vogliamo continuare a collaborare con ricercatori di sicurezza per individuare e risolvere problemi che non sono vulnerabilità tradizionali ma comportano comunque rischi reali. Le segnalazioni vengono analizzate dai team Safety e Security di OpenAI e possono essere riassegnate tra i programmi in base all’ambito e alla responsabilità.

Panoramica del programma

Il nuovo programma Safety Bug Bounty⁠(si apre in una nuova finestra) si concentra sugli scenari di sicurezza specifici dell’IA elencati di seguito:

Rischi agentici, incluso MCP

Iniezione di prompt di terze parti ed esfiltrazione di dati: quando il testo di un attaccante riesce a compromettere l’agente di una vittima, inclusi browser, ChatGPT Agent e prodotti simili, inducendolo a compiere azioni dannose o a divulgare informazioni sensibili. Il comportamento deve essere riproducibile almeno nel 50% dei casi.
Un prodotto agentico di OpenAI esegue su larga scala un’azione non consentita sul sito OpenAI.
Un prodotto agentico di OpenAI compie un'azione potenzialmente dannosa non elencata sopra. Le segnalazioni valide devono dimostrare un danno plausibile e concreto.
Qualsiasi test relativo al rischio MCP deve rispettare i termini di servizio delle terze parti coinvolte.

Informazioni proprietarie di OpenAI

Generazioni del modello che restituiscono informazioni proprietarie legate al ragionamento.
Vulnerabilità che espongono altre informazioni proprietarie di OpenAI.

Integrità degli account e della piattaforma

Vulnerabilità nei segnali di integrità degli account e della piattaforma, come aggirare controlli anti-automazione, manipolare segnali di fiducia, eludere restrizioni, sospensioni o ban e problemi simili.
I problemi che permettono di accedere a funzionalità, dati o contenuti oltre le autorizzazioni previste vanno segnalati al Security Bug Bounty⁠(si apre in una nuova finestra).

I jailbreak non rientrano in questo programma. Periodicamente però organizziamo campagne private focalizzate su specifici tipi di rischio, come contenuti a rischio biologico in ChatGPT Agent⁠ e GPT‑5⁠. Invitiamo i ricercatori interessati a candidarsi a questi programmi quando saranno disponibili.

Se individui difetti che creano percorsi diretti verso danni per gli utenti e includono azioni correttive concrete, possono essere valutati caso per caso per una ricompensa. Gli aggiramenti generici delle policy senza un impatto reale su sicurezza o abusi non rientrano nel programma. Ad esempio i jailbreak che portano a linguaggio offensivo o a informazioni facilmente reperibili online non sono inclusi.

Come partecipare

I ricercatori interessati possono candidarsi tramite il programma Safety Bug Bounty⁠(si apre in una nuova finestra). Vogliamo collaborare con ricercatori, hacker etici e la comunità della sicurezza per costruire un ecosistema IA più sicuro.

2026

Autore

OpenAI

Continua a leggere

Visualizza tutto

OpenAI e Hugging Face affrontano un incidente di sicurezza

Sicurezza21 lug 2026

Safety and alignment in an era of long-horizon models

Sicurezza20 lug 2026

Why teens deserve access to safe AI — card image

Perché gli adolescenti meritano accesso a un’IA sicura

Sicurezza16 lug 2026