Vai al contenuto principale
OpenAI

25 marzo 2026

SicurezzaSicurezza

Ti presentiamo il programma OpenAI Safety Bug Bounty

Test per problemi di sicurezza e abusi su OpenAI

Oggi OpenAI lancia il programma pubblico Safety Bug Bounty(si apre in una nuova finestra) per individuare abusi dell’IA e rischi per la sicurezza nei propri prodotti. Con la rapida evoluzione dell’IA aumentano anche i modi in cui può essere usata impropriamente. Il nostro obiettivo è garantire sistemi sicuri e protetti da usi impropri o abusi che possono causare danni concreti. 

Questo nuovo programma integrerà il Security Bug Bounty(si apre in una nuova finestra) di OpenAI e accetta segnalazioni di rischi reali legati ad abusi e sicurezza, anche se non rientrano nelle vulnerabilità classiche. Con questo programma vogliamo continuare a collaborare con ricercatori di sicurezza per individuare e risolvere problemi che non sono vulnerabilità tradizionali ma comportano comunque rischi reali. Le segnalazioni vengono analizzate dai team Safety e Security di OpenAI e possono essere riassegnate tra i programmi in base all’ambito e alla responsabilità.

Panoramica del programma

Il nuovo programma Safety Bug Bounty(si apre in una nuova finestra) si concentra sugli scenari di sicurezza specifici dell’IA elencati di seguito:

Rischi agentici, incluso MCP

  • Iniezione di prompt di terze parti ed esfiltrazione di dati: quando il testo di un attaccante riesce a compromettere l’agente di una vittima, inclusi browser, ChatGPT Agent e prodotti simili, inducendolo a compiere azioni dannose o a divulgare informazioni sensibili. Il comportamento deve essere riproducibile almeno nel 50% dei casi. 
  • Un prodotto agentico di OpenAI esegue su larga scala un’azione non consentita sul sito OpenAI.
  • Un prodotto agentico di OpenAI compie un'azione potenzialmente dannosa non elencata sopra. Le segnalazioni valide devono dimostrare un danno plausibile e concreto.
  • Qualsiasi test relativo al rischio MCP deve rispettare i termini di servizio delle terze parti coinvolte.

Informazioni proprietarie di OpenAI

  • Generazioni del modello che restituiscono informazioni proprietarie legate al ragionamento.
  • Vulnerabilità che espongono altre informazioni proprietarie di OpenAI.

Integrità degli account e della piattaforma

  • Vulnerabilità nei segnali di integrità degli account e della piattaforma, come aggirare controlli anti-automazione, manipolare segnali di fiducia, eludere restrizioni, sospensioni o ban e problemi simili.
  • I problemi che permettono di accedere a funzionalità, dati o contenuti oltre le autorizzazioni previste vanno segnalati al Security Bug Bounty(si apre in una nuova finestra).

I jailbreak non rientrano in questo programma. Periodicamente però organizziamo campagne private focalizzate su specifici tipi di rischio, come contenuti a rischio biologico in ChatGPT Agent e GPT‑5. Invitiamo i ricercatori interessati a candidarsi a questi programmi quando saranno disponibili. 

Se individui difetti che creano percorsi diretti verso danni per gli utenti e includono azioni correttive concrete, possono essere valutati caso per caso per una ricompensa. Gli aggiramenti generici delle policy senza un impatto reale su sicurezza o abusi non rientrano nel programma. Ad esempio i jailbreak che portano a linguaggio offensivo o a informazioni facilmente reperibili online non sono inclusi.

Come partecipare

I ricercatori interessati possono candidarsi tramite il programma Safety Bug Bounty(si apre in una nuova finestra). Vogliamo collaborare con ricercatori, hacker etici e la comunità della sicurezza per costruire un ecosistema IA più sicuro.

Autore

OpenAI