Stiamo ampliando il programma Trusted Access for Cyber (TAC) a migliaia di difensori individuali verificati e a centinaia di team responsabili della protezione di software critici. Da anni sviluppiamo un programma di difesa informatica basato sui principi dell’accesso democratizzato, dell’implementazione iterativa e della resilienza dell’ecosistema. In vista di modelli OpenAI sempre più avanzati nei prossimi mesi, stiamo ottimizzando i nostri modelli per abilitare casi d’uso di cybersicurezza difensiva, a partire da oggi con una variante di GPT‑5.4 addestrata per essere cyber-permissiva: GPT‑5.4‑Cyber. In questo articolo condividiamo come prevediamo che il nostro approccio, che scala la difesa informatica in parallelo all’aumento delle capacità dei modelli, guiderà test e distribuzione delle future versioni.
L’uso progressivo dell’IA accelera il lavoro dei difensori, responsabili della sicurezza di sistemi, dati e utenti, consentendo di individuare e risolvere più rapidamente le vulnerabilità nelle infrastrutture digitali da cui tutti dipendono. Allo stesso modo, l'IA viene utilizzata anche da aggressori con intenti dannosi. Ci siamo preparati a questo scenario. Dal 2023 supportiamo i difensori tramite il Cybersecurity Grant Program e rafforziamo le salvaguardie attraverso il Preparedness Framework. Nello stesso anno abbiamo iniziato a valutare le capacità cyber dei modelli e, nel 2025, abbiamo iniziato a integrare salvaguardie specifiche per la cybersicurezza(si apre in una nuova finestra) nelle implementazioni. All’inizio di quest’anno abbiamo rafforzato il supporto ai difensori con il lancio di Codex Security per identificare e correggere vulnerabilità su larga scala. Il nostro approccio al continuo avanzamento delle capacità si basa su tre principi:
- Accesso democratizzato: l’obiettivo è rendere questi strumenti il più possibile accessibili, prevenendone al contempo l’uso improprio. Progettiamo meccanismi che evitano decisioni arbitrarie su chi possa accedere per usi legittimi e chi no. Ciò implica l’uso di criteri e metodi chiari e oggettivi, come solidi processi di KYC e verifica dell’identità, per determinare chi può accedere a capacità avanzate e automatizzare progressivamente tali processi. In ultima analisi, il nostro obiettivo è rendere disponibili capacità difensive avanzate a soggetti legittimi, di qualsiasi dimensione, inclusi coloro che sono responsabili della protezione delle infrastrutture critiche, dei servizi pubblici e dei sistemi digitali da cui le persone dipendono ogni giorno.
- Implementazione iterativa: apprendiamo maggiormente introducendo questi sistemi nel mondo reale in modo controllato e migliorandoli progressivamente nel tempo. Man mano che comprendiamo meglio sia le capacità sia i rischi, aggiorniamo di conseguenza i modelli e i sistemi di sicurezza. Ciò include l'analisi di benefici e rischi dei vari modelli, il rafforzamento della resilienza ad attacchi informatici e jailbreak, potenziando le capacità difensive e riducendo al contempo i rischi di danno.
- Investire nella resilienza dell’ecosistema: supportiamo e rafforziamo la comunità dei difensori attraverso percorsi di accesso affidabili, sovvenzioni mirate, contributi a iniziative di sicurezza open source(si apre in una nuova finestra) e tecnologie come Codex Security, che consentono di individuare e correggere le vulnerabilità più rapidamente.
La nostra strategia per la resilienza nella cybersicurezza e l’accelerazione delle capacità difensive
Da anni, la nostra strategia di cybersicurezza si basa sull’investimento nella ricerca, sulla prevenzione degli usi impropri e sul rafforzamento delle capacità dei difensori. Con l’avanzare delle capacità dei modelli, abbiamo ampliato i nostri programmi in linea con questi obiettivi, fondati sulle seguenti convinzioni:
- Il rischio informatico è già presente e in accelerazione, ma è possibile intervenire. Le infrastrutture digitali sono vulnerabili(si apre in una nuova finestra) da anni, ben prima dell'arrivo dell'IA avanzata. Oggi i modelli esistenti possono contribuire all’individuazione delle vulnerabilità, all’analisi delle codebase e al supporto di parti rilevanti dei flussi di lavoro di cybersicurezza, mentre gli attori della minaccia sperimentano nuovi approcci basati sull’IA. Abbiamo osservato come configurazioni avanzate riescano a far emergere capacità sempre maggiori sfruttando più risorse computazionali in fase di esecuzione con i modelli esistenti. Ciò significa che le salvaguardie non possono essere rimandate al raggiungimento di una singola soglia futura.
- Ampliare l’accesso in base a chi utilizza questi sistemi e a come vengono utilizzati. Le capacità cyber sono intrinsecamente a duplice uso, quindi il rischio non è definito esclusivamente dal modello. Dipende anche dall’utente, dai segnali di affidabilità(si apre in una nuova finestra) che lo riguardano e dal livello di accesso che gli viene concesso.
- Un ampio accesso ai modelli generali con salvaguardie può coesistere con controlli più granulari per le capacità a rischio più elevato, supportati da verifiche più robuste, segnali di intento più chiari e una maggiore visibilità sull’utilizzo.
- Per consentire un uso responsabile su larga scala, sono necessari sistemi in grado di convalidare utenti affidabili e casi d’uso in modo più automatizzato e oggettivo. Ciò consente di ampliare l’accesso sulla base di evidenze e segnali concreti di affidabilità, anziché fare affidamento su decisioni manuali. Non riteniamo pratico né appropriato decidere in modo centralizzato chi possa difendersi. L’obiettivo è invece consentire l’accesso al maggior numero possibile di difensori legittimi, sulla base di verifiche, segnali di affidabilità e responsabilità.
- Le difese devono essere continuamente potenziate in linea con l'evoluzione delle capacità. Con l’aumento delle capacità dei modelli, anche le difese devono evolvere di pari passo. Abbiamo osservato miglioramenti costanti nel coding agentico con implicazioni dirette per la cybersicurezza, adeguando il nostro approccio di pari passo.
- Abbiamo avviato un addestramento alla sicurezza specifico per il dominio cyber con GPT‑5.2, ampliandolo successivamente con ulteriori salvaguardie tramite GPT‑5.3‑Codex e GPT‑5.4, in cui abbiamo anche classificato il modello come capacità cyber "alta" nell’ambito del nostro Preparedness Framework. Parallelamente, abbiamo aumentato il supporto ai difensori: lanciando un programma di sovvenzioni per la cybersicurezza da 10 milioni di dollari, raggiungendo oltre 1.000 progetti open source con Codex per Open Source(si apre in una nuova finestra), che offre analisi di sicurezza gratuite, e continuando a migliorare Codex Security.
- Codex Security, lanciato in beta privata sei mesi fa e come anteprima di ricerca all'inizio di quest'anno, monitora automaticamente le codebase, convalida i problemi e propone soluzioni. Con il miglioramento dei modelli, sono aumentate anche la precisione e l’utilità del sistema. Dal recente lancio, Codex Security ha contribuito alla correzione di oltre 3.000 vulnerabilità critiche e ad alta gravità, insieme a molti altri risultati a gravità inferiore risolti nell’intero ecosistema.
- Nel corso di queste release, abbiamo anche perfezionato la gestione delle richieste sensibili da parte dei modelli, calibrando le soglie di rifiuto e ampliando al contempo l’accesso affidabile tramite programmi come TAC.
- Lo sviluppo software stesso deve essere reso più sicuro. L’ecosistema più solido è quello che individua, convalida e risolve continuamente i problemi di sicurezza durante lo sviluppo del software. Integrando modelli avanzati per la programmazione e capacità agentiche nei flussi di lavoro degli sviluppatori, è possibile fornire feedback immediato e operativo durante lo sviluppo, spostando la sicurezza da audit episodici e inventari statici dei bug a una riduzione continua e concreta del rischio.
Vogliamo rafforzare i difensori offrendo un ampio accesso a capacità di frontiera, inclusi modelli progettati specificamente per la cybersicurezza. A febbraio, abbiamo introdotto Trusted Access for Cyber (TAC), con verifica automatizzata dell’identità per gli utenti individuali al fine di ridurre l’attrito delle salvaguardie nelle attività di cybersicurezza, e abbiamo collaborato con un numero limitato di organizzazioni per modelli più permissivi in ambito cyber.
Oggi stiamo ampliando questo programma introducendo ulteriori livelli di accesso per gli utenti disposti a collaborare con OpenAI per autenticarsi come difensori della cybersicurezza. I clienti nei livelli più elevati avranno accesso a GPT‑5.4‑Cyber, un modello ottimizzato specificamente per capacità cyber aggiuntive e con minori restrizioni operative. Si tratta di una versione di GPT‑5.4 che abbassa la soglia di rifiuto per attività legittime di cybersicurezza e abilita nuove capacità per flussi di lavoro difensivi avanzati, comprese funzionalità di reverse engineering binario che permettono agli esperti di analizzare software compilato per individuare malware, vulnerabilità e falle di sicurezza, senza dover accedere al codice sorgente.
Poiché questo modello è più permissivo, iniziamo con un’implementazione limitata e iterativa rivolta a fornitori di sicurezza, organizzazioni e ricercatori verificati. L'accesso a modelli permissivi con capacità cyber può comportare limitazioni, in particolare per utilizzi senza visibilità come Zero-Data Retention(si apre in una nuova finestra) (ZDR). Ciò è particolarmente rilevante per sviluppatori e organizzazioni che accedono ai modelli tramite piattaforme di terze parti, dove OpenAI può avere una visibilità più limitata sull’utente, sull’ambiente o sullo scopo della richiesta.
Ottenere l'accesso a TAC è semplice:
- Gli utenti possono verificare la propria identità su chatgpt.com/cyber(si apre in una nuova finestra).
- Le aziende possono richiedere accesso controllato per il proprio team tramite il loro referente OpenAI.
Tutti i clienti approvati tramite questo processo avranno accesso a versioni dei modelli esistenti con minori attriti legati alle salvaguardie che potrebbero attivarsi in caso di attività cyber a duplice uso, consentendo loro di supportare la formazione sulla sicurezza, la programmazione difensiva e la ricerca responsabile sulle vulnerabilità. I clienti già presenti in TAC, disposti a effettuare ulteriori verifiche per qualificarsi come difensori legittimi, possono manifestare interesse(si apre in una nuova finestra) per livelli di accesso aggiuntivi, incluso l’accesso a GPT‑5.4‑Cyber.
Le nostre difese di cybersicurezza sono il risultato di molti mesi di miglioramenti iterativi. Riteniamo che l’attuale insieme di salvaguardie riduca sufficientemente il rischio cyber da consentire una distribuzione ampia dei modelli attuali. Prevediamo che versioni di queste salvaguardie saranno adeguate anche per modelli futuri più potenti, mentre i modelli esplicitamente addestrati e resi più permissivi per la cybersicurezza richiederanno implementazioni più restrittive e controlli appropriati.
Nel lungo periodo, per garantire l’adeguatezza continua della sicurezza dell’IA nella cybersicurezza, prevediamo la necessità di difese più estese per i modelli futuri, le cui capacità supereranno rapidamente anche i migliori modelli attuali progettati per scopi specifici.


