10 dicembre 2025

Rafforzare la resilienza informatica con l’avanzare delle capacità dell’IA

Man mano che i nostri modelli diventano più capaci in ambito di sicurezza informatica, investiamo nel loro rafforzamento, introduciamo livelli aggiuntivi di salvaguardia e collaboriamo con esperti di sicurezza a livello globale.

Caricamento in corso...

Le capacità di cybersicurezza dei modelli di IA stanno avanzando rapidamente, offrendo benefici significativi per la difesa informatica, ma anche nuovi rischi a duplice uso che devono essere gestiti con attenzione. Ad esempio, le capacità valutate tramite sfide capture-the-flag (CTF) sono migliorate dal 27% su GPT‑5⁠(si apre in una nuova finestra) nell’agosto 2025 al 76% su GPT‑5.1‑Codex‑Max⁠(si apre in una nuova finestra) nel novembre 2025.

Ci aspettiamo che i prossimi modelli di IA continuino su questa traiettoria; in preparazione, stiamo pianificando e valutando come se ogni nuovo modello potesse raggiungere livelli “High” di capacità di cybersicurezza, come definiti dal nostro Preparedness Framework⁠(si apre in una nuova finestra). Con questo intendiamo modelli in grado di sviluppare exploit zero-day remoti funzionanti contro sistemi ben difesi oppure di fornire un contributo significativo in operazioni complesse e furtive di intrusione aziendale o industriale, con impatti nel mondo reale. Questo articolo illustra come definiamo le misure di salvaguardia per i modelli che raggiungono questi livelli di capacità e come ne assicuriamo un impatto concreto a supporto dei difensori, limitandone al contempo l’uso improprio.

Con il progredire di queste capacità, OpenAI sta investendo nel rafforzamento dei propri modelli per attività difensive di cybersicurezza e nella creazione di strumenti che consentano ai difensori di eseguire più facilmente flussi di lavoro come l’audit del codice e la correzione delle vulnerabilità. Il nostro obiettivo è che i nostri modelli e prodotti offrano vantaggi significativi ai difensori, che spesso sono in inferiorità numerica e dispongono di risorse limitate.

Come in altri ambiti a duplice uso, i flussi di lavoro informatici difensivi e offensivi si basano spesso sulle stesse conoscenze e tecniche di base. Stiamo investendo in misure di salvaguardia per garantire che queste potenti capacità vadano principalmente a beneficio di usi difensivi e per limitarne il potenziamento a fini malevoli. La cybersecurity riguarda quasi ogni ambito, il che significa che non possiamo fare affidamento su un’unica categoria di misure di sicurezza, come limitare le conoscenze o usare soltanto accessi verificati. Abbiamo invece bisogno di un approccio di difesa in profondità che bilanci il rischio e consenta agli utenti di agire. In pratica, ciò significa modellare l'accesso, la guida e l'applicazione delle capacità affinché i modelli avanzati rafforzino la sicurezza invece di abbassare le barriere all'uso improprio.

Consideriamo questo lavoro non come un’iniziativa isolata, ma come un investimento continuo e a lungo termine volto a offrire un vantaggio ai professionisti della sicurezza e a rafforzare costantemente la postura di sicurezza delle infrastrutture critiche nell’intero ecosistema.

Mitigare gli usi malevoli

I nostri modelli sono progettati e addestrati per operare in sicurezza, supportati da sistemi proattivi che rilevano e rispondono agli abusi informatici. Perfezioniamo continuamente queste protezioni man mano che evolvono le nostre capacità e il panorama delle minacce. Sebbene nessun sistema possa garantire la prevenzione completa degli usi impropri nella cybersicurezza senza compromettere gravemente gli usi difensivi, la nostra strategia consiste nel mitigare il rischio attraverso uno stack di sicurezza multilivello.

Alla base di questo approccio adottiamo una strategia di difesa su più livelli, fondata su una combinazione di controlli di accesso, rafforzamento dell’infrastruttura, controlli del traffico in uscita e monitoraggio. Affianchiamo queste misure con sistemi di rilevamento e risposta e programmi dedicati di intelligence sulle minacce e di gestione del rischio interno, così da identificare e bloccare rapidamente le minacce emergenti. Queste misure di sicurezza sono concepite per evolversi insieme al panorama delle minacce. Diamo per scontato il cambiamento e progettiamo i sistemi in modo da poterci adattare rapidamente e in modo appropriato.

Su queste basi:

Addestrare il modello a rifiutare o rispondere in modo sicuro a richieste dannose, pur rimanendo utile per casi d’uso educativi e difensivi: Stiamo addestrando i nostri modelli di frontiera a rifiutare o rispondere in modo sicuro alle richieste che potrebbero consentire abusi informatici, pur rimanendo il più possibile utili per casi d’uso legittimi, educativi e difensivi.
Sistemi di rilevamento: Perfezioniamo e manteniamo il monitoraggio a livello di sistema nei prodotti che utilizzano modelli di frontiera per rilevare attività informatiche potenzialmente malevole. Quando un’attività appare non sicura, possiamo bloccare l’output, indirizzare i prompt verso modelli più sicuri o meno avanzati, oppure procedere con un’escalation per l’applicazione delle misure. Le nostre attività di applicazione combinano revisione automatizzata e umana, guidate da fattori quali gli obblighi di legge, la gravità e la reiterazione del comportamento. Collaboriamo inoltre strettamente con gli sviluppatori e i clienti aziendali per allinearci sugli standard di sicurezza e consentire un uso responsabile con percorsi di escalation chiari.
Red teaming end-to-end: Collaboriamo con organizzazioni esperte di red teaming per valutare e migliorare le nostre misure di sicurezza. Il loro compito è tentare di aggirare tutte le nostre difese operando end-to-end, proprio come farebbe un avversario determinato e ben equipaggiato. Questo ci aiuta a identificare precocemente le lacune e a rafforzare l'intero sistema.

Iniziative dell’ecosistema per rafforzare la resilienza informatica

OpenAI ha investito fin da subito nell’applicazione dell’IA ai casi d’uso della cybersicurezza difensiva e il nostro team collabora strettamente con esperti globali per far evolvere sia i nostri modelli sia le loro applicazioni. Riconosciamo il valore della comunità globale dei professionisti della sicurezza informatica, che lavora instancabilmente per rendere più sicuro il mondo digitale, e ci impegniamo a fornire strumenti efficaci a supporto della difesa informatica. Con l’introduzione di nuove misure di salvaguardia, continueremo a collaborare con la comunità della sicurezza informatica per comprendere dove l’IA può rafforzare concretamente la resilienza e dove sono più necessarie misure di salvaguardia mirate.

Oltre a queste collaborazioni, stiamo definendo una serie di iniziative progettate per aiutare i difensori ad agire più rapidamente, ancorare le nostre misure di sicurezza alle esigenze reali e accelerare interventi correttivi responsabili su larga scala.

Programmi di accesso fidato per la difesa informatica

Introdurremo presto un programma di accesso fidato nell’ambito del quale valuteremo la possibilità di offrire a utenti e clienti qualificati che operano nel campo della difesa informatica un accesso a più livelli a funzionalità avanzate nei nostri modelli più recenti per casi d’uso difensivi. Stiamo ancora valutando il giusto equilibrio tra le funzionalità che possiamo rendere ampiamente accessibili e quelle che richiedono restrizioni per livelli, il che potrebbe influenzare la progettazione futura di questo programma. Puntiamo a fare in modo che questo programma di accesso fidato rappresenti un elemento fondamentale per un ecosistema resiliente.

Espandere la capacità difensiva con Aardvark

Aardvark, il nostro ricercatore di sicurezza agentico che aiuta sviluppatori e team di sicurezza a individuare e correggere vulnerabilità su larga scala, è ora in beta privata. Analizza le codebase alla ricerca di vulnerabilità e propone patch che i responsabili della manutenzione possono adottare rapidamente. Ha già identificato nuove CVE nel software open source analizzando intere codebase. Prevediamo di offrire copertura gratuita a selezionati repository open source non commerciali per contribuire alla sicurezza dell’ecosistema e della supply chain del software open source. Candidati per partecipare qui.

Consiglio per il rischio di frontiera

Istituiremo il Consiglio per il rischio di frontiera, un gruppo consultivo che metterà difensori informatici e professionisti della sicurezza esperti a stretto contatto con i nostri team. Questo consiglio inizierà con un focus sulla cybersicurezza e in futuro si espanderà ad altri ambiti di capacità di frontiera. I membri offriranno indicazioni sul confine tra capacità utili e responsabili e il loro potenziale uso improprio, e tali indicazioni guideranno direttamente le nostre valutazioni e le misure di salvaguardia. Condivideremo presto ulteriori informazioni sul consiglio.

Sviluppare una comprensione condivisa dei modelli di minaccia con il settore

Infine, prevediamo che usi impropri in ambito informatico possano emergere da qualsiasi modello di frontiera del settore. Per affrontare questa sfida, collaboriamo con altri laboratori di frontiera attraverso il Frontier Model Forum, un'organizzazione senza scopo di lucro sostenuta dai principali laboratori di IA e partner del settore, per sviluppare una comprensione condivisa dei modelli di minaccia e delle migliori pratiche. In questo contesto, la modellazione delle minacce aiuta a mitigare il rischio identificando come le capacità dell’IA potrebbero essere sfruttate in modo malevolo, dove si trovano colli di bottiglia critici per diversi attori della minaccia e in che modo i modelli di frontiera potrebbero offrire un vantaggio significativo. Questa collaborazione mira a sviluppare una comprensione coerente e condivisa, a livello di ecosistema, degli attori della minaccia e dei percorsi di attacco, consentendo a laboratori, manutentori e difensori di migliorare le proprie misure di mitigazione e garantire che le informazioni critiche sulla sicurezza si diffondano rapidamente nell’intero ecosistema. Stiamo inoltre collaborando con team esterni per sviluppare valutazioni sulla sicurezza informatica⁠(si apre in una nuova finestra). Ci auguriamo che un ecosistema di valutazioni indipendenti contribuisca ulteriormente a sviluppare una comprensione condivisa delle capacità dei modelli.

Nel complesso, queste iniziative riflettono il nostro impegno di lungo periodo a rafforzare la componente difensiva dell’ecosistema. Man mano che i modelli diventano più capaci, il nostro obiettivo è contribuire a garantire che tali capacità si traducano in un vantaggio concreto per i difensori, radicato nelle esigenze del contesto reale, plasmato dal contributo degli esperti e implementato con attenzione. Parallelamente a questo lavoro, prevediamo di esplorare altre iniziative e programmi di finanziamento per la cybersicurezza per far emergere idee rivoluzionarie che potrebbero non nascere attraverso i canali tradizionali, e per raccogliere in modo collaborativo difese audaci e creative dal mondo accademico, dall’industria e dalla community open source. Nel complesso, si tratta di un lavoro in continua evoluzione e prevediamo di continuare a sviluppare questi programmi man mano che comprendiamo cosa contribuisce in modo più efficace alla sicurezza nel mondo reale.