Man mano che i sistemi di IA affrontano compiti più complessi, soprattutto quelli che coinvolgono il web e le app connesse, le implicazioni per la sicurezza cambiano.
Un rischio emergente è diventato particolarmente importante: l'iniezione di prompt. In questi attacchi, una terza parte cerca di ingannare un sistema di IA conversazionale affinché segua istruzioni dannose o divulghi informazioni sensibili.
Oggi introduciamo due nuove protezioni progettate per aiutare gli utenti e le aziende a mitigare gli attacchi di iniezione di prompt, offrendo una visibilità più chiara sui rischi e controlli più efficaci:
- Modalità di blocco in ChatGPT, un'impostazione di sicurezza avanzata e opzionale per utenti ad alto rischio
- Etichette di “Rischio elevato“ per alcune funzionalità che potrebbero introdurre rischi aggiuntivi in ChatGPT, ChatGPT Atlas e Codex
Queste aggiunte si basano sulle nostre protezioni esistenti a livello di modello, prodotto e sistema. Questo include il sandboxing, protezioni contro l'esfiltrazione di dati basata su URL, monitoraggio e applicazione, e controlli aziendali come l'accesso basato sui ruoli e i log di audit.
La Modalità di blocco è un'impostazione di sicurezza avanzata e opzionale, progettata per un ristretto gruppo di utenti particolarmente attenti alla sicurezza, come dirigenti o team di sicurezza di organizzazioni di rilievo, che necessitano di una protezione aumentata contro minacce avanzate. Non è necessaria per la maggior parte degli utenti. La Modalità di blocco limita severamente le modalità con cui ChatGPT può interagire con sistemi esterni per ridurre il rischio di esfiltrazione di dati basata su iniezioni di prompt.
La Modalità di blocco disabilita in modo deterministico specifici strumenti e funzionalità di ChatGPT che un hacker potrebbe provare a sfruttare per sottrarre dati sensibili dalle conversazioni degli utenti o dalle app connesse, ad esempio tramite attacchi di iniezione di prompt.
Ad esempio, la navigazione web in Modalità di blocco è limitata ai contenuti memorizzati nella cache, quindi nessuna richiesta di rete in tempo reale esce dalla rete controllata di OpenAI. Questa restrizione è progettata per impedire che dati sensibili vengano esfiltrati verso un hacker tramite la navigazione web. Alcune funzionalità vengono completamente disabilitate quando non siamo in grado di fornire solide garanzie deterministiche sulla sicurezza dei dati.

La Modalità di blocco è una nuova impostazione deterministica che aiuta a proteggere i dati dalla condivisione involontaria con terze parti, limitando rigorosamente le modalità di interazione di ChatGPT con determinati sistemi esterni.
I piani aziendali di ChatGPT offrono già sicurezza dei dati di livello enterprise. La Modalità di blocco si basa su queste protezioni ed è disponibile per ChatGPT Enterprise, ChatGPT Edu, ChatGPT per il settore sanitario e ChatGPT per gli insegnanti. Gli amministratori possono abilitarla nelle Impostazioni dell'area di lavoro(si apre in una nuova finestra) creando un nuovo ruolo(si apre in una nuova finestra). Quando è attivata, la Modalità di blocco impone ulteriori restrizioni sulle impostazioni amministrative esistenti.
Scopri di più sulla Modalità di blocco nel nostro Centro assistenza(si apre in una nuova finestra).
Poiché alcuni flussi di lavoro critici si basano sulle app, gli Amministratori dell'area di lavoro mantengono un controllo più dettagliato. Possono scegliere esattamente quali app e quali azioni specifiche all'interno di tali app sono disponibili per gli utenti in Modalità di blocco. Inoltre, e separatamente dalla Modalità di blocco, la Piattaforma di log API per la conformità(si apre in una nuova finestra) fornisce visibilità dettagliata sull'uso delle app, sui dati condivisi e sulle fonti connesse, aiutando gli amministratori a mantenere il controllo.
Prevediamo di rendere disponibile la Modalità di blocco per i consumatori nei prossimi mesi.
I prodotti di IA possono essere più utili quando sono collegati alle tue app e al web, e abbiamo investito molto per mantenere i dati connessi al sicuro. Allo stesso tempo, alcune capacità legate alla rete introducono nuovi rischi che non sono ancora completamente affrontati dalle misure di sicurezza e protezione del settore. Alcuni utenti potrebbero sentirsi a proprio agio nell'assumersi questi rischi e riteniamo sia importante che gli utenti abbiano la possibilità di decidere se e come utilizzarli, specialmente quando lavorano con i loro dati privati.
Il nostro approccio è stato quello di fornire all'interno del prodotto indicazioni sulle funzionalità che potrebbero comportare un rischio aggiuntivo. Per rendere tutto più chiaro e coerente, stiamo standardizzando il modo in cui etichettiamo un breve elenco di capacità esistenti. Queste funzionalità utilizzeranno ora un'etichetta coerente di “Rischio elevato“ su ChatGPT, ChatGPT Atlas e Codex, affinché gli utenti ricevano le stesse indicazioni ovunque le incontrino.
Ad esempio, in Codex, il nostro assistente di codifica, gli sviluppatori possono concedere a Codex l'accesso alla rete affinché possa eseguire azioni sul web, come consultare la documentazione. La schermata delle impostazioni rilevante include l'etichetta di “Rischio elevato”, insieme a una spiegazione chiara di cosa cambia, quali rischi possono essere introdotti e quando tale accesso è appropriato.

Uno screenshot della schermata delle impostazioni di Codex in cui gli utenti possono configurare l'accesso di rete di Codex.
Continuiamo a investire nel rafforzamento delle nostre misure di sicurezza e protezione, in particolare per rischi nuovi, emergenti o in crescita. Mentre rafforziamo le misure di sicurezza per queste funzionalità, rimuoveremo l'etichetta di “Rischio elevato“ non appena sarà chiaro che i progressi nella sicurezza hanno mitigato sufficientemente tali rischi per un utilizzo generale. Continueremo ad aggiornare nel tempo le funzionalità che avranno questa etichetta, per comunicare al meglio il rischio agli utenti.


