8 maggio 2026

Utilizzare Codex in sicurezza in OpenAI

Uno sguardo ai controlli, ai limiti e alla telemetria che OpenAI usa per governare gli agenti di coding nei flussi di lavoro reali.

Caricamento in corso...

Man mano che i sistemi di IA diventano più capaci, agiscono sempre più per conto degli utenti. Gli agenti di coding possono esaminare repository in autonomia, eseguire comandi e interagire con gli strumenti di sviluppo. Si tratta di attività che prima richiedevano un intervento umano diretto.

Con Codex, abbiamo progettato queste capacità insieme ai controlli necessari alle organizzazioni per una distribuzione sicura. I team di sicurezza hanno bisogno di strumenti per governare il funzionamento degli agenti: a cosa possono accedere, quando è richiesta l’approvazione umana, con quali sistemi possono interagire e quali dati di telemetria sono disponibili per comprenderne il comportamento.

In OpenAI distribuiamo Codex con alcuni obiettivi chiari: mantenere l’agente entro confini tecnici ben definiti, consentire agli sviluppatori di agire rapidamente nelle attività a basso rischio e rendere esplicite le azioni a rischio più elevato. Manteniamo inoltre una telemetria nativa dell’agente per comprendere e verificare ciò che ha fatto. In pratica, questo significa configurazione gestita, esecuzione vincolata, policy di rete e log nativi dell’agente.

Controllare il funzionamento di Codex

Distribuiamo Codex seguendo un principio semplice: deve essere produttivo all’interno di un ambiente delimitato, le azioni quotidiane a basso rischio devono essere fluide e quelle a rischio più elevato devono richiedere una revisione.

Sandboxing e approvazioni

Approvazioni e sandboxing lavorano insieme. La sandbox definisce il confine tecnico di esecuzione, inclusi i percorsi in cui Codex può scrivere, l’accesso alla rete e quali percorsi restano protetti. La policy di approvazione stabilisce quando Codex deve chiedere il permesso per eseguire un’azione, ad esempio quando deve operare al di fuori della sandbox. Gli utenti possono approvare una singola azione oppure autorizzare quel tipo di azione per l’intera sessione.

Per le richieste che superano il limite della sandbox, utilizziamo la Modalità di revisione automatica⁠(si apre in una nuova finestra), una funzione che, quando è attivata, approva automaticamente determinati tipi di richieste per ridurre la frequenza con cui gli utenti devono interrompersi e approvare le azioni di Codex. Codex invia l’azione pianificata e il contesto recente al subagente di approvazione automatica, che può approvare automaticamente le azioni a basso rischio o le azioni ad alto rischio con un livello sufficiente di autorizzazione dell’utente, senza interrompere l’utente. Questo consente a Codex di continuare le attività di routine, fermandosi però davanti ad azioni a rischio più elevato o con conseguenze indesiderate.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

Accesso alla rete

Non eseguiamo Codex con accesso in uscita illimitato. La nostra policy di rete gestita consente le destinazioni previste, blocca quelle che non vogliamo che Codex raggiunga e richiede approvazione per i domini sconosciuti. Questo permette a Codex di completare flussi di lavoro comuni e affidabili senza concedergli un accesso esteso alla rete.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

Identità e credenziali

Gestiamo anche il modo in cui Codex si autentica. Le credenziali OAuth di CLI e MCP sono archiviate nel portachiavi sicuro del sistema operativo, l’accesso avviene obbligatoriamente tramite ChatGPT ed è vincolato alla nostra area di lavoro enterprise di ChatGPT. Questo mantiene l’utilizzo di Codex legato ai controlli a livello di workspace e rende disponibile l’attività di Codex nella ChatGPT Compliance Logs Platform per la nostra area di lavoro Enterprise.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

Regole

Utilizziamo regole affinché Codex non consideri ogni comando shell ugualmente sicuro. I comandi sicuri più comuni usati dagli ingegneri nello sviluppo quotidiano sono consentiti senza approvazione al di fuori della sandbox, mentre comandi specifici più pericolosi possono essere bloccati o richiedere approvazione. Questo permette a Codex di procedere rapidamente nelle normali attività di ingegneria, imponendo comunque una revisione o bloccando pattern che non vogliamo eseguire al di fuori della sandbox.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

Configurazioni gestite

Applichiamo questo approccio tramite una combinazione di requisiti gestiti dal cloud, preferenze gestite di macOS e file di requisiti locali. I requisiti sono controlli imposti dagli amministratori che gli utenti non possono modificare. Le preferenze gestite di macOS e i file di requisiti locali ci consentono di mantenere una base coerente, continuando però a testare configurazioni diverse per team, gruppi di utenti o ambienti. Queste configurazioni si applicano a tutte le superfici locali di Codex, incluse l’app desktop, la CLI e l’estensione IDE.

Telemetria nativa dell’agente e audit trail

Il controllo è solo metà del lavoro. Una volta distribuiti gli agenti, i team di sicurezza hanno bisogno di visibilità su ciò che stanno facendo e sul perché. I log di sicurezza tradizionali restano utili per analizzare le azioni eseguite da Codex, ma nella maggior parte dei casi rispondono solo a cosa è successo: è stato avviato un processo, un file è stato modificato, è stata tentata una connessione di rete. I difensori devono comunque capire perché Codex abbia fatto qualcosa o quale fosse l’intento dell’utente.

Codex può offrire ai team di sicurezza una visione più consapevole degli agenti. Supporta l’esportazione dei log OpenTelemetry per vari eventi di Codex, come prompt utente, decisioni di approvazione degli strumenti, risultati dell’esecuzione degli strumenti, utilizzo dei server MCP ed eventi di autorizzazione o blocco del proxy di rete. I log delle attività di Codex sono disponibili anche tramite la OpenAI Compliance Platform per i clienti Enterprise ed Edu.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

In OpenAI utilizziamo i log di Codex insieme al nostro agente di triage della sicurezza basato sull’IA. Quando un avviso endpoint segnala che Codex ha eseguito qualcosa di insolito, lo strumento di sicurezza endpoint indica che si è verificato un evento sospetto. I log di Codex aiutano quindi a chiarire il contesto e l’intento dell’utente e dell’agente. Il nostro agente di triage della sicurezza basato sull’IA utilizza i log di Codex per analizzare la richiesta originale, l’attività degli strumenti, le decisioni di approvazione, i risultati degli strumenti ed eventuali decisioni o blocchi della policy di rete. L’agente presenta poi la propria analisi al team di sicurezza per distinguere tra comportamento previsto dell’agente, errori innocui e attività che richiedono realmente un’escalation.

Utilizziamo la stessa telemetria anche a livello operativo. Questi log ci aiutano a capire come evolve l’utilizzo interno, quali strumenti e server MCP vengono usati, con quale frequenza la sandbox di rete blocca o richiede approvazione e dove il rollout necessita ancora di ottimizzazioni. I log OpenTelemetry possono essere centralizzati nei sistemi SIEM e di compliance logging.

Prospettive future

Man mano che agenti di coding come Codex si integrano nei flussi di lavoro di sviluppo, i team di sicurezza hanno bisogno di strumenti progettati specificamente per gestire questo cambiamento. Codex offre le superfici di controllo, la gestione della configurazione, il sandboxing e la telemetria dettagliata e orientata agli agenti necessari per garantire un utilizzo sicuro. Con queste capacità, i team di sicurezza possono abilitare Codex con maggiore fiducia, bilanciando la produttività degli sviluppatori con la visibilità e il controllo richiesti dalla sicurezza enterprise. Maggiori informazioni sulla configurazione di Codex sono disponibili qui⁠(si apre in una nuova finestra), e sulla Compliance API qui⁠(si apre in una nuova finestra).

Autore

OpenAI

Continua a leggere

Visualizza tutto

Safety and alignment in an era of long-horizon models

Sicurezza20 lug 2026

Why teens deserve access to safe AI — card image

Perché gli adolescenti meritano accesso a un’IA sicura

Sicurezza16 lug 2026

GPT-Red: sbloccare l’auto-miglioramento della robustezza

Sicurezza15 lug 2026