8 de maig del 2026

Executar Codex de manera segura a OpenAI

Una mirada als controls, els límits i la telemetria que OpenAI utilitza per governar els agents de programació en fluxos de treball reals.

S'està carregant…

A mesura que els sistemes d'IA esdevenen més capaços, actuen cada vegada més en nom dels usuaris. Els agents de codificació poden revisar repositoris, executar ordres i interactuar amb eines de desenvolupament de manera autònoma. Aquestes són tasques que abans requerien que una persona les executés directament.

Amb Codex, hem dissenyat aquestes capacitats juntament amb els controls que les organitzacions necessiten per a un desplegament segur. Els equips de seguretat necessiten maneres de governar com operen els agents: a què poden accedir, quan cal aprovació humana, amb quins sistemes poden interactuar i quina telemetria hi ha per explicar el seu comportament.

A OpenAI, despleguem Codex amb uns quants objectius clars: mantenir l'agent dins de límits tècnics clars, permetre que els desenvolupadors avancin ràpidament en les accions de baix risc i fer explícites les accions de més risc. També conservem la telemetria nativa de l’agent per poder entendre i auditar què ha fet l’agent. A la pràctica, això vol dir configuració gestionada, execució restringida, polítiques de xarxa i registres natius de l’agent.

Controlar el funcionament de Codex

Despleguem Codex amb un principi senzill: ha de ser productiu dins d’un entorn delimitat, les accions quotidianes de baix risc han de funcionar sense friccions i les accions de més risc s’han d’aturar per revisar-les.

Entorn segur i aprovacions

Les aprovacions i l’entorn aïllat funcionen conjuntament. L'entorn aïllat defineix el límit tècnic d'execució, incloent-hi on Codex pot escriure, si pot accedir a la xarxa i quines rutes continuen protegides. La política d’aprovació determina quan Codex ha de demanar confirmació per dur a terme una acció, com ara quan ha de fer alguna cosa fora de l’entorn segur. Els usuaris poden aprovar l’acció una sola vegada o aprovar aquest tipus d’acció per a aquella sessió.

Per a les sol·licituds que travessen el límit de l'entorn aïllat, fem servir el mode de revisió automàtica⁠(s'obre en una finestra nova), una funció que, quan està activada, aprova automàticament certs tipus de sol·licituds per reduir la freqüència amb què els usuaris han de detenir-se i aprovar les accions de Codex. Codex envia l'acció planificada i el context recent al subagent d'aprovació automàtica, que pot aprovar automàticament accions de baix risc; o accions d'alt risc amb un nivell suficient d'autorització de l'usuari; en lloc d'interrompre l'usuari. Això manté Codex en moviment en les tasques rutinàries, però alhora s'atura davant dels riscos més elevats o de les accions amb conseqüències no desitjades.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

Accés a la xarxa

No executem Codex amb accés de sortida sense restriccions. La nostra política de xarxa gestionada permet les destinacions previstes, bloqueja les destinacions a les quals no volem que Codex accedeixi i requereix aprovació per als dominis desconeguts. Això permet a Codex completar fluxos de treball habituals i validats sense concedir-li un accés ampli a la xarxa.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

Identitat i credencials

També gestionem com s’autentica Codex. Les credencials OAuth de la CLI i de MCP s’emmagatzemen al clauer segur del sistema operatiu, l’inici de sessió es força a través de ChatGPT i l’accés queda restringit al nostre espai de treball empresarial de ChatGPT. Això manté l’ús de Codex vinculat als nostres controls a nivell d’espai de treball i fa que l’activitat de Codex estigui disponible a la plataforma de registres de compliment normatiu de ChatGPT per al nostre espai de treball empresarial.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

Regles

Fem servir regles perquè Codex no consideri totes les ordres de terminal igual de segures. Les ordres habituals i innòcues que els enginyers fan servir en el desenvolupament diari es permeten sense aprovació fora de l’entorn aïllat, i determinades ordres perilloses es poden bloquejar o poden requerir aprovació. Això permet a Codex avançar ràpidament en tasques d’enginyeria habituals, alhora que continua imposant una revisió o bloquejant patrons que no volem executar fora de l’entorn aïllat.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

Configuracions gestionades

Apliquem aquesta postura mitjançant una combinació de requisits gestionats al núvol, preferències gestionades de macOS i fitxers de requisits locals. Els requisits són controls imposats pels administradors que els usuaris no poden anul·lar. Les preferències gestionades de macOS i els fitxers de requisits locals ens permeten mantenir una base de referència coherent, alhora que continuem provant configuracions diferents per equip, grup d’usuaris o entorn. Aquestes configuracions s’apliquen a totes les superfícies locals del Codex, incloses l’aplicació d’escriptori, la CLI i l’extensió de l’IDE.

Telemetria i traces d'auditoria natives dels agents

El control és només la meitat de la feina. Un cop desplegats els agents, els equips de seguretat han de tenir visibilitat de què fan i per què. Els registres de seguretat tradicionals encara són útils quan mires les accions que ha fet Codex, però sobretot responen a què ha passat: s’ha iniciat un procés, s’ha modificat un fitxer, s’ha intentat establir una connexió de xarxa. Als defensors encara els toca esbrinar per què Codex ha fet alguna cosa o quina és la intenció de l’usuari.

Codex pot oferir als equips de seguretat una visió més conscient dels agents. Codex admet l’exportació de registres d’OpenTelemetry per a diversos esdeveniments de Codex, com ara les indicacions dels usuaris, les decisions d’aprovació d’eines, els resultats d’execució d’eines, l’ús del servidor MCP i els esdeveniments d’autorització o denegació del proxy de xarxa. Els registres d’activitat del Codex també estan disponibles mitjançant la plataforma de compliment d’OpenAI per als clients d’Enterprise i Edu.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

A OpenAI, fem servir els registres de Codex juntament amb el nostre agent de triatge de seguretat impulsat per IA. Quan una alerta d'un punt final diu que Codex ha fet alguna cosa inusual, l'eina de seguretat de punts finals ens indica que s'ha produït un esdeveniment sospitós. Els registres de codi ajuden llavors a explicar la intenció subjacent de l'usuari i de l'agent. El nostre agent de triatge de seguretat d'IA utilitza els registres de Codex per inspeccionar la sol·licitud original, l'activitat de les eines, les decisions d'aprovació, els resultats de les eines i qualsevol decisió o bloqueig rellevant de la política de xarxa. L'agent de triatge de seguretat d'IA posa a disposició del nostre equip de seguretat la seva anàlisi perquè la revisin, per tal de distingir entre el comportament esperat de l'agent, els errors benignes i l'activitat que realment requereix una escalada.

També fem servir la mateixa telemetria en l’operativa. Fem servir aquests registres per entendre com canvia l’adopció interna, quines eines i quins servidors MCP es fan servir, amb quina freqüència l'entorn segur de la xarxa bloqueja o demana confirmació i en quins punts el desplegament encara necessita ajustos. Aquests registres d’OpenTelemetry es poden centralitzar en sistemes SIEM i de registre de compliment.

De cara al futur

A mesura que agents de programació com Codex s’integren en els fluxos de treball de desenvolupament, els equips de seguretat necessiten eines dissenyades específicament per gestionar aquesta transició. Codex proporciona les interfícies de control, la gestió de la configuració, l’aïllament i la telemetria detallada amb coneixement dels agents necessaris per garantir una adopció segura. Amb aquestes capacitats implementades, els equips de seguretat poden habilitar Codex amb més confiança, equilibrant la productivitat dels desenvolupadors amb la visibilitat i el control necessaris per a la seguretat empresarial. Més informació sobre la configuració de Codex es pot trobar aquí⁠(s'obre en una finestra nova), i la de l'API de compliment normatiu, aquí⁠(s'obre en una finestra nova).

Autor

OpenAI

Continuar llegint

Veure-ho tot

Safety and alignment in an era of long-horizon models

Seguretat20 de jul. del 2026

Why teens deserve access to safe AI — card image

Per què els adolescents mereixen accés a una IA segura

Seguretat16 de jul. del 2026

GPT-Red: automillora per a la robustesa

Seguretat15 de jul. del 2026