8. maj 2026

At køre Codex sikkert hos OpenAI

Et kig på de kontroller, grænser og den telemetri, OpenAI bruger til at styre kodningsagenter i virkelige arbejdsgange.

Indlæser ...

Efterhånden som AI-systemer bliver mere kompetente, handler de i stigende grad på brugernes vegne. Kodningsagenter kan autonomt gennemgå repositories, køre kommandoer og interagere med udviklingsværktøjer. Det er opgaver, som tidligere krævede direkte menneskelig udførelse.

Med Codex har vi designet disse funktioner sammen med de kontroller, som organisationer har brug for til sikker implementering. Sikkerhedsteams har brug for måder at styre, hvordan agenter arbejder: hvad de kan få adgang til, hvornår menneskelig godkendelse er påkrævet, hvilke systemer de kan interagere med, og hvilken telemetri der findes for at forklare deres adfærd.

Hos OpenAI implementerer vi Codex med nogle få klare mål: at holde agenten inden for tydelige tekniske grænser, lade udviklere bevæge sig hurtigt ved handlinger med lav risiko og gøre handlinger med højere risiko eksplicitte. Vi bevarer også agentbaseret telemetri, så vi kan forstå og auditere, hvad agenten gjorde. I praksis betyder det administreret konfiguration, begrænset eksekvering, netværkspolitikker og agentbaserede logge.

Styring af, hvordan Codex fungerer

Vi implementerer Codex ud fra et enkelt princip: at den skal være produktiv inden for et afgrænset miljø, at daglige handlinger med lav risiko skal være gnidningsfri, og at handlinger med højere risiko skal stoppe op til gennemgang.

Sandboxing og godkendelser

Godkendelser og sandboxing fungerer sammen. Sandboxen fastlægger de tekniske rammer for udførelsen, herunder hvor Codex må skrive, om det har adgang til netværket, og hvilke stier der forbliver beskyttede. Godkendelsespolitikken bestemmer, hvornår Codex skal anmode om tilladelse til at udføre en handling, f.eks. når det skal udføre en handling uden for sandboxen. Brugere kan godkende handlingen én gang eller godkende den pågældende type handling for den aktuelle session.

For anmodninger, der overstiger sandbox-grænsen, bruger vi Auto-review mode⁠(åbner i et nyt vindue), som er en funktion, der automatisk godkender visse typer anmodninger, når den er slået til, for at reducere, hvor ofte brugere skal stoppe op og godkende Codex-handlinger. Codex sender den planlagte handling og den seneste kontekst til underagenten for automatisk godkendelse, som automatisk kan godkende handlinger med lav risiko eller handlinger med høj risiko med et tilstrækkeligt niveau af brugerautorisation i stedet for at afbryde brugeren. Det holder Codex i gang med rutinearbejde, mens den stadig stopper ved handlinger med højere risiko eller handlinger med utilsigtede konsekvenser.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

Netværksadgang

Vi kører ikke Codex med ubegrænset udgående adgang. Vores administrerede netværkspolitik tillader forventede destinationer, blokerer destinationer, som vi ikke ønsker, at Codex skal nå, og kræver godkendelse for ukendte domæner. Det gør, at Codex kan fuldføre almindelige, velkendte arbejdsgange uden at give den bred netværksadgang.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

Identitet og legitimationsoplysninger

Vi styrer også, hvordan Codex autentificerer. OAuth-legitimationsoplysninger til CLI og MCP gemmes i den sikre OS-nøglering, login tvinges gennem ChatGPT, og adgang er bundet til vores ChatGPT Enterprise-arbejdsområde. Det holder Codex-brug knyttet til vores kontroller på arbejdsområdeniveau og gør Codex-aktivitet tilgængelig i ChatGPT Compliance Logs Platform for vores Enterprise-arbejdsområde.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

Regler

Vi bruger regler, så Codex ikke behandler alle shell-kommandoer som lige sikre. Almindelige, harmløse kommandoer, som ingeniører bruger i den daglige udvikling, er tilladt uden godkendelse uden for sandkassen, og specifikke farlige kommandoer kan blokeres eller kræve godkendelse. Det gør, at Codex hurtigt kan komme igennem almindelige udviklingsopgaver, mens den stadig tvinger gennemgang eller blokerer mønstre, som vi ikke ønsker at køre uden for sandkassen.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

Administrerede konfigurationer

Vi anvender denne tilgang gennem en kombination af cloudadministrerede krav, administrerede macOS-indstillinger og lokale kravfiler. Krav er administratorhåndhævede kontroller, som brugere ikke kan tilsidesætte. De administrerede macOS-indstillinger og lokale kravfiler gør det muligt for os at bevare et ensartet grundniveau og samtidig teste forskellige konfigurationer efter team, brugergruppe eller miljø. Disse konfigurationer gælder på tværs af lokale Codex-flader, herunder desktopappen, CLI og IDE-udvidelsen.

Agentbaseret telemetri og revisionsspor

Kontrol er kun halvdelen af arbejdet. Når agenter er implementeret, har sikkerhedsteams brug for indsigt i, hvad disse agenter gør, og hvorfor. Traditionelle sikkerhedslogge er stadig nyttige, når man ser på handlinger udført af Codex, men de svarer for det meste kun på, hvad der skete: en proces startede, en fil blev ændret, en netværksforbindelse blev forsøgt oprettet. Forsvarere står stadig tilbage med at skulle finde ud af, hvorfor Codex gjorde noget, eller hvad brugerens hensigt var.

Codex kan give sikkerhedsteams et mere agentbevidst overblik. Codex understøtter OpenTelemetry-logeksport til forskellige Codex-hændelser såsom brugerprompts, beslutninger om værktøjsgodkendelse, resultater af værktøjseksekvering, brug af MCP-servere og proxyhændelser for tilladt eller afvist netværk. Aktivitetslogge for Codex er også tilgængelige via OpenAI Compliance Platform for Enterprise- og Edu-kunder.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

Hos OpenAI bruger vi Codex-logge sammen med vores AI-drevne agent til sikkerhedstriagering. Når en endepunktsalarm siger, at Codex gjorde noget usædvanligt, fortæller endepunktssikkerhedsværktøjet os, at der er sket en mistænkelig hændelse. Codex-logge hjælper derefter med at forklare den omgivende hensigt hos brugeren og agenten. Vores AI-agent til sikkerhedstriagering bruger Codex-logge til at inspicere den oprindelige anmodning, værktøjsaktivitet, godkendelsesbeslutninger, værktøjsresultater og enhver relevant beslutning eller blokering fra netværkspolitikken. AI-agenten til sikkerhedstriagering præsenterer sin analyse for vores sikkerhedsteam til gennemgang for at skelne mellem forventet agentadfærd, harmløse fejl og aktivitet, der reelt kræver eskalering.

Vi bruger også den samme telemetri operationelt. Vi bruger disse logge til at forstå, hvordan den interne adoption ændrer sig, hvilke værktøjer og MCP-servere der bruges, hvor ofte netværkssandkassen blokerer eller giver prompt, og hvor udrulningen stadig har brug for justering. Disse OpenTelemetry-logge kan centraliseres i SIEM- og compliance-logningssystemer.

Fremadrettet

Efterhånden som kodeagenter som Codex bliver integreret i udviklingsprocesser, har sikkerhedsteams brug for værktøjer, der er specifikt designet til at håndtere dette skifte. Codex tilbyder kontrolflader, konfigurationsstyring, sandboxing og detaljeret agentbevidst telemetri, der er nødvendig for at sikre sikker adoption. Med disse funktioner på plads kan sikkerhedsteams aktivere Codex med større tryghed og balancere udviklerproduktivitet med den synlighed og kontrol, der kræves for virksomhedssikkerhed. Flere oplysninger om konfiguration af Codex findes her⁠(åbner i et nyt vindue), og flere oplysninger om Compliance API findes her⁠(åbner i et nyt vindue).

Skrevet af

OpenAI

Læs videre

Se alle

Safety and alignment in an era of long-horizon models

Sikkerhed20. jul. 2026

Why teens deserve access to safe AI

Sikkerhed16. jul. 2026

GPT-Red: Frigør selvforbedring for robusthed

Sikkerhed15. jul. 2026