8. mai 2026

Slik kjører OpenAI Codex trygt

En gjennomgang av kontrollene, grensene og telemetrien OpenAI bruker for å styre kodeagenter i reelle arbeidsflyter.

Laster inn …

Etter hvert som KI-systemene blir mer kapable, handler de i økende grad på vegne av brukere. Kodeagenter kan autonomt gjennomgå kodebaser, kjøre kommandoer og samhandle med utviklerverktøy. Dette er oppgaver som tidligere krevde direkte menneskelig utførelse.

Med Codex har vi utformet disse funksjonene sammen med kontrollene organisasjoner trenger for sikker utrulling. Sikkerhetsteamene trenger metoder for å styre hvordan agenter opererer: hva de kan få tilgang til, når menneskelig godkjenning kreves, hvilke systemer de kan samhandle med, og hvilken telemetri som finnes for å forklare atferden deres.

Hos OpenAI ruller vi ut Codex med noen tydelige mål: holde agenten innenfor klare tekniske grenser, la utviklere jobbe raskt med handlinger med lav risiko, og gjøre handlinger med høyere risiko eksplisitte. Vi bevarer også agentbasert telemetri slik at vi kan forstå og revidere hva agenten gjorde. I praksis betyr det administrert konfigurasjon, begrenset kjøring, retningslinjer for godkjenning og agentbaserte logger.

Kontrollere hvordan hvordan Codex fungerer

Vi ruller ut Codex med et enkelt prinsipp om at den skal være produktivt innenfor et avgrenset miljø, at daglige handlinger med lav risiko skal være friksjonsfrie, og at handlinger med høyere risiko skal stoppe for gjennomgang.

Sandkasse og godkjenninger

Godkjenninger og sandkasse virker sammen. Sandkassen definerer den tekniske gjennomføringsgrensen, inkludert hvor Codex kan skrive, om den kan nå nettverket, og hvilke baner som forblir beskyttet. Retningslinjer for godkjenning avgjør når Codex må be om å utføre en handling, for eksempel når den må gjøre noe utenfor sandkassen. Brukere kan godkjenne handlingen én gang, eller godkjenne den typen handling for denne økten.

Når det gjelder forespørsler som krysser sandkassegrensen, bruker vi Automatisk gjennomgangsmodus⁠(åpnes i et nytt vindu). Når den er slått på, godkjenner den automatisk enkelte typer forespørsler, slik at brukere sjeldnere må stoppe opp og godkjenne handlinger fra Codex. Codex sender den planlagte handlingen og den nyeste konteksten til underagenten for automatisk godkjenning, som automatisk kan godkjenne handlinger med lav risiko – eller handlinger med høy risiko med tilstrekkelig brukerautorisasjon – i stedet for å avbryte brukeren. Det holder Codex i gang med rutinearbeid, samtidig som den fortsatt stopper for handlinger med høyere risiko eller med utilsiktede konsekvenser.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

Nettverkstilgang

Vi kjører ikke Codex med ubegrenset utgående tilgang. Våre administrerte retningslinjer for godkjenning tillater forventede destinasjoner, blokkerer destinasjoner vi ikke vil at Codex skal nå, og krever godkjenning for ukjente domener. Dette gjør at Codex fullfører vanlige, velkjente arbeidsflyter uten å gi bred nettverkstilgang.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

Identitet og legitimasjon

Vi styrer også hvordan Codex autentiseres. CLI- og MCP-OAuth-legitimasjon lagres i operativsystemets sikre nøkkelring, innlogging tvinges gjennom ChatGPT, og tilgang er låst til vårt ChatGPT Enterprise-arbeidsområde. Dette gjør at bruk av Codex er knyttet til kontrollene våre på arbeidsområdenivå, og gjør Codex-aktivitet tilgjengelig i ChatGPT Compliance Logs Platform for vårt Enterprise-arbeidsområde.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

Regler

Vi bruker regler slik at Codex ikke behandler hver skallkommando som like trygg. Vanlige ufarlige kommandoer som ingeniører bruker i daglig utvikling, tillates uten godkjenning utenfor sandkassen, og bestemte farlige kommandoer kan blokkeres eller kreve godkjenning. Det gjør at kan Codex bevege seg raskt gjennom vanlige utvikleroppgaver, samtidig som den fortsatt tvinger frem gjennomgang eller blokkerer mønstre vi ikke vil kjøre utenfor sandkassen.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

Administrerte konfigurasjoner

Vi håndhever denne tilnærmingen gjennom en kombinasjon av skyadministrerte krav, administrerte macOS-innstillinger og lokale kravfiler. Krav er kontroller håndhevet av administrator som brukere ikke kan overstyre. De administrerte macOS-innstillingene og lokale kravfilene gjør det mulig for oss å holde en konsekvent grunnlinje, samtidig som vi fortsatt tester ulike konfigurasjoner etter team, brukergruppe eller miljø. Disse konfigurasjonene gjelder på tvers av lokale Codex-overflater, inkludert skrivebordsappen, CLI og IDE-utvidelsen.

Agentnativ telemetri og revisjonsspor

Kontroll er bare halve jobben. Når agenter først er rullet ut, trenger sikkerhetsteam innsikt i hva disse agentene gjør og hvorfor. Tradisjonelle sikkerhetslogger er fortsatt nyttige når man ser på handlinger utført av Codex, men de svarer for det meste bare på hva som skjedde: en prosess som er startet, en fil som ble endret, en nettverkstilkobling som ble forsøkt. Forsvarere må fortsatt finne ut hvorfor Codex gjorde noe, eller hva brukerens hensikt var.

Codex kan gi sikkerhetsteam en mer agentbevisst oversikt. Codex støtter OpenTelemetry-loggeksport for ulike Codex-hendelser som brukerprompter, beslutninger om verktøygodkjenning, resultater av verktøykjøring, bruk av MCP-servere og nettverksproxyhendelser for tillatelse eller avslag. Codex-aktivitetslogger er også tilgjengelige gjennom OpenAI Compliance Platform for Enterprise- og Edu-kunder.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

Hos OpenAI bruker vi Codex-logger sammen med vår KI-drevne agent for sikkerhetstriagering. Når et endepunktvarsel sier at Codex gjorde noe uvanlig, forteller endepunktsikkerhetsverktøyet oss at en mistenkelig hendelse oppsto. Codex-loggene bidrar deretter til å forklare den omkringliggende hensikten hos brukeren og agenten. Vår KI-agent for sikkerhetstriagering bruker Codex-logger til å undersøke den opprinnelige forespørselen, verktøyaktivitet, godkjenningsbeslutninger, verktøyresultater og eventuelle relevante beslutninger eller blokkeringer i retningslinjer for godkjenning. KI-agenten for sikkerhetstriagering presenterer analysen sin for sikkerhetsteamet vårt for gjennomgang, slik at de kan skille mellom forventet agentatferd, ufarlige feil og aktivitet som faktisk krever eskalering.

Vi bruker også den samme telemetrien operativt. Vi bruker disse loggene til å forstå hvordan intern bruk endrer seg, hvilke verktøy og MCP-servere som brukes, hvor ofte nettverkssandkassen blokkerer eller ber om handling, og hvor utrullingen fortsatt trenger justering. Disse OpenTelemetry-loggene kan sentraliseres i SIEM- og samsvarsloggsystemer.

Fremtidsutsikter

Etter hvert som kodeagenter som Codex blir integrert i utviklingsarbeidsflyter, trenger sikkerhetsteam verktøy som er spesifikt utviklet for å håndtere denne overgangen. Codex gir kontrollflatene, konfigurasjonsstyringen, sandkassingen og den detaljerte agentbevisste telemetrien som trengs for å sikre trygg innføring. Med disse funksjonene på plass, kan sikkerhetsteam aktivere Codex med større trygghet og balansere utviklerproduktivitet med synligheten og kontrollen som kreves for sikkerhet på bedriftsnivå. Mer informasjon om konfigurering av Codex finnes her⁠(åpnes i et nytt vindu), og om Compliance API her⁠(åpnes i et nytt vindu).

Forfatter

OpenAI

Les videre

Se alle

Safety and alignment in an era of long-horizon models

Sikkerhet20. juli 2026

Why teens deserve access to safe AI — card image

Hvorfor tenåringer fortjener tilgang til trygg KI

Sikkerhet16. juli 2026

GPT-Red: Låser opp selvforbedring for robusthet

Sikkerhet15. juli 2026