Efterhånden som AI-systemer bliver mere kompetente, handler de i stigende grad på brugernes vegne. Kodningsagenter kan autonomt gennemgå repositories, køre kommandoer og interagere med udviklingsværktøjer. Det er opgaver, som tidligere krævede direkte menneskelig udførelse.
Med Codex har vi designet disse funktioner sammen med de kontroller, som organisationer har brug for til sikker implementering. Sikkerhedsteams har brug for måder at styre, hvordan agenter arbejder: hvad de kan få adgang til, hvornår menneskelig godkendelse er påkrævet, hvilke systemer de kan interagere med, og hvilken telemetri der findes for at forklare deres adfærd.
Hos OpenAI implementerer vi Codex med nogle få klare mål: at holde agenten inden for tydelige tekniske grænser, lade udviklere bevæge sig hurtigt ved handlinger med lav risiko og gøre handlinger med højere risiko eksplicitte. Vi bevarer også agentbaseret telemetri, så vi kan forstå og auditere, hvad agenten gjorde. I praksis betyder det administreret konfiguration, begrænset eksekvering, netværkspolitikker og agentbaserede logge.
Vi implementerer Codex ud fra et enkelt princip: at den skal være produktiv inden for et afgrænset miljø, at daglige handlinger med lav risiko skal være gnidningsfri, og at handlinger med højere risiko skal stoppe op til gennemgang.
Godkendelser og sandboxing fungerer sammen. Sandboxen fastlægger de tekniske rammer for udførelsen, herunder hvor Codex må skrive, om det har adgang til netværket, og hvilke stier der forbliver beskyttede. Godkendelsespolitikken bestemmer, hvornår Codex skal anmode om tilladelse til at udføre en handling, f.eks. når det skal udføre en handling uden for sandboxen. Brugere kan godkende handlingen én gang eller godkende den pågældende type handling for den aktuelle session.
For anmodninger, der overstiger sandbox-grænsen, bruger vi Auto-review mode(åbner i et nyt vindue), som er en funktion, der automatisk godkender visse typer anmodninger, når den er slået til, for at reducere, hvor ofte brugere skal stoppe op og godkende Codex-handlinger. Codex sender den planlagte handling og den seneste kontekst til underagenten for automatisk godkendelse, som automatisk kan godkende handlinger med lav risiko eller handlinger med høj risiko med et tilstrækkeligt niveau af brugerautorisation i stedet for at afbryde brugeren. Det holder Codex i gang med rutinearbejde, mens den stadig stopper ved handlinger med højere risiko eller handlinger med utilsigtede konsekvenser.
Vi kører ikke Codex med ubegrænset udgående adgang. Vores administrerede netværkspolitik tillader forventede destinationer, blokerer destinationer, som vi ikke ønsker, at Codex skal nå, og kræver godkendelse for ukendte domæner. Det gør, at Codex kan fuldføre almindelige, velkendte arbejdsgange uden at give den bred netværksadgang.
Vi styrer også, hvordan Codex autentificerer. OAuth-legitimationsoplysninger til CLI og MCP gemmes i den sikre OS-nøglering, login tvinges gennem ChatGPT, og adgang er bundet til vores ChatGPT Enterprise-arbejdsområde. Det holder Codex-brug knyttet til vores kontroller på arbejdsområdeniveau og gør Codex-aktivitet tilgængelig i ChatGPT Compliance Logs Platform for vores Enterprise-arbejdsområde.
Vi bruger regler, så Codex ikke behandler alle shell-kommandoer som lige sikre. Almindelige, harmløse kommandoer, som ingeniører bruger i den daglige udvikling, er tilladt uden godkendelse uden for sandkassen, og specifikke farlige kommandoer kan blokeres eller kræve godkendelse. Det gør, at Codex hurtigt kan komme igennem almindelige udviklingsopgaver, mens den stadig tvinger gennemgang eller blokerer mønstre, som vi ikke ønsker at køre uden for sandkassen.
Vi anvender denne tilgang gennem en kombination af cloudadministrerede krav, administrerede macOS-indstillinger og lokale kravfiler. Krav er administratorhåndhævede kontroller, som brugere ikke kan tilsidesætte. De administrerede macOS-indstillinger og lokale kravfiler gør det muligt for os at bevare et ensartet grundniveau og samtidig teste forskellige konfigurationer efter team, brugergruppe eller miljø. Disse konfigurationer gælder på tværs af lokale Codex-flader, herunder desktopappen, CLI og IDE-udvidelsen.
Kontrol er kun halvdelen af arbejdet. Når agenter er implementeret, har sikkerhedsteams brug for indsigt i, hvad disse agenter gør, og hvorfor. Traditionelle sikkerhedslogge er stadig nyttige, når man ser på handlinger udført af Codex, men de svarer for det meste kun på, hvad der skete: en proces startede, en fil blev ændret, en netværksforbindelse blev forsøgt oprettet. Forsvarere står stadig tilbage med at skulle finde ud af, hvorfor Codex gjorde noget, eller hvad brugerens hensigt var.
Codex kan give sikkerhedsteams et mere agentbevidst overblik. Codex understøtter OpenTelemetry-logeksport til forskellige Codex-hændelser såsom brugerprompts, beslutninger om værktøjsgodkendelse, resultater af værktøjseksekvering, brug af MCP-servere og proxyhændelser for tilladt eller afvist netværk. Aktivitetslogge for Codex er også tilgængelige via OpenAI Compliance Platform for Enterprise- og Edu-kunder.
Hos OpenAI bruger vi Codex-logge sammen med vores AI-drevne agent til sikkerhedstriagering. Når en endepunktsalarm siger, at Codex gjorde noget usædvanligt, fortæller endepunktssikkerhedsværktøjet os, at der er sket en mistænkelig hændelse. Codex-logge hjælper derefter med at forklare den omgivende hensigt hos brugeren og agenten. Vores AI-agent til sikkerhedstriagering bruger Codex-logge til at inspicere den oprindelige anmodning, værktøjsaktivitet, godkendelsesbeslutninger, værktøjsresultater og enhver relevant beslutning eller blokering fra netværkspolitikken. AI-agenten til sikkerhedstriagering præsenterer sin analyse for vores sikkerhedsteam til gennemgang for at skelne mellem forventet agentadfærd, harmløse fejl og aktivitet, der reelt kræver eskalering.
Vi bruger også den samme telemetri operationelt. Vi bruger disse logge til at forstå, hvordan den interne adoption ændrer sig, hvilke værktøjer og MCP-servere der bruges, hvor ofte netværkssandkassen blokerer eller giver prompt, og hvor udrulningen stadig har brug for justering. Disse OpenTelemetry-logge kan centraliseres i SIEM- og compliance-logningssystemer.
Efterhånden som kodeagenter som Codex bliver integreret i udviklingsprocesser, har sikkerhedsteams brug for værktøjer, der er specifikt designet til at håndtere dette skifte. Codex tilbyder kontrolflader, konfigurationsstyring, sandboxing og detaljeret agentbevidst telemetri, der er nødvendig for at sikre sikker adoption. Med disse funktioner på plads kan sikkerhedsteams aktivere Codex med større tryghed og balancere udviklerproduktivitet med den synlighed og kontrol, der kræves for virksomhedssikkerhed. Flere oplysninger om konfiguration af Codex findes her(åbner i et nyt vindue), og flere oplysninger om Compliance API findes her(åbner i et nyt vindue).


