8. maí 2026

Að keyra Codex á öruggan hátt hjá OpenAI

Yfirlit yfir stýringar, mörk og fjarmælingagögn sem OpenAI notar til að hafa umsjón með kóðunarfulltrúum í raunverulegum vinnuflæðum.

Hleður inn...

Eftir því sem gervigreindarkerfi verða hæfari, framkvæma þau í auknum mæli aðgerðir fyrir hönd notenda. Kóðunarfulltrúar geta sjálfstætt yfirfarið geymslur, keyrt skipanir og átt í samskiptum við þróunarverkfæri. Þetta eru verkefni sem áður kröfðust beinnar framkvæmdar af hálfu manna.

Með Codex höfum við hannað þessa getu samhliða þeim stýringum sem fyrirtæki þurfa til öruggrar innleiðingar. Öryggisteymi þurfa leiðir til að stýra því hvernig fulltrúar starfa: hverju þeir geta fengið aðgang að, hvenær samþykki frá manneskju er nauðsynlegt, hvaða kerfum þeir geta átt samskipti við og hvaða fjarmælingagögn eru tiltæk til að útskýra hegðun þeirra.

Hjá OpenAI notum við Codex með nokkur skýr markmið: að halda fulltrúa innan skýrra tæknilegra marka, gera þróunaraðilum kleift að vinna hratt að lágáhættuverkefnum og gera hááhættuverkefni skýrari. Við varðveitum einnig innbyggð fjarmæligögn fulltrúans til að skilja og endurskoða aðgerðir hans. Í reynd þýðir það stýrðar stillingar, takmarkaða keyrslu, netstefnur og innbyggða skráningu fulltrúa.

Stjórnun á því hvernig Codex starfar

Við setjum Codex í notkun með þeirri einföldu meginreglu að það skuli vera afkastamikið innan afmarkaðs umhverfis, daglegar aðgerðir með litla áhættu skuli vera hnökralausar og aðgerðir með meiri áhættu skuli stöðvast til yfirferðar.

Sandkassi og leyfisveitingar

Samþykki og sandkassar vinna saman. Sandkassinn skilgreinir tæknileg mörk keyrslu, þar á meðal hvar Codex getur skrifað, hvort það hafi aðgang að netinu og hvaða slóðir eru verndaðar. Samþykktarstefna ákvarðar hvenær Codex þarf að biðja um leyfi til að framkvæma aðgerð, til dæmis utan sandkassans. Notendur geta samþykkt aðgerðina einu sinni eða samþykkt þessa tegund aðgerða fyrir lotuna.

Fyrir beiðnir sem fara yfir mörk sandkassans notum við sjálfvirka yfirferð⁠(opnast í nýjum glugga), eiginleika sem, þegar kveikt er á honum, samþykkir sjálfkrafa ákveðnar tegundir beiðna til að draga úr því hversu oft notendur þurfa að stöðva og samþykkja aðgerðir Codex. Codex sendir fyrirhugaða aðgerð og nýlegt samhengi til undirfulltrúans fyrir sjálfvirkt samþykki, sem getur sjálfkrafa samþykkt áhættulitlar aðgerðir – eða áhættumiklar aðgerðir með nægilegu stigi notendaheimildar – í stað þess að trufla notandann. Þannig heldur Codex áfram með venjubundin verkefni en stöðvast samt við áhættumeiri aðgerðir eða aðgerðir með ófyrirséðar afleiðingar.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

Netaðgangur

Við keyrum ekki Codex með opnum útleiðaraðgangi. Stýrða netstefnan okkar leyfir fyrirfram þekkta áfangastaði, lokar á þá sem við viljum ekki að Codex nái til, og krefst samþykkis fyrir óþekkt lén. Þetta gerir Codex kleift að ljúka algengum, þekktum og áreiðanlegum verkflæðum án þess að veita víðtækan netaðgang.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

Auðkenni og aðgangsupplýsingar

Við sjáum einnig um hvernig Codex auðkennir sig. OAuth-skilríki fyrir CLI og MCP eru geymd í öruggri lyklageymslu stýrikerfisins, krafist er innskráningar í gegnum ChatGPT og aðgangurinn er bundinn við ChatGPT Enterprise-vinnusvæði okkar. Það heldur notkun Codex tengdri stýringum okkar á vinnusvæðisstigi og gerir virkni Codex aðgengilega á ChatGPT Compliance Logs Platform fyrir Enterprise-vinnusvæðið okkar.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

Reglur

Við notum reglur svo Codex líti ekki á allar skeljarskipanir sem jafn öruggar. Algengar skaðlausar skipanir sem verkfræðingar nota í daglegri þróun eru leyfðar án samþykkis utan sandkassans, en tilteknar hættulegar skipanir geta verið lokaðar eða krafist samþykkis. Það gerir Codex kleift að komast hratt í gegnum almenn verkfræðiverkefni, en knýr samt fram yfirferð eða lokar á mynstur sem við viljum ekki keyra utan sandkassans.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

Stýrðar stillingar

Við beitum þessari nálgun með samsetningu skýjastýrðra krafna, stýrðra macOS-kjörstillinga og staðbundinna kröfuskráa. Kröfur eru stjórnendastýringar sem notendur geta ekki hnekkt. Stýrðar kjörstillingar macOS og staðbundnar kröfuskrár gera okkur kleift að viðhalda samræmdum grunnviðmiðum á meðan við prófum mismunandi uppsetningar eftir teymi, notendahópi eða umhverfi. Þessar stillingar gilda á öllum staðbundnum Codex-verkflötum, þar á meðal skjáborðsforritinu, CLI og IDE-viðbótinni.

Fulltrúamiðaðar fjarmælingar og endurskoðunarslóðir

Að stjórna er aðeins hálft verkið. Þegar fulltrúar hafa verið settir í notkun þurfa öryggisteymi að hafa yfirsýn yfir hvað þessir fulltrúar eru að gera og hvers vegna. Hefðbundnar öryggisskrár eru enn gagnlegar þegar skoðaðar eru aðgerðir sem Codex hefur framkvæmt, en þær svara aðallega því hvað gerðist: ferli var ræst, skrá breyttist, reynt var að koma á nettengingu. Varnaraðilar þurfa enn sjálfir að átta sig á hvers vegna Codex gerði eitthvað, eða hver ásetningur notandans var.

Codex getur veitt öryggisteymum betri yfirsýn yfir fulltrúa. Codex styður útflutning OpenTelemetry-skráa fyrir ýmsa Codex-viðburði, svo sem kvaðningar notenda, samþykkisákvarðanir fyrir verkfæri, niðurstöður úr keyrslu verkfæra, notkun MCP-netþjóna og viðburði þar sem netproxy leyfir eða synjar. Virkniskrár Codex eru einnig tiltækar í gegnum OpenAI-samræmisverkvanginn fyrir Enterprise- og Edu-viðskiptavini.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

Hjá OpenAI notum við Codex-skráningargögn ásamt gervigreindarknúnum fulltrúa öryggisforgangsgreiningar. Þegar endapunktsviðvörun gefur til kynna að Codex hafi gert eitthvað óvenjulegt, lætur endapunktsöryggisverkfærið vita af grunsamlegum atburði. Codex-annálar hjálpa þá til við að útskýra fyrirætlanir notandans og fulltrúans í samhengi við aðstæður. Gervigreindarfulltrúi okkar fyrir öryggisforgangsgreiningu notar Codex-skráningar til að skoða upphaflegu beiðnina, virkni verkfæra, samþykktarákvarðanir, niðurstöður verkfæra og hvers kyns viðeigandi netstefnuákvörðun eða -lokun. Gervigreindarfulltrúi okkar fyrir öryggisforgangsgreiningu leggur greiningu sína fyrir öryggisteymi okkar til yfirferðar, til að greina á milli væntrar hegðunar fulltrúa, saklausra mistaka og virkni sem raunverulega gefur tilefni til stigmögnunar.

Við notum einnig sömu fjarmælingagögnin í rekstrarlegum tilgangi. Við notum þessa annála til að skilja hvernig innri upptaka er að breytast, hvaða verkfæri og MCP-netþjónar eru notuð, hversu oft network sandbox lokar á eða biður um staðfestingu og hvar útleiðslan þarfnast enn fínstillingar. Þessa OpenTelemetry-annála er hægt að miðstýra í SIEM-kerfum og skráningarkerfum fyrir reglufylgni.

Horft fram á veginn

Eftir því sem kóðunarfulltrúar á borð við Codex verða samþættir þróunarverkflæðum þurfa öryggisteymi verkfæri sem eru sérstaklega hönnuð til að halda utan um þessa breytingu. Codex veitir stýrifletina, stillingastjórnun, sandkassa og ítarlegar fjarmælingar með vitund um fulltrúa sem þarf til að tryggja örugga innleiðingu. Með þessa getu til staðar geta öryggisteymi virkjað Codex með meira sjálfstrausti og vegið saman framleiðni þróunaraðila og þá yfirsýn og stjórn sem öryggi á fyrirtækjastigi krefst. Nánari upplýsingar um hvernig á að stilla Codex má finna hér⁠(opnast í nýjum glugga) og um Compliance API hér⁠(opnast í nýjum glugga).

Höfundur

OpenAI

Haltu áfram að lesa

Skoða allt

Safety and alignment in an era of long-horizon models

Öryggi20. júl. 2026

Why teens deserve access to safe AI — card image

Af hverju unglingar eiga skilið aðgang að öruggri gervigreind

Öryggi16. júl. 2026

GPT-Red: Opnar fyrir sjálfbætingu í viðnámi

Öryggi15. júl. 2026