2026年5月8日

在 OpenAI 安全運行 Codex

了解 OpenAI 如何以控制機制、界限與遙測，管理智能代理在真實工作流程中的編碼操作。

正在載入...

隨着 AI 系統變得更強大，AI 亦越來越能夠代表用戶採取行動。編碼智能代理可自主檢視程式碼庫、執行指令，並與開發工具互動。這些工作以往都需要由人員直接執行。

透過 Codex，我們在設計這些能力的同時，亦加入機構安全部署所需的控制措施。安全團隊需要方法管理智能代理如何運作，例如智能代理可以存取的範圍、何時需要人工批准、可與哪些系統互動，以及有哪些遙測資料可用於解釋其行為。

在 OpenAI，我們部署 Codex 時有幾個清晰目標：讓智能代理在明確的技術邊界內運作；讓開發人員能快速執行低風險操作；並清楚標示較高風險的操作。我們亦會保留智能代理原生遙測資料，以便了解和審核智能代理曾執行的工作。實際上，這代表採用受管理配置、受限制執行、網絡政策，以及智能代理原生日誌。

控制 Codex 的運作方式

我們部署 Codex 時遵循一項簡單原則：它應在有界限的環境內保持高效；低風險的日常操作應順暢無阻；較高風險的操作則應暫停並等待審查。

沙盒與批准

批准和沙盒會互相配合。沙盒界定技術執行邊界，包括 Codex 可在哪些位置寫入、是否可以連接網絡，以及哪些路徑仍受保護。批准政策則決定 Codex 何時必須先提出請求才可執行操作，例如需要在沙盒範圍之外執行某項操作時。用戶可以只批准該次操作，或批准該工作階段內同類型的操作。

對於跨越沙盒邊界的要求，我們正使用自動審查模式⁠（在新視窗中開啟）。這項功能啟用後，會自動批准某些類型的要求，減少用戶需要停下來批准 Codex 操作的次數。Codex 會將計劃執行的操作和近期上下文傳送至自動批准子智能代理，後者可自動批准低風險操作，或在用戶授權等級足夠時自動批准高風險操作，而無需打斷用戶。這讓 Codex 能夠繼續處理例行工作，同時在較高風險或可能產生非預期後果的操作前暫停。

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

網絡存取

我們不會讓 Codex 擁有不受限制的對外存取權。我們的受管理網絡政策會允許預期目的地、封鎖我們不希望 Codex 連接的目的地，並要求對不熟悉的網域作出批准。這樣可讓 Codex 完成常見且已知安全的工作流程，而無需授予廣泛的網絡存取權。

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

身份與憑證

我們亦會管理 Codex 的身份驗證方式。CLI 和 MCP OAuth 憑證會儲存在安全的作業系統鑰匙圈中，登入必須透過 ChatGPT 進行，而存取權亦會固定連結至我們的 ChatGPT 企業工作區。這樣可確保 Codex 使用情況與我們的工作區層級控制措施相連，並讓我們企業工作區的 Codex 活動可在 ChatGPT 合規日誌平台中查閱。

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

規則

我們使用規則，避免 Codex 將每個 shell 指令都視為同等安全。工程師在日常開發中常用的無害指令，即使在沙盒之外亦可無需批准即可執行；而特定危險指令則可以被封鎖或要求批准。這讓 Codex 能夠快速處理一般工程任務，同時仍會強制審查，或封鎖我們不希望在沙盒之外執行的模式。

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

受管理配置

我們會透過雲端管理要求、macOS 受管理偏好設定和本機要求檔案，落實這套安全取向。要求是由管理員強制執行的控制措施，用戶無法覆寫。macOS 受管理偏好設定和本機要求檔案，讓我們在維持一致基準的同時，仍可按團隊、用戶群組或環境測試不同配置。這些配置適用於本機 Codex 介面，包括桌面應用程式、CLI 和 IDE 擴充功能。

智能代理原生遙測與審核軌跡

控制只是其中一半工作。智能代理部署後，安全團隊需要看清這些智能代理正在做甚麼，以及背後原因。查看 Codex 所採取的操作時，傳統安全日誌仍然有用，但它們大多只能回答發生了甚麼：某個程序已啟動、某個檔案已變更、曾嘗試建立網絡連接。防禦者仍需要自行判斷 Codex 為何執行某項操作，或用戶的意圖是甚麼。

Codex 可以為安全團隊提供更能反映智能代理行為的視角。Codex 支援匯出 OpenTelemetry 日誌，涵蓋多種 Codex 事件，例如用戶提示詞、工具批准決定、工具執行結果、MCP 伺服器使用情況，以及網絡代理允許或拒絕事件。Enterprise 和 Edu 客戶亦可透過 OpenAI 合規平台查閱 Codex 活動日誌。

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

在 OpenAI，我們會將 Codex 日誌與 AI 驅動的安全分流智能代理一併使用。當端點警報顯示 Codex 執行了異常操作時，端點安全工具會告知我們發生了可疑事件。之後，Codex 日誌會協助說明用戶與智能代理當時的相關意圖。我們的 AI 安全分流智能代理會使用 Codex 日誌檢查原始要求、工具活動、批准決定、工具結果，以及任何相關的網絡政策決定或封鎖。AI 安全分流智能代理會將分析結果提交給安全團隊審查，以區分預期中的智能代理行為、無害錯誤，以及真正需要升級處理的活動。

我們亦會在營運層面使用相同的遙測資料。我們會利用這些日誌了解內部採用情況如何變化、哪些工具和 MCP 伺服器正在被使用、網絡沙盒封鎖或提示批准的頻率，以及推出流程仍需要調整的地方。這些 OpenTelemetry 日誌可以集中到 SIEM 和合規日誌系統中。

展望未來

隨着 Codex 等編碼智能代理整合到開發流程中，安全團隊需要專門設計的工具來管理這項轉變。Codex 提供控制介面、配置管理、沙盒，以及詳盡且能反映智能代理行為的遙測資料，協助確保安全採用。有了這些能力，安全團隊便可更有信心地啟用 Codex，在開發人員生產力與企業安全所需的可視性和控制之間取得平衡。更多有關配置 Codex 的資訊可參閱此處⁠（在新視窗中開啟），而有關 Compliance API 的資訊則可參閱此處⁠（在新視窗中開啟）。

作者

OpenAI

繼續閲讀

查看全部

Safety and alignment in an era of long-horizon models

安全2026年7月20日

Why teens deserve access to safe AI — card image

為何青少年應能使用安全的 AI

安全2026年7月16日

GPT-Red：解鎖提升穩健性的自我改進能力

安全2026年7月15日