跳到主要內容
OpenAI

2026年5月8日

系統防護安全

在 OpenAI 安全運行 Codex

了解 OpenAI 如何以控制機制、界限與遙測,管理智能代理在真實工作流程中的編碼操作。

正在載入...

隨着 AI 系統變得更強大,AI 亦越來越能夠代表用戶採取行動。編碼智能代理可自主檢視程式碼庫、執行指令,並與開發工具互動。這些工作以往都需要由人員直接執行。

透過 Codex,我們在設計這些能力的同時,亦加入機構安全部署所需的控制措施。安全團隊需要方法管理智能代理如何運作,例如智能代理可以存取的範圍、何時需要人工批准、可與哪些系統互動,以及有哪些遙測資料可用於解釋其行為。

在 OpenAI,我們部署 Codex 時有幾個清晰目標:讓智能代理在明確的技術邊界內運作;讓開發人員能快速執行低風險操作;並清楚標示較高風險的操作。我們亦會保留智能代理原生遙測資料,以便了解和審核智能代理曾執行的工作。實際上,這代表採用受管理配置、受限制執行、網絡政策,以及智能代理原生日誌。

控制 Codex 的運作方式

我們部署 Codex 時遵循一項簡單原則:它應在有界限的環境內保持高效;低風險的日常操作應順暢無阻;較高風險的操作則應暫停並等待審查。

沙盒與批准

批准和沙盒會互相配合。沙盒界定技術執行邊界,包括 Codex 可在哪些位置寫入、是否可以連接網絡,以及哪些路徑仍受保護。批准政策則決定 Codex 何時必須先提出請求才可執行操作,例如需要在沙盒範圍之外執行某項操作時。用戶可以只批准該次操作,或批准該工作階段內同類型的操作。

對於跨越沙盒邊界的要求,我們正使用自動審查模式(在新視窗中開啟)。這項功能啟用後,會自動批准某些類型的要求,減少用戶需要停下來批准 Codex 操作的次數。Codex 會將計劃執行的操作和近期上下文傳送至自動批准子智能代理,後者可自動批准低風險操作,或在用戶授權等級足夠時自動批准高風險操作,而無需打斷用戶。這讓 Codex 能夠繼續處理例行工作,同時在較高風險或可能產生非預期後果的操作前暫停。

TOML

1
# config.toml
2

3
# Turn on auto_review
4
approvals_reviewer = "auto_review"
5
# Add known development directories to the sandbox automatically
6
sandbox_workspace_write.writable_roots = ["~/development"]
7

8
# requirements.toml
9

10
# Require Codex to operate inside the sandbox
11
allowed_sandbox_modes = ["read-only", "workspace-write"]

網絡存取

我們不會讓 Codex 擁有不受限制的對外存取權。我們的受管理網絡政策會允許預期目的地、封鎖我們不希望 Codex 連接的目的地,並要求對不熟悉的網域作出批准。這樣可讓 Codex 完成常見且已知安全的工作流程,而無需授予廣泛的網絡存取權。

TOML

1
# requirements.toml
2

3
# Ensure web fetch only comes from OpenAI's cache
4
allowed_web_search_modes = ["cached"]
5

6
[experimental_network]
7
# Turn on Network Proxy
8
enabled = true
9
# Allow Codex to interact with localhost
10
allow_local_binding = true
11
# Block all requests to this domain
12
denied_domains = ["pastebin.com"]
13
# Auto-allow requests to these domains
14
allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

身份與憑證

我們亦會管理 Codex 的身份驗證方式。CLI 和 MCP OAuth 憑證會儲存在安全的作業系統鑰匙圈中,登入必須透過 ChatGPT 進行,而存取權亦會固定連結至我們的 ChatGPT 企業工作區。這樣可確保 Codex 使用情況與我們的工作區層級控制措施相連,並讓我們企業工作區的 Codex 活動可在 ChatGPT 合規日誌平台中查閱。

TOML

1
# config.toml
2

3
# Store CLI Auth Creds in OS Keychain
4
cli_auth_credentials_store = "keyring"
5
# Store MCP Creds in OS Keychain
6
mcp_oauth_credentials_store = "keyring"
7
# Require Auth via ChatGPT
8
forced_login_method = "chatgpt"
9
# Require Auth to Specific ChatGPT Workspace
10
forced_chatgpt_workspace_id = "<workspace-uuid>"

規則

我們使用規則,避免 Codex 將每個 shell 指令都視為同等安全。工程師在日常開發中常用的無害指令,即使在沙盒之外亦可無需批准即可執行;而特定危險指令則可以被封鎖或要求批准。這讓 Codex 能夠快速處理一般工程任務,同時仍會強制審查,或封鎖我們不希望在沙盒之外執行的模式。

Starlark

1
# default.rules
2

3
prefix_rule(
4
pattern = ["gh", "pr", ["view", "list"]],
5
decision = "allow",
6
justification = "Allows read-only GitHub PR inspection via gh CLI.",
7
)
8
prefix_rule(
9
pattern = ["kubectl", ["get", "describe", "logs"]],
10
decision = "allow",
11
justification = "Allows Kubernetes resource inspection for debugging.",
12
)

受管理配置

我們會透過雲端管理要求、macOS 受管理偏好設定和本機要求檔案,落實這套安全取向。要求是由管理員強制執行的控制措施,用戶無法覆寫。macOS 受管理偏好設定和本機要求檔案,讓我們在維持一致基準的同時,仍可按團隊、用戶群組或環境測試不同配置。這些配置適用於本機 Codex 介面,包括桌面應用程式、CLI 和 IDE 擴充功能。

智能代理原生遙測與審核軌跡

控制只是其中一半工作。智能代理部署後,安全團隊需要看清這些智能代理正在做甚麼,以及背後原因。查看 Codex 所採取的操作時,傳統安全日誌仍然有用,但它們大多只能回答發生了甚麼:某個程序已啟動、某個檔案已變更、曾嘗試建立網絡連接。防禦者仍需要自行判斷 Codex 為何執行某項操作,或用戶的意圖是甚麼。

Codex 可以為安全團隊提供更能反映智能代理行為的視角。Codex 支援匯出 OpenTelemetry 日誌,涵蓋多種 Codex 事件,例如用戶提示詞、工具批准決定、工具執行結果、MCP 伺服器使用情況,以及網絡代理允許或拒絕事件。Enterprise 和 Edu 客戶亦可透過 OpenAI 合規平台查閱 Codex 活動日誌。

TOML

1
# config.toml
2

3
[otel]
4
log_user_prompt = true
5
environment = "prod"
6

7
[otel.exporter.otlp-http]
8
endpoint = "http://localhost:14318/v1/logs"
9
protocol = "binary"

在 OpenAI,我們會將 Codex 日誌與 AI 驅動的安全分流智能代理一併使用。當端點警報顯示 Codex 執行了異常操作時,端點安全工具會告知我們發生了可疑事件。之後,Codex 日誌會協助說明用戶與智能代理當時的相關意圖。我們的 AI 安全分流智能代理會使用 Codex 日誌檢查原始要求、工具活動、批准決定、工具結果,以及任何相關的網絡政策決定或封鎖。AI 安全分流智能代理會將分析結果提交給安全團隊審查,以區分預期中的智能代理行為、無害錯誤,以及真正需要升級處理的活動。

我們亦會在營運層面使用相同的遙測資料。我們會利用這些日誌了解內部採用情況如何變化、哪些工具和 MCP 伺服器正在被使用、網絡沙盒封鎖或提示批准的頻率,以及推出流程仍需要調整的地方。這些 OpenTelemetry 日誌可以集中到 SIEM 和合規日誌系統中。

展望未來

隨着 Codex 等編碼智能代理整合到開發流程中,安全團隊需要專門設計的工具來管理這項轉變。Codex 提供控制介面、配置管理、沙盒,以及詳盡且能反映智能代理行為的遙測資料,協助確保安全採用。有了這些能力,安全團隊便可更有信心地啟用 Codex,在開發人員生產力與企業安全所需的可視性和控制之間取得平衡。更多有關配置 Codex 的資訊可參閱此處(在新視窗中開啟),而有關 Compliance API 的資訊則可參閱此處(在新視窗中開啟)

作者

OpenAI