跳至主要內容
OpenAI

2026年5月8日

安全防護安全

在 OpenAI 安全使用 Codex

一覽 OpenAI 如何以控制機制、邊界與遙測資料,在實際工作流程中管理程式設計智慧體。

載入中…

AI 系統能力日益提升,愈來愈常代表使用者執行操作。程式碼編寫智慧體可以自主檢查程式碼庫、執行命令,並與開發工具互動。這些任務過去都需要由人類直接操作。

針對 Codex,我們在設計這些能力時,也一併納入組織安全部署所需的控制機制。安全團隊需要能管理智慧體的運作方式,包括可存取哪些資源、何時需要人工核准、可與哪些系統互動,以及有哪些遙測資料可協助解釋其行為。

在 OpenAI,我們部署 Codex 時有幾個明確目標:讓智慧體維持在清楚的技術邊界內、讓開發人員能快速處理低風險操作,並明確區分高風險操作。我們也保留智慧體原生遙測資料,以便了解並稽核智慧體執行過哪些操作。實務上,這代表受管理的設定、受限的執行環境、網路政策,以及智慧體原生日誌。

控制 Codex 的運作方式

我們部署 Codex 時遵循一項簡單原則:讓它能在受限環境中有效運作,低風險的日常操作應該順暢無阻,而高風險操作則暫緩並等待審查。

沙盒與核准

核准機制與沙盒會互相配合。沙盒定義了技術執行邊界,包括 Codex 可在哪些位置寫入、是否可連線至網路,以及哪些路徑仍受保護。核准政策則決定 Codex 何時必須請求執行某項操作,例如需要執行超出沙盒範圍的動作時。使用者可以單次核准該操作,也可以核准該工作階段中的同類型操作。

對於跨越沙盒邊界的請求,我們會使用自動審閱模式(在新視窗中開啟)。這項功能開啟後,會自動核准特定類型的請求,減少使用者必須停下來核准 Codex 動作的頻率。Codex 會將規劃的動作和近期內容脈絡傳送給自動核准子代理;該子代理可以自動核准低風險動作,或是在具備足夠層級的使用者授權時,自動核准高風險動作,而不會打斷使用者。如此一來,Codex 可持續處理例行工作,同時仍會在風險較高或可能造成非預期後果的動作前停下來。

TOML

1
# config.toml
2

3
# Turn on auto_review
4
approvals_reviewer = "auto_review"
5
# Add known development directories to the sandbox automatically
6
sandbox_workspace_write.writable_roots = ["~/development"]
7

8
# requirements.toml
9

10
# Require Codex to operate inside the sandbox
11
allowed_sandbox_modes = ["read-only", "workspace-write"]

網路存取

我們不會讓 Codex 在具備開放式對外存取權限的情況下運作。我們受管理的網路政策會允許預期中的目的地、封鎖不希望 Codex 連線的目的地,並要求對陌生網域進行核准。這讓 Codex 能完成常見且已知安全的工作流程,同時避免授予 Codex 過於廣泛的網路存取權限。

TOML

1
# requirements.toml
2

3
# Ensure web fetch only comes from OpenAI's cache
4
allowed_web_search_modes = ["cached"]
5

6
[experimental_network]
7
# Turn on Network Proxy
8
enabled = true
9
# Allow Codex to interact with localhost
10
allow_local_binding = true
11
# Block all requests to this domain
12
denied_domains = ["pastebin.com"]
13
# Auto-allow requests to these domains
14
allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

身分識別與憑證

我們也會管理 Codex 的驗證方式。CLI 與 MCP OAuth 憑證會儲存在安全的作業系統金鑰圈中,登入必須透過 ChatGPT 進行,而存取權限則會綁定到我們的 ChatGPT 企業工作區。這讓 Codex 的使用維持在工作區層級的控制範圍內,也讓企業工作區能透過 ChatGPT Compliance Logs Platform 查看 Codex 活動紀錄。

TOML

1
# config.toml
2

3
# Store CLI Auth Creds in OS Keychain
4
cli_auth_credentials_store = "keyring"
5
# Store MCP Creds in OS Keychain
6
mcp_oauth_credentials_store = "keyring"
7
# Require Auth via ChatGPT
8
forced_login_method = "chatgpt"
9
# Require Auth to Specific ChatGPT Workspace
10
forced_chatgpt_workspace_id = "<workspace-uuid>"

規則

我們使用規則,避免 Codex 將每個 Shell 指令都視為同等安全。在沙盒外,工程師日常開發中常見且無害的命令可在無需核准的情況下執行,而特定危險命令則可被封鎖或要求核准。這讓 Codex 能快速處理一般工程任務,同時仍會強制審查,或封鎖我們不希望在沙盒外執行的模式。

Starlark

1
# default.rules
2

3
prefix_rule(
4
pattern = ["gh", "pr", ["view", "list"]],
5
decision = "allow",
6
justification = "Allows read-only GitHub PR inspection via gh CLI.",
7
)
8
prefix_rule(
9
pattern = ["kubectl", ["get", "describe", "logs"]],
10
decision = "allow",
11
justification = "Allows Kubernetes resource inspection for debugging.",
12
)

受管理的設定

我們透過雲端管理的管控規則、macOS 管理偏好設定,以及本機規則設定檔的組合來落實這套安全機制。管控規則是由管理員強制執行、使用者無法覆寫的控制機制。macOS 管理偏好設定與本機規則設定檔則讓我們能在維持一致基準的同時,依團隊、使用者群組或環境測試不同設定。這些設定會套用到 Codex 的各種本機介面,包括桌面應用程式、CLI 與 IDE 擴充功能。

智慧體原生遙測與稽核軌跡

控制只是其中一部分。智慧體一旦部署後,安全團隊還需要掌握這些智慧體正在執行哪些操作,以及背後原因。傳統安全日誌在檢視 Codex 執行的操作時依然有用,但大多只能回答發生了什麼,例如某個程序啟動、某個檔案被修改,或某次網路連線嘗試。防禦人員仍得自行判斷 Codex 為何這麼做,或使用者的意圖是什麼。

Codex 能為安全團隊提供更完整的智慧體操作視角。Codex 支援針對各種 Codex 事件匯出 OpenTelemetry 日誌,例如使用者提示詞、工具核准決策、工具執行結果、MCP 伺服器使用情況,以及網路代理允許或拒絕事件。Enterprise 與 Edu 客戶也可透過 OpenAI Compliance Platform 取得 Codex 活動日誌。

TOML

1
# config.toml
2

3
[otel]
4
log_user_prompt = true
5
environment = "prod"
6

7
[otel.exporter.otlp-http]
8
endpoint = "http://localhost:14318/v1/logs"
9
protocol = "binary"

在 OpenAI,我們會將 Codex 日誌與 AI 驅動的安全分流智慧體搭配使用。當端點警示指出 Codex 做了不尋常的事時,端點安全工具會告訴我們發生了可疑事件。接著,Codex 日誌可協助解釋使用者與智慧體的操作意圖。我們的 AI 安全分流智慧體會使用 Codex 日誌來檢視原始請求、工具活動、核准決策、工具結果,以及任何相關的網路政策決策或封鎖紀錄。AI 安全分流智慧體會將其分析結果呈現給安全團隊審查,以區分預期中的智慧體行為、無害的失誤,以及真正需要升級處理的活動。

我們也會在日常營運中使用相同的遙測資料。我們利用這些日誌來了解內部採用情況如何變化、哪些工具與 MCP 伺服器最常被使用、網路沙盒封鎖或提示的頻率,以及哪些部署環節仍需調整。這些 OpenTelemetry 日誌可集中到 SIEM 與合規記錄系統中。

展望未來

隨著像 Codex 這樣的程式碼編寫智慧體逐漸整合進開發工作流程,安全團隊需要專為管理這項轉變而設計的工具。Codex 提供安全導入所需的控制介面、設定管理、沙盒機制,以及細緻的智慧體操作資料。有了這些能力,安全團隊就能更有信心地啟用 Codex,在開發人員生產力與企業安全所需的可視性與控制能力之間取得平衡。更多 Codex 設定資訊請見此處(在新視窗中開啟),Compliance API 資訊請見此處(在新視窗中開啟)

作者

OpenAI