8 май 2026 г.

Безопасно използване на Codex в OpenAI

Поглед към контролите, ограниченията и телеметрията, които OpenAI използва, за да управлява агенти за програмиране в реални работни процеси.

Зареждане…

С развитието на ИИ системите те все по-често действат от името на потребителите. Агентите за програмиране могат автономно да преглеждат хранилища, да изпълняват команди и да взаимодействат с инструменти за разработка. Това са задачи, които преди изискваха пряко изпълнение от човек.

С Codex проектирахме тези възможности заедно с контролите, от които организациите се нуждаят за безопасно внедряване. Екипите по сигурност се нуждаят от начини, чрез които да управляват как работят агентите – до какво имат достъп, кога се изисква одобрение от човек, с кои системи могат да взаимодействат и каква телеметрия е налична, за да се обясни поведението им.

В OpenAI внедряваме Codex с няколко ясни цели: да държим агента в рамките на ясни технически граници, да позволим на разработчиците да действат бързо при нискорискови действия и да направим по-рисковите действия изрични. Също така запазваме телеметрия, специфична за агента, за да можем да разберем и одитираме какво е направил той. На практика това означава управлявана конфигурация, ограничено изпълнение, мрежови политики и логове, специфични за агента.

Контрол върху начина на работа на Codex

Внедряваме Codex с прост принцип: той да бъде продуктивен в ограничена среда, ежедневните нискорискови действия да са без излишни пречки, а по-рисковите действия да спират за преглед.

Изолирана среда и одобрения

Одобренията и изолираната среда работят заедно. Изолираната среда определя техническите граници на изпълнение, включително къде Codex може да записва, дали има достъп до мрежата и кои пътища остават защитени. Политиката за одобрение определя кога Codex трябва да поиска разрешение за извършване на действие, например когато трябва да направи нещо извън изолираната среда. Потребителите могат да одобрят действието еднократно или да одобрят този тип действие за текущата сесия.

За заявки, които преминават границата на изолираната среда, използваме режим автоматичен преглед⁠(отваря се в нов прозорец) – функция, която, когато е включена, автоматично одобрява определени видове заявки, за да намали колко често потребителите трябва да спират и да одобряват действия на Codex. Codex изпраща планираното действие и скорошния контекст за автоматично одобрение към подагента, който може автоматично да одобрява нискорискови действия – или високорискови действия при достатъчно ниво на потребителско упълномощаване – вместо да прекъсва потребителя. Това позволява на Codex да продължи рутинната работа, като същевременно спира при по-рискови действия или действия с непредвидени последици.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

Достъп до мрежата

Не пускаме Codex в експлоатация с неограничен изходящ достъп. Нашата управлявана мрежова политика разрешава очаквани дестинации, блокира дестинации, до които не искаме Codex да достига, и изисква одобрение за непознати домейни. Това позволява на Codex да изпълнява често срещани, проверени работни процеси, без да му се дава широк мрежов достъп.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

Идентичност и идентификационни данни

Управляваме и начина, по който Codex се удостоверява. Идентификационните данни за CLI и MCP OAuth се съхраняват в защитения ключодържател на операционната система, влизането е задължително през ChatGPT, а достъпът е фиксиран към нашето корпоративно работно пространство в ChatGPT. Това обвързва използването на Codex с нашите контроли на ниво работно пространство и прави активността на Codex достъпна в платформата ChatGPT Compliance Logs за нашето корпоративно работно пространство.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

Правила

Използваме правила, така че Codex да не третира всяка shell команда като еднакво безопасна. Често срещани безвредни команди, които инженерите използват в ежедневната разработка, са разрешени без одобрение извън изолираната среда, а конкретни опасни команди могат да бъдат блокирани или да изискват одобрение. Това позволява на Codex да преминава бързо през обичайните инженерни задачи, като същевременно налага преглед или блокира модели на поведение, които не искаме да се изпълняват извън изолираната среда.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

Управлявани конфигурации

Прилагаме този подход чрез комбинация от управлявани в облака изисквания, управлявани предпочитания за macOS и локални файлове с изисквания. Изискванията са контроли, налагани от администратор, които потребителите не могат да променят. Управляваните предпочитания за macOS и локалните файлове с изисквания ни позволяват да поддържаме последователна базова линия, като същевременно тестваме различни конфигурации по екип, потребителска група или среда. Тези конфигурации се прилагат във всички локални среди на Codex, включително настолното приложение, CLI и разширението за IDE.

Телеметрия и одитни следи, специфични за агента

Контролът е само половината от задачата. След като агентите бъдат внедрени, екипите по сигурност се нуждаят от видимост върху това какво правят тези агенти и защо. Традиционните логове за сигурност все още са полезни при анализ на действията, извършени от Codex, но те най-вече отговарят на въпроса какво се е случило: стартиран е процес, променен е файл, направен е опит за мрежова връзка. Защитниците все още трябва сами да разберат защо Codex е направил нещо или какво е било намерението на потребителя.

Codex може да даде на екипите по сигурност поглед, който е по-ориентиран към агента. Codex поддържа експортиране на логове чрез OpenTelemetry за различни събития в Codex, като например потребителски подкани, решения за одобрение на инструменти, резултати от изпълнение на инструменти, използване на MCP сървър и събития за разрешаване или отказ от мрежов прокси. Логове за активността на Codex са достъпни и чрез платформата OpenAI Compliance за корпоративни и образователни клиенти.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

В OpenAI използваме логовете на Codex заедно с нашия интелигентен агент за триаж на сигурността. Когато предупреждение от крайна точка показва, че Codex е направил нещо необичайно, инструментът за защита на крайните точки ни казва, че е настъпило подозрително събитие. След това логовете на Codex помагат да се обясни съпътстващото намерение на потребителя и агента. Нашият интелигентен агент за триаж на сигурността използва логовете на Codex, за да провери първоначалната заявка, активността на инструментите, решенията за одобрение, резултатите от инструментите и всяко уместно решение или блокиране по мрежова политика. Интелигентният агент за триаж на сигурността представя анализа си на нашия екип по сигурност за преглед, за да се разграничат очакваното поведение на агента, безобидните грешки и дейността, която действително изисква ескалация.

Използваме същата телеметрия и оперативно. Използваме тези логове, за да разберем как се променя вътрешното внедряване, кои инструменти и MCP сървъри се използват, колко често мрежовата изолирана среда блокира или изисква потвърждение и къде внедряването все още се нуждае от настройка. Тези OpenTelemetry логове могат да бъдат централизирани в SIEM и системи за логване на съответствие.

Поглед напред

С интегрирането на агенти за програмиране като Codex в работните процеси по разработка, екипите по сигурност се нуждаят от инструменти, специално създадени за управление на тази промяна. Codex предоставя необходимите контролни повърхности, управление на конфигурацията, изолирана среда и подробна телеметрия, ориентирана към агента, за да осигури безопасно внедряване. С тези възможности екипите по сигурност могат да активират Codex с по-голяма увереност, като балансират продуктивността на разработчиците с видимостта и контрола, изисквани за корпоративна сигурност. Повече информация за конфигурирането на Codex можете да намерите тук⁠(отваря се в нов прозорец), а за Compliance API – тук⁠(отваря се в нов прозорец).

Автор

OpenAI

Продължавайте да четете

Вижте всички

Safety and alignment in an era of long-horizon models

Безопасност20.07.2026 г.

Why teens deserve access to safe AI — card image

Защо тийнейджърите заслужават достъп до безопасен ИИ

Безопасност16.07.2026 г.

GPT-Red: Самоусъвършенстване за по-голяма устойчивост

Безопасност15.07.2026 г.