Безопасно използване на Codex в OpenAI
Поглед към контролите, ограниченията и телеметрията, които OpenAI използва, за да управлява агенти за програмиране в реални работни процеси.
С развитието на ИИ системите те все по-често действат от името на потребителите. Агентите за програмиране могат автономно да преглеждат хранилища, да изпълняват команди и да взаимодействат с инструменти за разработка. Това са задачи, които преди изискваха пряко изпълнение от човек.
С Codex проектирахме тези възможности заедно с контролите, от които организациите се нуждаят за безопасно внедряване. Екипите по сигурност се нуждаят от начини, чрез които да управляват как работят агентите – до какво имат достъп, кога се изисква одобрение от човек, с кои системи могат да взаимодействат и каква телеметрия е налична, за да се обясни поведението им.
В OpenAI внедряваме Codex с няколко ясни цели: да държим агента в рамките на ясни технически граници, да позволим на разработчиците да действат бързо при нискорискови действия и да направим по-рисковите действия изрични. Също така запазваме телеметрия, специфична за агента, за да можем да разберем и одитираме какво е направил той. На практика това означава управлявана конфигурация, ограничено изпълнение, мрежови политики и логове, специфични за агента.
Внедряваме Codex с прост принцип: той да бъде продуктивен в ограничена среда, ежедневните нискорискови действия да са без излишни пречки, а по-рисковите действия да спират за преглед.
Одобренията и изолираната среда работят заедно. Изолираната среда определя техническите граници на изпълнение, включително къде Codex може да записва, дали има достъп до мрежата и кои пътища остават защитени. Политиката за одобрение определя кога Codex трябва да поиска разрешение за извършване на действие, например когато трябва да направи нещо извън изолираната среда. Потребителите могат да одобрят действието еднократно или да одобрят този тип действие за текущата сесия.
За заявки, които преминават границата на изолираната среда, използваме режим автоматичен преглед(отваря се в нов прозорец) – функция, която, когато е включена, автоматично одобрява определени видове заявки, за да намали колко често потребителите трябва да спират и да одобряват действия на Codex. Codex изпраща планираното действие и скорошния контекст за автоматично одобрение към подагента, който може автоматично да одобрява нискорискови действия – или високорискови действия при достатъчно ниво на потребителско упълномощаване – вместо да прекъсва потребителя. Това позволява на Codex да продължи рутинната работа, като същевременно спира при по-рискови действия или действия с непредвидени последици.
Не пускаме Codex в експлоатация с неограничен изходящ достъп. Нашата управлявана мрежова политика разрешава очаквани дестинации, блокира дестинации, до които не искаме Codex да достига, и изисква одобрение за непознати домейни. Това позволява на Codex да изпълнява често срещани, проверени работни процеси, без да му се дава широк мрежов достъп.
Управляваме и начина, по който Codex се удостоверява. Идентификационните данни за CLI и MCP OAuth се съхраняват в защитения ключодържател на операционната система, влизането е задължително през ChatGPT, а достъпът е фиксиран към нашето корпоративно работно пространство в ChatGPT. Това обвързва използването на Codex с нашите контроли на ниво работно пространство и прави активността на Codex достъпна в платформата ChatGPT Compliance Logs за нашето корпоративно работно пространство.
Използваме правила, така че Codex да не третира всяка shell команда като еднакво безопасна. Често срещани безвредни команди, които инженерите използват в ежедневната разработка, са разрешени без одобрение извън изолираната среда, а конкретни опасни команди могат да бъдат блокирани или да изискват одобрение. Това позволява на Codex да преминава бързо през обичайните инженерни задачи, като същевременно налага преглед или блокира модели на поведение, които не искаме да се изпълняват извън изолираната среда.
Прилагаме този подход чрез комбинация от управлявани в облака изисквания, управлявани предпочитания за macOS и локални файлове с изисквания. Изискванията са контроли, налагани от администратор, които потребителите не могат да променят. Управляваните предпочитания за macOS и локалните файлове с изисквания ни позволяват да поддържаме последователна базова линия, като същевременно тестваме различни конфигурации по екип, потребителска група или среда. Тези конфигурации се прилагат във всички локални среди на Codex, включително настолното приложение, CLI и разширението за IDE.
Контролът е само половината от задачата. След като агентите бъдат внедрени, екипите по сигурност се нуждаят от видимост върху това какво правят тези агенти и защо. Традиционните логове за сигурност все още са полезни при анализ на действията, извършени от Codex, но те най-вече отговарят на въпроса какво се е случило: стартиран е процес, променен е файл, направен е опит за мрежова връзка. Защитниците все още трябва сами да разберат защо Codex е направил нещо или какво е било намерението на потребителя.
Codex може да даде на екипите по сигурност поглед, който е по-ориентиран към агента. Codex поддържа експортиране на логове чрез OpenTelemetry за различни събития в Codex, като например потребителски подкани, решения за одобрение на инструменти, резултати от изпълнение на инструменти, използване на MCP сървър и събития за разрешаване или отказ от мрежов прокси. Логове за активността на Codex са достъпни и чрез платформата OpenAI Compliance за корпоративни и образователни клиенти.
В OpenAI използваме логовете на Codex заедно с нашия интелигентен агент за триаж на сигурността. Когато предупреждение от крайна точка показва, че Codex е направил нещо необичайно, инструментът за защита на крайните точки ни казва, че е настъпило подозрително събитие. След това логовете на Codex помагат да се обясни съпътстващото намерение на потребителя и агента. Нашият интелигентен агент за триаж на сигурността използва логовете на Codex, за да провери първоначалната заявка, активността на инструментите, решенията за одобрение, резултатите от инструментите и всяко уместно решение или блокиране по мрежова политика. Интелигентният агент за триаж на сигурността представя анализа си на нашия екип по сигурност за преглед, за да се разграничат очакваното поведение на агента, безобидните грешки и дейността, която действително изисква ескалация.
Използваме същата телеметрия и оперативно. Използваме тези логове, за да разберем как се променя вътрешното внедряване, кои инструменти и MCP сървъри се използват, колко често мрежовата изолирана среда блокира или изисква потвърждение и къде внедряването все още се нуждае от настройка. Тези OpenTelemetry логове могат да бъдат централизирани в SIEM и системи за логване на съответствие.
С интегрирането на агенти за програмиране като Codex в работните процеси по разработка, екипите по сигурност се нуждаят от инструменти, специално създадени за управление на тази промяна. Codex предоставя необходимите контролни повърхности, управление на конфигурацията, изолирана среда и подробна телеметрия, ориентирана към агента, за да осигури безопасно внедряване. С тези възможности екипите по сигурност могат да активират Codex с по-голяма увереност, като балансират продуктивността на разработчиците с видимостта и контрола, изисквани за корпоративна сигурност. Повече информация за конфигурирането на Codex можете да намерите тук(отваря се в нов прозорец), а за Compliance API – тук(отваря се в нов прозорец).


