Bezpečné používanie Codexu v OpenAI
Pohľad na kontroly, hranice a telemetriu, ktoré OpenAI používa na riadenie programovacích agentov v reálnych pracovných postupoch.
Keď sa systémy umelej inteligencie stávajú schopnejšími, čoraz častejšie konajú v mene používateľov. Programovací agenti môžu autonómne kontrolovať repozitáre, spúšťať príkazy a pracovať s vývojárskymi nástrojmi. Ide o úlohy, ktoré si predtým vyžadovali priame vykonanie človekom.
Pri Codexe sme tieto schopnosti navrhli spolu s ovládacími prvkami, ktoré organizácie potrebujú na bezpečné nasadenie. Bezpečnostné tímy potrebujú spôsoby, ako riadiť fungovanie agentov: k čomu môžu pristupovať, kedy sa vyžaduje schválenie človekom, s ktorými systémami môžu interagovať a aká telemetria existuje na vysvetlenie ich správania.
V OpenAI nasadzujeme Codex s niekoľkými jasnými cieľmi: udržať agenta v rámci jasných technických hraníc, umožniť vývojárom rýchlo napredovať pri nízkorizikových úkonoch a jasne označiť úkony s vyšším rizikom. Zachovávame aj telemetriu natívnu pre agentov, aby sme mohli pochopiť a auditovať, čo agent urobil. V praxi to znamená spravovanú konfiguráciu, obmedzené vykonávanie, sieťové politiky a logy natívne pre agentov.
Codex nasadzujeme s jednoduchým princípom: v ohraničenom prostredí má byť produktívny, bežné nízkorizikové úkony majú prebiehať bez zdržania a úkony s vyšším rizikom sa majú zastaviť na kontrolu.
Schvaľovanie a sandboxing fungujú spoločne. Sandbox určuje technické hranice vykonávania vrátane toho, kam môže Codex zapisovať, či môže pristupovať k sieti a ktoré cesty zostávajú chránené. Politika schvaľovania určuje, kedy musí Codex požiadať o vykonanie akcie, napríklad keď potrebuje urobiť niečo mimo sandboxu. Používatelia môžu akciu schváliť raz alebo schváliť daný typ akcie pre danú reláciu.
Pri žiadostiach, ktoré prekračujú hranicu sandboxu, používame režim Auto-review(otvorí sa v novom okne), čo je funkcia, ktorá po zapnutí automaticky schvaľuje určité typy žiadostí, aby sa znížila potreba používateľov zastaviť sa a schvaľovať akcie Codex. Codex odosiela plánovanú akciu a nedávny kontext subagentovi automatického schvaľovania, ktorý môže automaticky schváliť nízkorizikové akcie – alebo vysokorizikové akcie pri dostatočnej úrovni autorizácie používateľa – namiesto toho, aby vyrušil používateľa. Vďaka tomu môže Codex pokračovať v rutinnej práci, pričom sa stále zastaví pri rizikovejších akciách alebo akciách s neúmyselnými dôsledkami.
Codex nespúšťame s neobmedzeným odchádzajúcim prístupom. Naša spravovaná sieťová politika povoľuje očakávané ciele, blokuje ciele, ku ktorým nechceme, aby sa Codex pripájal, a pri neznámych doménach vyžaduje schválenie. To umožňuje Codexu dokončiť bežné osvedčené pracovné postupy bez toho, aby mal široký sieťový prístup.
Spravujeme aj spôsob, akým sa Codex autentifikuje. Prihlasovacie údaje OAuth pre CLI a MCP sú uložené v zabezpečenom systémovom úložisku kľúčov, prihlásenie je vynútené cez ChatGPT a prístup je viazaný na náš podnikový pracovný priestor ChatGPT. Vďaka tomu je používanie Codexu prepojené s našimi kontrolami na úrovni pracovného priestoru a aktivita Codexu je dostupná v platforme ChatGPT Compliance Logs pre náš podnikový pracovný priestor.
Používame pravidlá, aby Codex nepovažoval každý shellový príkaz za rovnako bezpečný. Bežné neškodné príkazy, ktoré inžinieri používajú pri každodennom vývoji, sú mimo sandboxu povolené bez schválenia a konkrétne nebezpečné príkazy môžu byť zablokované alebo môžu vyžadovať schválenie. To umožňuje Codexu rýchlo postupovať pri bežných inžinierskych úlohách a zároveň vynútiť kontrolu alebo blokovať vzory, ktoré nechceme spúšťať mimo sandboxu.
Tento prístup uplatňujeme kombináciou cloudovo spravovaných požiadaviek, spravovaných nastavení macOS a lokálnych súborov s požiadavkami. Požiadavky sú administrátorsky vynucované kontroly, ktoré používatelia nemôžu prepísať. Spravované nastavenia macOS a lokálne súbory s požiadavkami nám umožňujú zachovať konzistentný základ a zároveň testovať rôzne konfigurácie podľa tímu, skupiny používateľov alebo prostredia. Tieto konfigurácie sa uplatňujú naprieč lokálnymi rozhraniami Codexu vrátane desktopovej aplikácie, CLI a rozšírenia pre IDE.
Kontrola je len polovica práce. Po nasadení agentov potrebujú bezpečnostné tímy prehľad o tom, čo títo agenti robia a prečo. Tradičné bezpečnostné logy sú pri posudzovaní akcií vykonaných Codexom stále užitočné, no väčšinou odpovedajú len na to, čo sa stalo: spustil sa proces, zmenil sa súbor, bol vykonaný pokus o sieťové pripojenie. Obrancom potom stále zostáva zistiť, prečo Codex niečo urobil, alebo aký bol zámer používateľa.
Codex môže bezpečnostným tímom poskytnúť pohľad viac zohľadňujúci agentov. Codex podporuje export logov OpenTelemetry pre rôzne udalosti Codexu, ako sú používateľské príkazy, rozhodnutia o schválení nástrojov, výsledky vykonania nástrojov, používanie servera MCP a udalosti povolenia alebo zamietnutia cez sieťový proxy. Logy aktivít Codexu sú dostupné aj cez platformu OpenAI Compliance Platform pre zákazníkov Enterprise a Edu.
V OpenAI používame logy Codexu spolu s naším agentom na bezpečnostné triedenie poháňaným umelou inteligenciou. Keď upozornenie koncového bodu hlási, že Codex urobil niečo neobvyklé, nástroj na zabezpečenie koncových bodov nám povie, že nastala podozrivá udalosť. Logy Codexu potom pomáhajú vysvetliť okolité zámery používateľa a agenta. Náš agent na bezpečnostné triedenie využívajúci umelú inteligenciu používa logy Codexu na preskúmanie pôvodnej požiadavky, aktivity nástrojov, rozhodnutí o schválení, výsledkov nástrojov a každého relevantného rozhodnutia alebo blokovania zo sieťovej politiky. Agent na bezpečnostné triedenie využívajúci umelú inteligenciu predkladá svoju analýzu nášmu bezpečnostnému tímu na kontrolu, aby bolo možné rozlíšiť medzi očakávaným správaním agenta, neškodnými chybami a aktivitou, ktorá si skutočne vyžaduje eskaláciu.
Rovnakú telemetriu používame aj operatívne. Tieto logy používame na pochopenie toho, ako sa mení interné prijatie, ktoré nástroje a servery MCP sa používajú, ako často sieťový sandbox blokuje alebo vyžaduje potvrdenie a kde je ešte potrebné doladenie zavádzania. Tieto logy OpenTelemetry je možné centralizovať v systémoch SIEM a systémoch na zaznamenávanie súladu.
Keď sa programovací agenti ako Codex integrujú do vývojových pracovných postupov, bezpečnostné tímy potrebujú nástroje navrhnuté špeciálne na riadenie tejto zmeny. Codex poskytuje riadiace rozhrania, správu konfigurácie, sandboxing a podrobnú telemetriu zohľadňujúcu agentov, ktorá je potrebná na zaistenie bezpečného prijatia. S týmito schopnosťami môžu bezpečnostné tímy zavádzať Codex s väčšou istotou a vyvažovať produktivitu vývojárov s viditeľnosťou a kontrolou, ktoré podniková bezpečnosť vyžaduje. Viac informácií o konfigurácii Codexu nájdeš tu(otvorí sa v novom okne) a o rozhraní Compliance API tu(otvorí sa v novom okne).


