Droša Codex lietošana OpenAI
Ieskats kontrolēs, robežās un telemetrijas datos, ko OpenAI izmanto, lai pārvaldītu kodēšanas aģentus reālās darbplūsmās.
MI sistēmām kļūstot spējīgākām, tās arvien biežāk darbojas lietotāju vārdā. Kodēšanas aģenti var autonomi pārskatīt repozitorijus, izpildīt komandas un mijiedarboties ar izstrādes rīkiem. Šie ir uzdevumi, kuru veikšanai iepriekš bija nepieciešama tieša cilvēka iesaiste.
Ar Codex mēs esam izstrādājuši šīs iespējas līdztekus kontrolēm, kas organizācijām ir vajadzīgas drošai ieviešanai. Drošības komandām ir vajadzīgi veidi, kā pārvaldīt aģentu darbību: kam tie var piekļūt, kad ir nepieciešams cilvēka apstiprinājums, ar kurām sistēmām tie var mijiedarboties un kāda telemetrija ir pieejama, lai izskaidrotu to darbību.
OpenAI ieviešam Codex ar dažiem skaidriem mērķiem: noturēt aģentu skaidri noteiktās tehniskās robežās, ļaut izstrādātājiem ātri virzīties uz priekšu ar zema riska darbībām un padarīt augstāka riska darbības skaidri redzamas. Mēs arī saglabājam aģentam raksturīgu telemetriju, lai varētu saprast un auditēt, ko aģents ir darījis. Praksē tas nozīmē pārvaldītu konfigurāciju, ierobežotu izpildi, tīkla politikas un aģentam raksturīgus žurnālus.
Mēs ieviešam Codex, ievērojot vienkāršu principu: tam jābūt produktīvam ierobežotā vidē, ikdienas zema riska darbībām jānotiek bez liekas berzes, bet augstāka riska darbībām jāapstājas, lai tās pārskatītu.
Apstiprinājumi un izmēģināšanas vide darbojas kopā. Izmēģināšanas vide nosaka tehniskās izpildes robežas, tostarp to, kur Codex var rakstīt, vai tas var piekļūt tīklam un kuri ceļi paliek aizsargāti. Apstiprinājumu politika nosaka, kad Codex ir jālūdz atļauja darbības veikšanai, piemēram, ja tam jādara kaut kas ārpus izmēģināšanas vides. Lietotāji var apstiprināt darbību vienu reizi vai apstiprināt šāda veida darbību šai sesijai.
Pieprasījumiem, kas šķērso izmēģināšanas vides robežu, mēs izmantojam automātiskās pārskatīšanas režīmu(atveras jaunā logā) – funkciju, kas, kad tā ir ieslēgta, automātiski apstiprina noteikta veida pieprasījumus, lai samazinātu gadījumus, kad lietotājiem ir jāpārtrauc darbs un jāapstiprina Codex darbības. Codex nosūta plānoto darbību un neseno kontekstu automātiskās apstiprināšanas apakšaģentam, kas var automātiski apstiprināt zema riska darbības – vai arī augsta riska darbības ar pietiekamu lietotāja autorizācijas līmeni –, nevis pārtraukt lietotāja darbu. Tas ļauj Codex turpināt rutīnas darbu, vienlaikus apturot augstāka riska darbības vai darbības ar neparedzētām sekām.
Mēs nedarbinām Codex ar neierobežotu izejošo piekļuvi. Mūsu pārvaldītā tīkla politika atļauj paredzētos galamērķus, bloķē galamērķus, kuriem nevēlamies ļaut Codex piekļūt, un pieprasa apstiprinājumu nepazīstamiem domēniem. Tas ļauj Codex pabeigt biežas uzticamas darbplūsmas, nepiešķirot tam plašu piekļuvi tīklam.
Mēs pārvaldām arī to, kā Codex autentificējas. CLI un MCP OAuth akreditācijas dati tiek glabāti drošajā OS atslēgu krātuvē, pieteikšanās tiek piespiesta caur ChatGPT, un piekļuve ir piesaistīta mūsu ChatGPT uzņēmuma darbvietai. Tas nodrošina, ka Codex lietošana paliek saistīta ar mūsu darbvietas līmeņa kontrolēm, un padara Codex aktivitāti pieejamu ChatGPT Compliance Logs Platform mūsu uzņēmuma darbvietai.
Mēs izmantojam noteikumus, lai Codex neuzskatītu katru čaulas komandu par vienādi drošu. Bieži sastopamas nekaitīgas komandas, ko inženieri izmanto ikdienas izstrādē, ir atļautas bez apstiprinājuma ārpus izmēģināšanas vides, savukārt konkrētas bīstamas komandas var tikt bloķētas vai prasīt apstiprinājumu. Tas ļauj Codex ātri virzīties cauri parastiem inženiertehniskiem uzdevumiem, vienlaikus joprojām piespiežot pārskatīšanu vai bloķējot modeļus, kurus nevēlamies palaist ārpus izmēģināšanas vides.
Mēs īstenojam šo pieeju, apvienojot mākoņa pārvaldītas prasības, macOS pārvaldītas preferences un lokālos prasību failus. Prasības ir administratora ieviestas kontroles, kuras lietotāji nevar ignorēt. macOS pārvaldītās preferences un lokālie prasību faili ļauj mums uzturēt konsekventu bāzes līniju, vienlaikus joprojām testējot dažādas konfigurācijas pēc komandas, lietotāju grupas vai vides. Šīs konfigurācijas tiek piemērotas visās lokālajās Codex virsmās, tostarp darbvirsmas lietotnē, CLI un IDE paplašinājumā.
Kontrole ir tikai puse no uzdevuma. Kad aģenti ir ieviesti, drošības komandām ir vajadzīga redzamība par to, ko šie aģenti dara un kāpēc. Tradicionālie drošības žurnāli joprojām ir noderīgi, aplūkojot Codex veiktās darbības, taču tie galvenokārt atbild uz jautājumu, kas notika: process sākās, fails tika mainīts, tika mēģināts izveidot tīkla savienojumu. Aizstāvjiem joprojām pašiem jāizprot, kāpēc Codex kaut ko darīja, vai kāds bija lietotāja nolūks.
Codex var sniegt drošības komandām aģentiem labāk pielāgotu skatījumu. Codex atbalsta OpenTelemetry žurnālu eksportu dažādiem Codex notikumiem, piemēram, lietotāja uzvednēm, rīku apstiprināšanas lēmumiem, rīku izpildes rezultātiem, MCP servera lietojumam un tīkla starpniekservera atļaušanas vai liegšanas notikumiem. Codex darbības žurnāli ir pieejami arī OpenAI Compliance Platform Enterprise un Edu klientiem.
OpenAI izmantojam Codex žurnālus līdztekus mūsu ar MI darbinātajam drošības triāžas aģentam. Ja galapunkta brīdinājums norāda, ka Codex ir izdarījis ko neparastu, galapunktu drošības rīks mums paziņo, ka ir noticis aizdomīgs notikums. Pēc tam Codex žurnāli palīdz izskaidrot lietotāja un aģenta apkārtējo nolūku. Mūsu MI drošības triāžas aģents izmanto Codex žurnālus, lai pārbaudītu sākotnējo pieprasījumu, rīku darbību, apstiprināšanas lēmumus, rīku rezultātus un jebkuru atbilstošu tīkla politikas lēmumu vai bloķēšanu. MI drošības triāžas aģents parāda savu analīzi mūsu drošības komandai pārskatīšanai, lai atšķirtu paredzētu aģenta uzvedību, nekaitīgas kļūdas un darbību, kas patiešām prasa eskalāciju.
Mēs izmantojam šo pašu telemetriju arī operatīvi. Mēs izmantojam šos žurnālus, lai saprastu, kā mainās iekšējā ieviešana, kuri rīki un MCP serveri tiek izmantoti, cik bieži tīkla izmēģināšanas vide bloķē vai prasa apstiprinājumu un kur izvēršanai vēl nepieciešama pielāgošana. Šos OpenTelemetry žurnālus var centralizēt SIEM un atbilstības žurnālu sistēmās.
Kodēšanas aģentiem, piemēram, Codex, kļūstot integrētiem izstrādes darbplūsmās, drošības komandām ir vajadzīgi rīki, kas ir īpaši izstrādāti šīs pārejas pārvaldībai. Codex nodrošina vadības virsmas, konfigurācijas pārvaldību, izolēšanu izpildvidē (sandboxing) un detalizētu aģentu telemetriju, kas vajadzīga drošas ieviešanas nodrošināšanai. Ja šīs iespējas ir ieviestas, drošības komandas var iespējot Codex ar lielāku pārliecību, līdzsvarojot izstrādātāju produktivitāti ar redzamību un kontroli, kas nepieciešama uzņēmuma drošībai. Plašāku informāciju par Codex konfigurēšanu var atrast šeit(atveras jaunā logā), bet par Compliance API — šeit(atveras jaunā logā).


