Ekzekutimi i Codex në mënyrë të sigurt në OpenAI
Një vështrim mbi kontrollet, kufijtë dhe telemetrinë që OpenAI përdor për të menaxhuar agjentët e kodimit në flukse pune reale.
Ndërsa sistemet e inteligjencës artificiale bëhen më të afta, ato veprojnë gjithnjë e më shumë në emër të përdoruesve. Agjentët e kodimit mund të shqyrtojnë në mënyrë autonome depo, të ekzekutojnë komanda dhe të ndërveprojnë me mjetet e zhvillimit. Këto janë detyra që më parë kërkonin ekzekutim të drejtpërdrejtë nga njerëzit.
Me Codex, i kemi projektuar këto aftësi së bashku me kontrollet që u nevojiten organizatave për zbatim të sigurt. Ekipet e sigurisë kanë nevojë për mënyra për të qeverisur se si veprojnë agjentët: çfarë mund të aksesojnë, kur kërkohet miratimi nga njeriu, me cilat sisteme mund të ndërveprojnë dhe çfarë telemetrie ekziston për të shpjeguar sjelljen e tyre.
Në OpenAI, e përdorim Codex me disa qëllime të qarta: ta mbajmë agjentin brenda kufijve të qartë teknikë, t’u mundësojmë zhvilluesve të veprojnë shpejt në veprime me rrezik të ulët dhe t’i bëjmë të qarta veprimet me rrezik më të lartë. Ne gjithashtu ruajmë telemetrinë vetjake të agjentit, në mënyrë që të kuptojmë dhe të auditojmë çfarë bëri agjenti. Në praktikë, kjo nënkupton konfigurim të menaxhuar, ekzekutim të kufizuar, politika rrjeti dhe regjistra të vetishëm të agjentit.
Ne e vëmë në përdorim Codex me një parim të thjeshtë: ai duhet të jetë produktiv brenda një mjedisi të kufizuar, veprimet e përditshme me rrezik të ulët duhet të jenë pa pengesa, dhe veprimet me rrezik më të lartë duhet të ndalen për shqyrtim.
Miratimet dhe sandbox-i funksionojnë së bashku. Sandbox-i përcakton kufirin teknik të ekzekutimit, duke përfshirë se ku mund të shkruajë Codex, nëse mund të ketë qasje në rrjet dhe cilat shtigje mbeten të mbrojtura. Politika e miratimit përcakton kur Codex duhet të kërkojë miratim për të kryer një veprim, si kur i duhet të bëjë diçka jashtë sandbox-it. Përdoruesit mund ta miratojnë veprimin një herë, ose ta miratojnë atë lloj veprimi për atë sesion.
Për kërkesat që kalojnë kufirin e sandbox, ne përdorim Modalitetin e shqyrtimit automatik(hapet në një dritare të re), një veçori që, kur aktivizohet, miraton automatikisht disa lloje kërkesash për të zvogëluar sa shpesh përdoruesit duhet të ndalen dhe të miratojnë veprimet e Codex. Codex dërgon veprimin e planifikuar dhe kontekstin e fundit te nënagjenti i miratimit automatik, i cili mund të miratojë automatikisht veprime me rrezik të ulët - ose veprime me rrezik të lartë kur ka nivel të mjaftueshëm autorizimi nga përdoruesi - pa ndërprerë përdoruesin. Kjo i mundëson Codex të vazhdojë me punën rutinë, ndërkohë që ndalet te veprimet me rrezik të lartë ose me pasoja të paqëllimshme.
Ne nuk e ekzekutojmë Codex-in me akses dalës të pakufizuar. Politika jonë e menaxhuar e rrjetit lejon destinacionet e pritshme, bllokon ato që nuk duam që Codex t’i arrijë dhe kërkon miratim për domenet e panjohura. Kjo i mundëson Codex-it të kryejë flukse pune të zakonshme dhe të verifikuara si të besueshme, pa i dhënë akses të gjerë në rrjet.
Ne menaxhojmë gjithashtu mënyrën e autentikimit të Codex. Kredencialet OAuth të CLI dhe MCP ruhen në keyring-un e sigurt të sistemit operativ. Hyrja kryhet vetëm përmes ChatGPT dhe aksesi kufizohet në hapësirë pune ChatGPT Enterprise. Kjo e mban përdorimin e Codex të lidhur me kontrollet tona në nivel hapësire pune dhe e bën aktivitetin e Codex të disponueshëm në platformën ChatGPT Compliance Logs për hapësirën tonë të punës ChatGPT Enterprise.
Përdorim rregulla që Codex të mos e trajtojë çdo komandë shell si njësoj të sigurt. Komandat e zakonshme të padëmshme që inxhinierët përdorin në zhvillimin e përditshëm lejohen pa miratim jashtë sandbox-it, ndërsa komandat specifike të rrezikshme mund të bllokohen ose të kërkojnë miratim. Kjo i mundëson Codex të përparojë shpejt në detyra të zakonshme inxhinierike, ndërkohë që ende imponon shqyrtimin ose bllokon modelet që nuk duam të ekzekutohen jashtë sandbox-it.
Ne e zbatojmë këtë qasje përmes një kombinimi të kërkesave të menaxhuara në renë kompjuterike, preferencave të menaxhuara të macOS dhe skedarëve lokalë të kërkesave. Kërkesat janë kontrolle të imponuara nga administratori që përdoruesit nuk mund t'i anashkalojnë. Preferencat e menaxhuara të macOS dhe skedarët lokalë të kërkesave na mundësojnë të ruajmë një bazë të qëndrueshme, ndërkohë që testojmë konfigurime të ndryshme sipas ekipit, grupit të përdoruesve ose mjedisit. Këto konfigurime zbatohen në të gjitha sipërfaqet lokale të Codex, duke përfshirë aplikacionin desktop, CLI dhe shtesën IDE.
Kontrolli është vetëm gjysma e punës. Pasi agjentët të jenë vendosur, ekipet e sigurisë kanë nevojë për dukshmëri mbi atë që po bëjnë këta agjentë dhe pse. Regjistrat e zakonshëm të sigurisë janë ende të dobishëm kur shqyrtohen veprimet e kryera nga Codex, por ata kryesisht i përgjigjen pyetjes se çfarë ndodhi: një proces u nis, një skedar u ndryshua, u tentua një lidhje rrjeti. Mbrojtësve ende u mbetet të kuptojnë pse Codex bëri diçka, ose cili ishte qëllimi i përdoruesit.
Codex mund t’u japë ekipeve të sigurisë një pamje më të ndërgjegjshme për agjentët. Codex mbështet eksportimin e regjistrave OpenTelemetry për ngjarje të ndryshme të Codex, si kërkesat e përdoruesit, vendimet e miratimit të mjeteve, rezultatet e ekzekutimit të mjeteve, përdorimi i serverëve MCP dhe ngjarjet e lejimit ose refuzimit nga proksi i rrjetit. Regjistrat e aktivitetit të Codex janë gjithashtu të disponueshëm përmes platformës së pajtueshmërisë së OpenAI për klientët Enterprise dhe Edu.
Në OpenAI, ne përdorim regjistrat e Codex krahas agjentit tonë të triazhimit të sigurisë, të mbështetur nga IA-ja. Kur një sinjalizim i pikës fundore thotë se Codex bëri diçka të pazakontë, mjeti i sigurisë së pikës fundore na tregon se ka ndodhur një ngjarje e dyshimtë. Regjistrat e Codex më pas ndihmojnë të shpjegohet synimi në kontekst i përdoruesit dhe i agjentit. Agjenti ynë i triazhimit të sigurisë me IA përdor regjistrat e Codex për të shqyrtuar kërkesën origjinale, aktivitetin e mjeteve, vendimet e miratimit, rezultatet e mjeteve dhe çdo vendim ose bllokim përkatës të politikës së rrjetit. Agjenti i triazhimit të sigurisë me IA ia paraqet analizën e tij ekipit tonë të sigurisë për shqyrtim, për të dalluar mes sjelljes së pritshme të agjentit, gabimeve të padëmshme dhe aktivitetit që vërtet kërkon përshkallëzim.
Ne përdorim gjithashtu të njëjtën telemetri në mënyrë operative. Ne i përdorim këto regjistrime për të kuptuar se si po ndryshon adoptimi i brendshëm, cilat mjete dhe serverë MCP po përdoren, sa shpesh mjedisi i izoluar i rrjetit po bllokon ose shfaq kërkesa, dhe ku shtrirja ka ende nevojë për përmirësim. Këta regjistra të OpenTelemetry mund të centralizohen në sistemet SIEM dhe regjistrat e pajtueshmërisë.
Ndërsa agjentët e kodimit si Codex integrohen në flukset e punës së zhvillimit, ekipet e sigurisë kanë nevojë për mjete të projektuara posaçërisht për të menaxhuar këtë ndryshim. Codex ofron ndërfaqet e kontrollit, menaxhimin e konfigurimit, izolimin në mjedis të kontrolluar dhe telemetrinë e detajuar të vetëdijshme për agjentët, që nevojiten për të siguruar adoptim të sigurt. Me këto aftësi në zbatim, ekipet e sigurisë mund të aktivizojnë Codex me më shumë besim, duke balancuar produktivitetin e zhvilluesve me dukshmërinë dhe kontrollin që kërkohen për sigurinë e ndërmarrjes. Më shumë informacion mbi konfigurimin e Codex mund të gjesh këtu(hapet në një dritare të re), ndërsa për Compliance API-në këtu(hapet në një dritare të re).


