Að keyra Codex á öruggan hátt hjá OpenAI
Yfirlit yfir stýringar, mörk og fjarmælingagögn sem OpenAI notar til að hafa umsjón með kóðunarfulltrúum í raunverulegum vinnuflæðum.
Eftir því sem gervigreindarkerfi verða hæfari, framkvæma þau í auknum mæli aðgerðir fyrir hönd notenda. Kóðunarfulltrúar geta sjálfstætt yfirfarið geymslur, keyrt skipanir og átt í samskiptum við þróunarverkfæri. Þetta eru verkefni sem áður kröfðust beinnar framkvæmdar af hálfu manna.
Með Codex höfum við hannað þessa getu samhliða þeim stýringum sem fyrirtæki þurfa til öruggrar innleiðingar. Öryggisteymi þurfa leiðir til að stýra því hvernig fulltrúar starfa: hverju þeir geta fengið aðgang að, hvenær samþykki frá manneskju er nauðsynlegt, hvaða kerfum þeir geta átt samskipti við og hvaða fjarmælingagögn eru tiltæk til að útskýra hegðun þeirra.
Hjá OpenAI notum við Codex með nokkur skýr markmið: að halda fulltrúa innan skýrra tæknilegra marka, gera þróunaraðilum kleift að vinna hratt að lágáhættuverkefnum og gera hááhættuverkefni skýrari. Við varðveitum einnig innbyggð fjarmæligögn fulltrúans til að skilja og endurskoða aðgerðir hans. Í reynd þýðir það stýrðar stillingar, takmarkaða keyrslu, netstefnur og innbyggða skráningu fulltrúa.
Við setjum Codex í notkun með þeirri einföldu meginreglu að það skuli vera afkastamikið innan afmarkaðs umhverfis, daglegar aðgerðir með litla áhættu skuli vera hnökralausar og aðgerðir með meiri áhættu skuli stöðvast til yfirferðar.
Samþykki og sandkassar vinna saman. Sandkassinn skilgreinir tæknileg mörk keyrslu, þar á meðal hvar Codex getur skrifað, hvort það hafi aðgang að netinu og hvaða slóðir eru verndaðar. Samþykktarstefna ákvarðar hvenær Codex þarf að biðja um leyfi til að framkvæma aðgerð, til dæmis utan sandkassans. Notendur geta samþykkt aðgerðina einu sinni eða samþykkt þessa tegund aðgerða fyrir lotuna.
Fyrir beiðnir sem fara yfir mörk sandkassans notum við sjálfvirka yfirferð(opnast í nýjum glugga), eiginleika sem, þegar kveikt er á honum, samþykkir sjálfkrafa ákveðnar tegundir beiðna til að draga úr því hversu oft notendur þurfa að stöðva og samþykkja aðgerðir Codex. Codex sendir fyrirhugaða aðgerð og nýlegt samhengi til undirfulltrúans fyrir sjálfvirkt samþykki, sem getur sjálfkrafa samþykkt áhættulitlar aðgerðir – eða áhættumiklar aðgerðir með nægilegu stigi notendaheimildar – í stað þess að trufla notandann. Þannig heldur Codex áfram með venjubundin verkefni en stöðvast samt við áhættumeiri aðgerðir eða aðgerðir með ófyrirséðar afleiðingar.
Við keyrum ekki Codex með opnum útleiðaraðgangi. Stýrða netstefnan okkar leyfir fyrirfram þekkta áfangastaði, lokar á þá sem við viljum ekki að Codex nái til, og krefst samþykkis fyrir óþekkt lén. Þetta gerir Codex kleift að ljúka algengum, þekktum og áreiðanlegum verkflæðum án þess að veita víðtækan netaðgang.
Við sjáum einnig um hvernig Codex auðkennir sig. OAuth-skilríki fyrir CLI og MCP eru geymd í öruggri lyklageymslu stýrikerfisins, krafist er innskráningar í gegnum ChatGPT og aðgangurinn er bundinn við ChatGPT Enterprise-vinnusvæði okkar. Það heldur notkun Codex tengdri stýringum okkar á vinnusvæðisstigi og gerir virkni Codex aðgengilega á ChatGPT Compliance Logs Platform fyrir Enterprise-vinnusvæðið okkar.
Við notum reglur svo Codex líti ekki á allar skeljarskipanir sem jafn öruggar. Algengar skaðlausar skipanir sem verkfræðingar nota í daglegri þróun eru leyfðar án samþykkis utan sandkassans, en tilteknar hættulegar skipanir geta verið lokaðar eða krafist samþykkis. Það gerir Codex kleift að komast hratt í gegnum almenn verkfræðiverkefni, en knýr samt fram yfirferð eða lokar á mynstur sem við viljum ekki keyra utan sandkassans.
Við beitum þessari nálgun með samsetningu skýjastýrðra krafna, stýrðra macOS-kjörstillinga og staðbundinna kröfuskráa. Kröfur eru stjórnendastýringar sem notendur geta ekki hnekkt. Stýrðar kjörstillingar macOS og staðbundnar kröfuskrár gera okkur kleift að viðhalda samræmdum grunnviðmiðum á meðan við prófum mismunandi uppsetningar eftir teymi, notendahópi eða umhverfi. Þessar stillingar gilda á öllum staðbundnum Codex-verkflötum, þar á meðal skjáborðsforritinu, CLI og IDE-viðbótinni.
Að stjórna er aðeins hálft verkið. Þegar fulltrúar hafa verið settir í notkun þurfa öryggisteymi að hafa yfirsýn yfir hvað þessir fulltrúar eru að gera og hvers vegna. Hefðbundnar öryggisskrár eru enn gagnlegar þegar skoðaðar eru aðgerðir sem Codex hefur framkvæmt, en þær svara aðallega því hvað gerðist: ferli var ræst, skrá breyttist, reynt var að koma á nettengingu. Varnaraðilar þurfa enn sjálfir að átta sig á hvers vegna Codex gerði eitthvað, eða hver ásetningur notandans var.
Codex getur veitt öryggisteymum betri yfirsýn yfir fulltrúa. Codex styður útflutning OpenTelemetry-skráa fyrir ýmsa Codex-viðburði, svo sem kvaðningar notenda, samþykkisákvarðanir fyrir verkfæri, niðurstöður úr keyrslu verkfæra, notkun MCP-netþjóna og viðburði þar sem netproxy leyfir eða synjar. Virkniskrár Codex eru einnig tiltækar í gegnum OpenAI-samræmisverkvanginn fyrir Enterprise- og Edu-viðskiptavini.
Hjá OpenAI notum við Codex-skráningargögn ásamt gervigreindarknúnum fulltrúa öryggisforgangsgreiningar. Þegar endapunktsviðvörun gefur til kynna að Codex hafi gert eitthvað óvenjulegt, lætur endapunktsöryggisverkfærið vita af grunsamlegum atburði. Codex-annálar hjálpa þá til við að útskýra fyrirætlanir notandans og fulltrúans í samhengi við aðstæður. Gervigreindarfulltrúi okkar fyrir öryggisforgangsgreiningu notar Codex-skráningar til að skoða upphaflegu beiðnina, virkni verkfæra, samþykktarákvarðanir, niðurstöður verkfæra og hvers kyns viðeigandi netstefnuákvörðun eða -lokun. Gervigreindarfulltrúi okkar fyrir öryggisforgangsgreiningu leggur greiningu sína fyrir öryggisteymi okkar til yfirferðar, til að greina á milli væntrar hegðunar fulltrúa, saklausra mistaka og virkni sem raunverulega gefur tilefni til stigmögnunar.
Við notum einnig sömu fjarmælingagögnin í rekstrarlegum tilgangi. Við notum þessa annála til að skilja hvernig innri upptaka er að breytast, hvaða verkfæri og MCP-netþjónar eru notuð, hversu oft network sandbox lokar á eða biður um staðfestingu og hvar útleiðslan þarfnast enn fínstillingar. Þessa OpenTelemetry-annála er hægt að miðstýra í SIEM-kerfum og skráningarkerfum fyrir reglufylgni.
Eftir því sem kóðunarfulltrúar á borð við Codex verða samþættir þróunarverkflæðum þurfa öryggisteymi verkfæri sem eru sérstaklega hönnuð til að halda utan um þessa breytingu. Codex veitir stýrifletina, stillingastjórnun, sandkassa og ítarlegar fjarmælingar með vitund um fulltrúa sem þarf til að tryggja örugga innleiðingu. Með þessa getu til staðar geta öryggisteymi virkjað Codex með meira sjálfstrausti og vegið saman framleiðni þróunaraðila og þá yfirsýn og stjórn sem öryggi á fyrirtækjastigi krefst. Nánari upplýsingar um hvernig á að stilla Codex má finna hér(opnast í nýjum glugga) og um Compliance API hér(opnast í nýjum glugga).


