Iepazīstinām ar Aardvark: OpenAI aģentisko drošības pētnieku
Tagad privātajā beta versijā: MI aģents, kas domā kā drošības pētnieks un spēj pielāgoties mūsdienu programmatūras prasībām.
Šodien mēs paziņojam par Aardvark, aģentisku drošības pētnieku, kuru darbina GPT‑5.
Programmatūras drošība ir viena no viskritiskākajām un izaicinošākajām jomām tehnoloģijā. Katru gadu tiek atklāti desmitiem tūkstošu jaunu ievainojamību gan uzņēmumu, gan atklātā koda kodu bāzēs. Aizstāvjiem ir jāveic biedējoši uzdevumi, lai atrastu un labotu ievainojamības, pirms to izdara viņu pretinieki. OpenAI mēs strādājam, lai līdzsvaru pavērstu par labu aizstāvjiem.
Aardvark pārstāv izrāvienu mākslīgā intelekta un drošības pētniecībā: autonomu aģentu, kas var palīdzēt izstrādātājiem un drošības komandām atklāt un novērst drošības ievainojamības lielā mērogā. Aardvark tagad ir pieejams privātajā beta versijā, lai pārbaudītu un pilnveidotu tā spējas šajā jomā.
Aardvark nepārtraukti analizē pirmkoda krātuves, lai identificētu ievainojamības, novērtētu to izmantojamību, noteiktu smaguma pakāpes prioritātes un piedāvātu mērķtiecīgus ielāpus.
Aardvark darbojas, uzraugot izpildi un izmaiņas kodu bāzēs, identificējot ievainojamības, kā tās varētu tikt izmantotas, un piedāvājot risinājumus. Aardvark nepaļaujas uz tradicionālajām programmu analīzes metodēm, piemēram, nejaušu datu norādīšanu vai programmatūras sastāva analīzi. Tā vietā tas izmanto LLM darbinātu loģisko argumentāciju un rīku izmantošanu, lai izprastu koda darbību un identificētu ievainojamības. Aardvark meklē kļūdas tāpat kā to darītu drošības pētnieks - cilvēks: lasot kodu, analizējot to, rakstot un veicot testus, izmantojot rīkus un vēl vairāk.
Aardvark paļaujas uz daudzpakāpju atbalsta kanālu, lai identificētu, izskaidrotu un novērstu ievainojamības:
- Analīze: tā sākas ar pilnas krātuves analīzi, lai izveidotu apdraudējuma modeli, kas atspoguļo izpratni par projekta drošības mērķiem un dizainu.
- Iesūtījumu skenēšana: tā pārbauda ievainojamības, analizējot iesūtījumu līmeņa izmaiņas visā krātuvē un apdraudējumu modelī, kad tiek pievienots jauns kods. Kad krātuve pirmo reizi tiek savienota, Aardvark skenē tās vēsturi, lai identificētu esošās problēmas. Aardvark soli pa solim izskaidro atrastās ievainojamības, anotējot kodu cilvēka pārskatīšanai.
- Validācija: kad Aardvark ir identificējis potenciālu ievainojamību, tas mēģinās to izraisīt izolētā, smilšu kastes vidē, lai apstiprinātu tās izmantojamību. Aardvark apraksta soļus, kas veikti, lai palīdzētu nodrošināt, ka lietotājiem tiek sniegti precīzi, augstas kvalitātes un maz viltus pozitīvu rezultātu ieskati.
- Ielāpu uzlikšana: Aardvark integrējas ar OpenAI Codex, lai palīdzētu novērst atrastās ievainojamības. Tas pievieno Codex ģenerētu un Aardvark skenētu ielāpu katram atradumam, lai cilvēks to pārskatītu un efektīvi salabotu ar vienu klikšķi.
Aardvark strādā līdzās inženieriem, integrējoties ar GitHub, Codex un esošajām darbplūsmām, lai sniegtu skaidrus, izmantojamus ieskatus, nepalēninot izstrādes procesu. Lai gan Aardvark ir veidots drošībai, mūsu testēšanā esam atklājuši, ka tas var arī atklāt kļūdas, piemēram, loģikas kļūdas, nepilnīgus labojumus un privātuma problēmas.
Aardvark ir bijis darbībā vairākus mēnešus, nepārtraukti darbojoties OpenAI iekšējās kodu bāzēs un ārējo alfa partneru kodu bāzēs. OpenAI ietvaros ir atklātas nozīmīgas ievainojamības, kas ir veicinājušas OpenAI aizsardzības nostāju. Partneri ir izcēluši analīzes dziļumu, un Aardvark ir atklājis problēmas, kas parādās tikai sarežģītos apstākļos.
Veicot etalonpārbaudes "zelta" krātuvēs, Aardvark identificēja 92 % zināmo un sintētiski ieviesto ievainojamību, demonstrējot augstu atklāšanas spēju un efektivitāti reālajā pasaulē.
Aardvark ir izmantots arī atvērtā koda projektos, kur tas ir atradis un mēs esam atbildīgi atklājuši daudzas ievainojamības — desmit no tām ir saņēmušas Common Vulnerabilities and Exposures (CVE) identifikatorus.
Kā gadu desmitiem ilgu atklātu pētījumu un atbildīgas informācijas izpaušanas ieguvēji, mēs esam apņēmušies atlīdzināt—sniedzot rīkus un atklājumus, kas padara digitālo ekosistēmu drošāku ikvienam. Mēs plānojam piedāvāt bezmaksas skenēšanu izvēlētām nekomerciālām atvērtā pirmkoda krātuvēm, lai veicinātu atvērtā pirmkoda programmatūras ekosistēmas un piegādes ķēdes drošību.
Nesen mēs atjauninājām mūsu ārējo koordinēto izpaušanas politiku, kas pieņem izstrādātājiem draudzīgu pieeju, koncentrējoties uz sadarbību un mērogojamu ietekmi, nevis stingriem izpaušanas termiņiem, kas var radīt spiedienu uz izstrādātājiem. Mēs paredzam, ka tādi rīki kā Aardvark veicinās arvien lielāka skaita kļūdu atklāšanu, un vēlamies ilgtspējīgi sadarboties, lai sasniegtu ilgtermiņa noturību.
Programmatūra tagad ir katras nozares mugurkauls, kas nozīmē, ka programmatūras ievainojamības ir sistēmisks risks uzņēmumiem, infrastruktūrai un sabiedrībai. 2024. gadā vien tika ziņots par vairāk nekā 40 000 CVE. Mūsu testēšana rāda, ka aptuveni 1,2 % no izmaiņām ievieš kļūdas—nelielas izmaiņas, kas var radīt nesamērīgas sekas.
Aardvark pārstāv jaunu aizsardzības prioritātes modeli: aģentūru drošības pētnieku, kas sadarbojas ar komandām, nodrošinot nepārtrauktu aizsardzību, attīstoties kodam. Agrīni atklājot ievainojamības, pārbaudot to izmantojamību reālajā pasaulē un piedāvājot skaidrus risinājumus, Aardvark var stiprināt drošību, nepalēninot inovācijas. Mēs ticam, ka piekļuve drošības ekspertīzei ir jāpaplašina. Mēs sākam ar privāto beta versiju un paplašināsim pieejamību, kad mācīsimies.
Mēs aicinām izvēlētus partnerus pievienoties Aardvark privātajai beta versijai. Dalībnieki iegūs agrīnu piekļuvi un strādās tieši ar mūsu komandu, lai uzlabotu noteikšanas precizitāti, validācijas darbplūsmas un atskaišu pieredzi.
Mēs vēlamies pārbaudīt veiktspēju dažādās vidēs. Ja tava organizācija vai atvērtā koda projekts ir ieinteresēts pievienoties, vari pieteikties šeit.
Autors
Līdzstrādnieki
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu un Matt Knight


