Pristatome „Aardvark“: „OpenAI“ agentinį saugumo tyrėją
Dabar privačioje beta versijoje: DI agentas, kuris mąsto kaip saugumo tyrėjas ir plečiasi, kad atitiktų šiuolaikinės programinės įrangos poreikius.
Šiandien pristatome „Aardvark“ – agentinį saugumo tyrėją, valdomą GPT‑5.
Programinės įrangos saugumas yra viena svarbiausių – ir sudėtingiausių – technologijų sričių. Kasmet įmonių ir atvirojo kodo kodo bazėse aptinkama dešimtys tūkstančių naujų pažeidžiamumų. Gynėjai susiduria su sunkiomis užduotimis rasti ir ištaisyti pažeidžiamumus anksčiau nei tai padarys priešiškai nusiteikę asmenys. „OpenAI“ siekiame pakreipti šią pusiausvyrą gynėjų naudai.
„Aardvark“ žymi proveržį DI ir saugumo tyrimų srityje: tai savarankiškas agentas, galintis padėti programuotojams ir saugumo komandoms dideliu mastu aptikti ir taisyti saugumo pažeidžiamumus. „Aardvark“ dabar prieinamas kaip privati beta versija, siekiant patvirtinti ir patobulinti jo galimybes realioje aplinkoje.
„Aardvark“ nuolat analizuoja pirminio kodo saugyklas, kad nustatytų pažeidžiamumus, įvertintų išnaudojimo galimybę, nustatytų svarbos prioritetus ir pasiūlytų tikslines pataisas.
„Aardvark“ veikia stebėdamas kodo bazių pakeitimų fiksavimus ir pokyčius, nustatydamas pažeidžiamumus bei jų išnaudojimo būdus ir siūlydamas pataisas. „Aardvark“ nepriklauso nuo tradicinių programų analizės metodų, tokių kaip testavimas atsitiktiniais duomenimis ar programinės įrangos sudėties analizė. Vietoj to, jis naudoja LLM paremtą samprotavimą ir įrankių naudojimą, kad suprastų kodo elgseną ir nustatytų pažeidžiamumus. „Aardvark“ ieško klaidų taip, kaip tai darytų žmogus saugumo tyrėjas: skaitydamas kodą, jį analizuodamas, rašydamas ir vykdydamas testus, naudodamas įrankius ir kt.
„Aardvark“ remiasi daugiapakope seka pažeidžiamumams nustatyti, paaiškinti ir ištaisyti.
- Analizė: jis pradeda nuo visos saugyklos analizės, kad sukurtų grėsmių modelį, atspindintį jo supratimą apie projekto saugumo tikslus ir dizainą.
- Pakeitimų fiksavimo nuskaitymas: jis ieško pažeidžiamumų tikrindamas pakeitimų fiksavimo lygio pokyčius visos saugyklos ir grėsmių modelio atžvilgiu, kai fiksuojamas naujas kodas. Pirmą kartą prijungus saugyklą, „Aardvark“ nuskaitys jos istoriją, kad nustatytų esamas problemas. „Aardvark“ žingsnis po žingsnio paaiškina rastus pažeidžiamumus, komentuodamas kodą žmogaus peržiūrai.
- Tikrinimas: nustatęs galimą pažeidžiamumą, „Aardvark“ bandys jį sukelti izoliuotoje aplinkoje, kad patvirtintų jo išnaudojimo galimybę. „Aardvark“ aprašo atliktus veiksmus, kad padėtų užtikrinti, jog naudotojams būtų pateiktos tikslios, kokybiškos įžvalgos su mažai klaidingai teigiamų rezultatų.
- Taisymas: „Aardvark“ integruojasi su „OpenAI Codex“, kad padėtų ištaisyti rastus pažeidžiamumus. Prie kiekvieno radinio jis prideda „Codex“ sugeneruotą ir „Aardvark“ nuskaitytą pataisą, skirtą žmogaus peržiūrai ir efektyviam taisymui vienu spustelėjimu.
„Aardvark“ dirba kartu su inžinieriais, integruodamasis su „GitHub“, „Codex“ ir esamomis darbo eigomis, kad pateiktų aiškias, pritaikomas įžvalgas nestabdydamas kūrimo proceso. Nors „Aardvark“ sukurtas saugumui, bandymų metu nustatėme, kad jis taip pat gali aptikti klaidas, pavyzdžiui, logikos trūkumus, neišsamius pataisymus ir privatumo problemas.
„Aardvark“ veikia jau kelis mėnesius, nuolat tikrindamas vidines „OpenAI“ kodo bazes ir išorinių „alpha“ partnerių kodą. „OpenAI“ viduje jis atskleidė reikšmingų pažeidžiamumų ir prisidėjo prie „OpenAI“ gynybinio pajėgumo. Partneriai pabrėžė jo analizės gylį, nes „Aardvark“ randa problemų, kylančių tik sudėtingomis sąlygomis.
Atliekant lyginamuosius bandymus su „auksinėmis“ saugyklomis, „Aardvark“ nustatė 92 proc. žinomų ir sintetiškai įvestų pažeidžiamumų, demonstruodamas aukštą aptikimo rodiklį ir efektyvumą realiame pasaulyje.
„Aardvark“ taip pat buvo pritaikytas atvirojo kodo projektuose, kur jis aptiko, o mes atsakingai atskleidėme daugybę pažeidžiamumų – dešimčiai iš jų suteikti „Common Vulnerabilities and Exposures“ (CVE) identifikatoriai.
Kaip dešimtmečius trukusių atvirų tyrimų ir atsakingo atskleidimo naudos gavėjai, esame įsipareigoję atsilyginti – prisidėdami įrankiais ir išvadomis, kurios daro skaitmeninę ekosistemą saugesnę visiems. Planuojame pasiūlyti nemokamą nuskaitymą atrinktoms nekomercinėms atvirojo kodo saugykloms, kad prisidėtume prie atvirojo kodo programinės įrangos ekosistemos ir tiekimo grandinės saugumo.
Neseniai atnaujinome savo išsiunčiamo koordinuoto atskleidimo politiką, kurioje laikomasi programuotojams palankios pozicijos, orientuotos į bendradarbiavimą ir mastelį turintį poveikį, o ne į griežtus atskleidimo terminus, kurie gali daryti spaudimą programuotojams. Tikimės, kad tokie įrankiai kaip „Aardvark“ padės aptikti vis daugiau klaidų, ir norime tvariai bendradarbiauti, kad pasiektume ilgalaikį atsparumą.
Programinė įranga dabar yra kiekvienos pramonės šakos pagrindas, o tai reiškia, kad programinės įrangos pažeidžiamumai yra sisteminė rizika verslui, infrastruktūrai ir visuomenei. Vien 2024 m. pranešta apie daugiau nei 40 tūkst. CVE. Mūsų bandymai rodo, kad apie 1,2 proc. pakeitimų fiksavimų įveda klaidų – tai maži pakeitimai, galintys turėti didžiulių pasekmių.
„Aardvark“ atstovauja naujam, į gynėjus orientuotam modeliui: tai agentinis saugumo tyrėjas, kuris bendradarbiauja su komandomis teikdamas nuolatinę apsaugą kintant kodui. Anksti aptikdamas pažeidžiamumus, patvirtindamas realaus pasaulio išnaudojimo galimybes ir siūlydamas aiškius pataisymus, „Aardvark“ gali sustiprinti saugumą nestabdydamas naujovių. Tikime saugumo ekspertizės prieinamumo plėtra. Pradedame nuo privačios beta versijos ir plėsime prieinamumą mokydamiesi.
Kviečiame atrinktus partnerius prisijungti prie „Aardvark“ privačios beta versijos. Dalyviai gaus išankstinę prieigą ir dirbs tiesiogiai su mūsų komanda, kad patobulintų aptikimo tikslumą, tikrinimo darbo eigas ir ataskaitų teikimo patirtį.
Siekiame patvirtinti veikimo efektyvumą įvairiose aplinkose. Jei jūsų organizacija ar atvirojo kodo projektas nori prisijungti, galite teikti paraišką čia.
Autorius
Autoriai
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu ir Matt Knight


