Predstavujeme Aardvark: agentného výskumníka bezpečnosti OpenAI

Teraz v súkromnej beta verzii: agent s umelou inteligenciou, ktorý premýšľa ako bezpečnostný výskumník a dokáže sa prispôsobiť požiadavkám moderného softvéru.

Načítava sa…

Dnes predstavuje me Aardvark, krokového bezpečnostného výskumníka poháňaného GPT‑5.

Bezpečnosť softvéru je jednou z najkritickejších a najnáročnejších oblastí v IT. Každý rok sa objavia desaťtisíce nových zraniteľností v podnikových a open-source kódových základniach. Obrancovia čelia náročným úlohám nájsť a opraviť zraniteľnosti skôr, ako to urobia ich protivníci. V spoločnosti OpenAI pracujeme na tom, aby sme naklonili rovnováhu v prospech obrancov.

Aardvark predstavuje prelom vo výskume umelej inteligencie a bezpečnosti: autonómny agent, ktorý môže pomôcť vývojárom a bezpečnostným tímom objavovať a opravovať zraniteľnosti v oblasti bezpečnosti vo veľkom rozsahu. Aardvark je teraz k dispozícii v súkromnej beta verzii na overenie a vylepšenie jeho schopností v danej oblasti.

Ako funguje Aardvark

Aardvark neustále analyzuje repozitáre zdrojového kódu na identifikáciu zraniteľností, posúdenie ich zneužiteľnosti, určenie priority závažnosti a návrh cielených záplat.

Aardvark funguje tak, že monitoruje commity a zmeny v kódových základniach, identifikuje zraniteľnosti, ako by mohli byť zneužité, a navrhuje opravy. Aardvark sa nespolieha na tradičné techniky analýzy programov, ako sú fuzzing alebo analýza zloženia softvéru. Namiesto toho využíva myslenie a používanie nástrojov poháňaných LLM na pochopenie správania kódu a identifikáciu zraniteľností. Aardvark hľadá chyby tak, ako by to robil ľudský bezpečnostný výskumník: čítaním kódu, jeho analýzou, písaním a spúšťaním testov, používaním nástrojov a ďalšími metódami.

Diagram s názvom „AARDVARK – Pracovný postup agenta na objavovanie zraniteľností“, znázorňujúci tok procesu od úložiska Git k modelovaniu hrozieb, objavovaniu zraniteľností, validačnému sandboxu, opravám pomocou Codexu a ľudskej kontrole vedúcej k žiadosti o späťvzatie.

Aardvark sa spolieha na viacstupňový proces na identifikáciu, vysvetlenie a opravu zraniteľností:

Analýza: Začína analýzou celého repozitára, aby vytvoril model hrozieb, ktorý odráža chápanie bezpečnostných cieľov a návrhu projektu.
Skenovanie commitov: Skenuje zraniteľnosti kontrolou zmien na úrovni commitov v celom repozitári a modeli hrozieb pri potrvrdzovaní nového kódu. Keď sa repozitár prvýkrát pripojí, Aardvark prehľadá jeho históriu, aby identifikoval existujúce problémy. Aardvark krok za krokom vysvetľuje nájdené zraniteľnosti a anotuje kód na ľudskú kontrolu.
Validácia: Keď Aardvark identifikuje potenciálnu zraniteľnosť, pokúsi sa ju spustiť v izolovanom sandboxovom prostredí, aby potvrdil jej zneužiteľnosť. Aardvark opisuje kroky podniknuté na zabezpečenie presných, vysokokvalitných a s nízkym počtom falošne pozitívnych poznatkov, ktoré sú poskytované používateľom.
Bezpečnostné záplaty: Aardvark sa integruje s OpenAI Codex, aby pomohol opraviť zraniteľnosti, ktoré nájde. Ku každému nálezu pripojí záplatu vygenerovanú Codexom a naskenovanú Aardvarkom, ktorú môže človek skontrolovať a efektívne opraviť jedným kliknutím.

Aardvark spolupracuje s inžiniermi, integruje sa s GitHubom, Codexom a existujúcimi pracovnými postupmi, aby poskytoval jasné a praktické poznatky bez spomalenia vývoja. Hoci je Aardvark navrhnutý pre bezpečnosť, v našom testovaní sme zistili, že môže tiež odhaliť chyby, ako sú logické chyby, neúplné opravy a problémy týkajúce sa súkromia.

Skutočný vplyv, dnes

Aardvark je v prevádzke už niekoľko mesiacov a nepretržite beží na interných kódových základniach OpenAI a na kódových základniach externých alfa partnerov. V rámci OpenAI objavili významné zraniteľnosti a prispel k obrannému postoju spoločnosti OpenAI. Partneri vyzdvihli hĺbku jeho analýzy, pričom Aardvark našiel problémy, ktoré sa objavujú iba za zložitých podmienok.

Pri testovaní benchmarku na „zlatých“ repozitároch Aardvark identifikoval 92 % známych a synteticky zavedených zraniteľností, čo dokazuje vysokú mieru zachytenia a efektívnosť v reálnom svete.

Aardvark pre Open Source

Aardvark bol tiež použitý v projektoch s otvoreným zdrojovým kódom, kde objavil a my sme zodpovedne zverejnili množstvo zraniteľností – desať z nich získalo identifikátory Common Vulnerabilities and Exposures (CVE).

Ako príjemcovia desaťročí otvoreného výskumu a zodpovedného zverejňovania informácií sme odhodlaní pomáhať – prispievať nástrojmi a zisteniami, ktoré robia digitálny ekosystém bezpečnejším pre všetkých. Plánujeme ponúknuť bezplatné skenovanie vybraných nekomerčných repozitárov s otvoreným zdrojovým kódom, aby sme prispeli k bezpečnosti ekosystému a dodávateľského reťazca softvéru s otvoreným zdrojovým kódom.

Nedávno sme aktualizovali⁠ našu politiku koordinovaného externého zverejňovania⁠, ktorá zaujíma prístup ústretový k vývojárom a zameriava sa na spoluprácu a škálovateľný vplyv, a nie na rigidné časové rámce zverejňovania, ktoré môžu vyvíjať tlak na vývojárov. Očakávame, že nástroje ako Aardvark povedú k objaveniu rastúceho počtu chýb a chceme udržateľne spolupracovať na dosiahnutí dlhodobej odolnosti.

Prečo je to dôležité

Softvér je teraz chrbtovou kosťou každého odvetvia, čo znamená, že zraniteľnosti softvéru predstavujú systémové riziko pre podniky, infraštruktúru a spoločnosť. V roku 2024 bolo nahlásených viac ako 40 000 CVE. Naše testovanie ukazuje, že približne 1,2 % commitov zavádza chyby—malé zmeny, ktoré môžu mať neprimerane veľké dôsledky.

Aardvark predstavuje nový model zameraný na obranu: agentný výskumník bezpečnosti, ktorý spolupracuje s tímami poskytovaním nepretržitej ochrany počas vývoja kódu. Včasným odhalením zraniteľností, overením ich zneužiteľnosti v reálnom svete a ponúkaním jasných opráv môže Aardvark posilniť bezpečnosť bez spomalenia inovácií. Veríme v rozšírenie prístupu k odborným znalostiam v oblasti bezpečnosti. Začíname so súkromnou beta verziou a postupne budeme rozširovať jej dostupnosť.

Súkromná beta verzia je teraz otvorená

Pozývame vybraných partnerov, aby sa pripojili k súkromnej beta verzii Aardvark. Účastníci získajú skorý prístup a budú priamo spolupracovať s naším Teamom na zdokonalení presnosti detekcie, validačných pracovných postupov a skúseností s podávaním správ.

Hľadáme spôsob, ako overiť výkon v rôznych prostrediach. Ak má vaša organizácia alebo projekt s otvoreným zdrojom záujem o vstup, môžete sa prihlásiť tu⁠.