Predstavljamo Aardvarka: OpenAI-jevog istraživača agentske sigurnosti
Sada u privatnoj beta verziji: AI agent koji razmišlja poput istraživača sigurnosti i prilagođava se kako bi zadovoljio zahtjeve modernog softvera.
Danas najavljujemo Aardvarka, istraživača agentske sigurnosti pokretanog modelom GPT‑5.
Sigurnost softvera jedna je od najključnijih i najizazovnijih granica u tehnologiji. Svake godine otkriju se deseci tisuća novih ranjivosti u poslovnim i otvorenim kodnim bazama. Branitelji se suočavaju s izazovnim zadacima pronalaženja i krpanja ranjivosti prije nego što to učine njihovi protivnici. U OpenAI-ju radimo na tome da preokrenemo ravnotežu u korist branitelja.
Aardvark predstavlja proboj u istraživanju umjetne inteligencije i sigurnosti: autonomni agent koji može pomoći razvojnim inženjerima i sigurnosnim timovima da otkriju i isprave sigurnosne ranjivosti u velikim razmjerima. Aardvark je sada dostupan u privatnoj beta verziji kako bi se potvrdile i poboljšale njegove sposobnosti na terenu.
Aardvark kontinuirano analizira repozitorije izvornog koda kako bi identificirao ranjivosti, procijenio mogućnost iskorištavanja, odredio prioritet ozbiljnosti i predložio ciljane zakrpe.
Aardvark radi tako da prati dodavanja i promjene u kodnim bazama, identificira ranjivosti, kako bi se one mogle iskoristiti, te predlaže popravke. Aardvark se ne oslanja na tradicionalne tehnike analize programa kao što su fuzzing ili analiza sastava softvera. Umjesto toga, koristi prosuđivanje i korištenje alata pokretanih LLM-om za razumijevanje ponašanja koda i identificiranje ranjivosti. Aardvark traži greške kao što bi to činio ljudski istraživač sigurnosti: čitajući kod, analizirajući ga, pišući i izvodeći testove, koristeći alate i još mnogo toga.
Aardvark se oslanja na višestupanjski kanal za prepoznavanje, objašnjavanje i ispravljanje ranjivosti:
- Analiza: Počinje analizom cjelokupnog repozitorija kako bi se izradio model prijetnji koji odražava njegovo razumijevanje ciljeva i dizajna sigurnosti projekta.
- Skeniranje dodavanja: Skenira ranjivosti pregledom promjena na razini dodavanja u odnosu na cjelokupni repozitorij i model prijetnji dok se novi kod dodaje. Kada se repozitorij prvi put poveže, Aardvark će skenirati njegovu povijest kako bi identificirao postojeće probleme. Aardvark objašnjava ranjivosti koje pronalazi korak po korak, bilježeći kod za ljudski pretpregled.
- Validacija: Kada Aardvark identificira potencijalnu ranjivost, pokušat će ju aktivirati u izoliranom, sandbox okruženju kako bi potvrdio njezinu iskoristivost. Aardvark opisuje korake poduzete kako bi se osiguralo da se korisnicima vrate točni, visokokvalitetni uvidi s malim brojem lažno pozitivnih rezultata.
- Krpanje: Aardvark se integrira s OpenAI Codexom kako bi pomogao u otklanjanju ranjivosti koje pronađe. Uz svako otkriće prilaže zakrpu koju je generirao Codex i skenirao Aardvark, za ljudski pretpregled i učinkovito krpanje jednim klikom.
Aardvark surađuje s inženjerima, integrirajući se s GitHubom, Codexom i postojećim radnim tijekovima kako bi pružio jasne i djelotvorne uvide bez usporavanja razvoja. Premda je Aardvark programiran za sigurnost, u našem testiranju otkrili smo da može također otkriti greške poput logičkih grešaka, nepotpunih popravaka i problema s privatnošću.
Aardvark je u službi već nekoliko mjeseci, kontinuirano radi na internim kodnim bazama OpenAI-ja i onima vanjskih alfa partnera. Unutar OpenAI-ja otkrivene su značajne ranjivosti koje su pridonijele obrambenom stavu OpenAI-ja. Partneri su istaknuli dubinu njegove analize, pri čemu je Aardvark pronašao probleme koji se pojavljuju samo pod složenim uvjetima.
U referentnim testiranjima na „zlatnim” repozitorijima, Aardvark je identificirao 92 % poznatih i sintetički uvedenih ranjivosti, pokazujući visoku razinu prepoznavanja i učinkovitost u stvarnim uvjetima.
Aardvark je također primijenjen na projekte otvorenog koda, na kojima je otkrio, a mi smo odgovorno prijavili, brojne ranjivosti, od kojih je deset dobilo identifikatore Uobičajenih ranjivosti i izloženosti (CVE).
Kao korisnici desetljeća otvorenih istraživanja i odgovornog otkrivanja, posvećeni smo uzvraćanju, doprinosu alatima i nalazima koji čine digitalni ekosustav sigurnijim za sve. Planiramo ponuditi pro-bono skeniranje odabranim nekomercijalnim repozitorijima otvorenog koda kako bismo doprinijeli sigurnosti ekosustava softvera otvorenog koda i opskrbnog lanca.
Nedavno smo ažurirali naša pravila koordiniranog otkrivanja informacija koja zauzimaju stav prilagođen razvojnim inženjerima, fokusirajući se na suradnju i skalabilan učinak, umjesto na krute vremenske rokove otkrivanja koji mogu vršiti pritisak na razvojne inženjere. Očekujemo da će alati poput Aardvarka rezultirati otkrivanjem sve većeg broja grešaka, i želimo održivo surađivati kako bismo postigli dugoročnu otpornost.
Softver je sada okosnica svake djelatnosti, što znači da su ranjivosti softvera sustavni rizik za poslovanje, infrastrukturu i društvo. Više od 40.000 CVE-ova prijavljeno je samo u 2024. godini. Naše testiranje pokazuje da oko 1,2 % dodavanja unosi greške, male promjene koje mogu imati velike posljedice.
Aardvark predstavlja novi model usmjeren na obranu: istraživača agentske sigurnosni koji surađuje s timovima pružajući kontinuiranu zaštitu kako se kod razvija. Ranim otkrivanjem ranjivosti, provjerom stvarne iskoristivosti i ponudom jasnih rješenja, Aardvark može ojačati sigurnost bez usporavanja inovacija. Vjerujemo u proširenje pristupa stručnosti u području sigurnosti. Započinjemo s privatnom beta verzijom i proširit ćemo dostupnost kako budemo stjecali iskustvo.
Pozivamo odabrane partnere da se pridruže privatnoj beta verziji Aardvarka. Sudionici će dobiti rani pristup i raditi izravno s našim timom kako bi poboljšali točnost detekcije, validacijske radne tijekove i okruženje izvještavanja.
Nastojimo validirati performanse u raznim okruženjima. Ako su vaša organizacija ili projekt otvorenog koda zainteresirani za pridruživanje, možete se prijaviti ovdje.
Autor
Suradnici
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu i Matt Knight


