Představujeme Aardvark: agentského bezpečnostního výzkumníka OpenAI
Nyní v privátní beta verzi: AI agent, který přemýšlí jako bezpečnostní výzkumník a dokáže se přizpůsobit, aby splnil požadavky moderního softwaru.
Dnes představujeme Aardvark, agentského bezpečnostního výzkumníka využívajícího GPT‑5.
Bezpečnost softwaru je jednou z nejkritičtějších a nejnáročnějších oblastí v technologii. Každý rok se objeví desítky tisíc nových zranitelností v podnikových a open-source kódech. Obránci čelí náročným úkolům najít a opravit zranitelnosti dříve, než to udělají jejich protivníci. V OpenAI pracujeme na tom, abychom rovnováhu zvrátili ve prospěch obránců.
Aardvark představuje průlom v oblasti výzkumu AI a zabezpečení: autonomní agent, který může pomoci vývojářům a týmům zabezpečení objevovat a opravovat bezpečnostní zranitelnosti ve velkém měřítku. Aardvark je nyní dostupný v privátní beta verzi za účelem ověřování a vylaďování schopnosti v oboru.
Aardvark neustále analyzuje repozitáře zdrojového kódu, aby identifikoval zranitelnosti, posoudil jejich zneužitelnost, stanovil prioritu závažnosti a navrhl cílené opravy.
Aardvark funguje tak, že sleduje commity a změny v kódu, identifikuje zranitelnosti, jak by mohly být zneužity, a navrhuje opravy. Aardvark nevyužívá tradiční techniky analýzy programů, jako je fuzzing nebo analýza složení softwaru. Místo toho využívá odůvodňování a používání nástrojů LLM k pochopení chování kódu a identifikaci zranitelností. Aardvark hledá chyby podobně jako lidský bezpečnostní výzkumník: čtením kódu, jeho analýzou, psaním a prováděním testů, používáním nástrojů a podobně.
Aardvark spoléhá na vícestupňový proces k identifikaci, vysvětlení a opravě zranitelností:
- Analýza: Začíná analýzou celého repozitáře, aby vytvořil model hrozeb, který odráží pochopení bezpečnostních cílů a návrhu projektu.
- Skenování commitů: Skenuje zranitelnosti kontrolou změn na úrovni commitů v celém repozitáři s využitím modelu hrozeb, jakmile je nový kód potvrzen. Když je repozitář poprvé připojen, Aardvark prohledá jeho historii, aby identifikoval stávající problémy. Aardvark vysvětluje nalezené zranitelnosti krok za krokem a anotuje kód pro kontrolu člověkem.
- Ověření: Jakmile Aardvark identifikuje potenciální zranitelnost, pokusí se ji vyvolat v izolovaném, sandboxovém prostředí, aby potvrdil její zneužitelnost. Aardvark popisuje kroky podniknuté k zajištění toho, aby uživatelům byly poskytovány přesné poznatky vysoké kvality s nízkým počtem falešně pozitivních výsledků.
- Opravy: Aardvark se integruje s OpenAI Codex, aby pomohl opravit nalezené zranitelnosti. Ke každému nálezu připojuje Codexem vytvořenou a Aardvarkem skenovanou opravu pro kontrolu člověkem a efektivní opravu jedním kliknutím.
Aardvark spolupracuje s programátory, integruje se s GitHubem, Codexem a stávajícími pracovními postupy, aby poskytoval jasné a použitelné poznatky, aniž by zpomaloval vývoj. Ačkoli je Aardvark navržen pro zabezpečení, při našem testování jsme zjistili, že dokáže odhalit také chyby, jako jsou logické chyby, neúplné opravy a problémy s ochranou soukromí.
Aardvark je v provozu již několik měsíců a nepřetržitě běží napříč interním kódem OpenAI a kódem externích alfa partnerů. Uvnitř OpenAI odhalil významné zranitelnosti, čímž přispěl k lepší obraně OpenAI. Partneři vyzdvihli hloubku jeho analýzy, přičemž Aardvark odhaluje problémy, které se objevují pouze za složitých podmínek.
Při srovnávacím testování na „zlatých“ repozitářích Aardvark identifikoval 92 % známých a uměle zavedených zranitelností, což dokazuje vysokou úroveň zpětného vyhledávání a účinnost v reálném světě.
Aardvark byl také použit v open source projektech, kde objevil řadu zranitelností, které jsme poté zveřejnili – deset z nich obdrželo identifikátory Common Vulnerabilities and Exposures (CVE).
Protože využíváme desetiletí otevřeného výzkumu a odpovědného zveřejňování, zavazujeme se také přispívat – nástroji a poznatky, díky kterým je digitální ekosystém bezpečnější pro všechny. Plánujeme nabídnout pro bono skenování vybraným nekomerčním open source repozitářům, abychom přispěli k bezpečnosti ekosystému open source softwaru a dodavatelského řetězce.
Nedávno jsme aktualizovali zásady koordinovaného zveřejňování informací, které se staví přívětivě k vývojářům a jsou zaměřené na spolupráci a škálovatelný dopad namísto striktních časových harmonogramů zveřejňování, které mohou vyvíjet tlak na vývojáře. Očekáváme, že nástroje jako Aardvark povedou k objevení rostoucího počtu chyb a chceme udržitelně spolupracovat na dosažení dlouhodobé odolnosti.
Software je nyní páteří každého odvětví – což znamená, že zranitelnosti softwaru představují systémové riziko pro firmy, infrastrukturu a společnost. V roce 2024 bylo nahlášeno přes 40 000 CVE. Naše testování ukazuje, že přibližně 1,2 % commitů zavádí chyby – malé změny, které mohou mít neúměrně velké následky.
Aardvark představuje nový model zaměřený na obranu: agentský bezpečnostní výzkumník, který spolupracuje s týmy a poskytuje nepřetržitou ochranu, jak se kód vyvíjí. Tím, že včas zachytí zranitelnosti, ověří jejich využitelnost v reálném světě a nabídne jasná řešení, může Aardvark posílit bezpečnost, aniž by zpomalil inovace. Věříme v rozšiřování přístupu k odborným znalostem v oblasti zabezpečení. Začínáme privátní beta verzí a dostupnost budeme rozšiřovat, jak se budeme učit.
Zveme vybrané partnery, aby se připojili k privátní beta verzi nástroje Aardvark. Účastníci získají předčasný přístup a budou přímo spolupracovat s naším týmem na zdokonalení přesnosti detekce, validačních pracovních postupů a uživatelského prostředí reportování.
Chceme ověřit výkon v různých prostředích. Pokud má vaše organizace nebo open source projekt zájem se připojit, může se přihlásit zde.
Autor
Přispěvatelé
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight


