30. října 2025

Představujeme Aardvark: agentského bezpečnostního výzkumníka OpenAI

Nyní v privátní beta verzi: AI agent, který přemýšlí jako bezpečnostní výzkumník a dokáže se přizpůsobit, aby splnil požadavky moderního softwaru.

Načítání…

Dnes představujeme Aardvark, agentského bezpečnostního výzkumníka využívajícího GPT‑5.

Bezpečnost softwaru je jednou z nejkritičtějších a nejnáročnějších oblastí v technologii. Každý rok se objeví desítky tisíc nových zranitelností v podnikových a open-source kódech. Obránci čelí náročným úkolům najít a opravit zranitelnosti dříve, než to udělají jejich protivníci. V OpenAI pracujeme na tom, abychom rovnováhu zvrátili ve prospěch obránců.

Aardvark představuje průlom v oblasti výzkumu AI a zabezpečení: autonomní agent, který může pomoci vývojářům a týmům zabezpečení objevovat a opravovat bezpečnostní zranitelnosti ve velkém měřítku. Aardvark je nyní dostupný v privátní beta verzi za účelem ověřování a vylaďování schopnosti v oboru.

Jak funguje Aardvark

Aardvark neustále analyzuje repozitáře zdrojového kódu, aby identifikoval zranitelnosti, posoudil jejich zneužitelnost, stanovil prioritu závažnosti a navrhl cílené opravy.

Aardvark funguje tak, že sleduje commity a změny v kódu, identifikuje zranitelnosti, jak by mohly být zneužity, a navrhuje opravy. Aardvark nevyužívá tradiční techniky analýzy programů, jako je fuzzing nebo analýza složení softwaru. Místo toho využívá odůvodňování a používání nástrojů LLM k pochopení chování kódu a identifikaci zranitelností. Aardvark hledá chyby podobně jako lidský bezpečnostní výzkumník: čtením kódu, jeho analýzou, psaním a prováděním testů, používáním nástrojů a podobně.

Diagram s názvem „AARDVARK – pracovní postup agenta pro objevování zranitelností“ ukazuje tok procesu od úložiště Git k modelování hrozeb, objevování zranitelností, validačnímu sandboxu, opravám pomocí Codexu a kontrole člověkem, která vede k žádosti o pull.

Aardvark spoléhá na vícestupňový proces k identifikaci, vysvětlení a opravě zranitelností:

Analýza: Začíná analýzou celého repozitáře, aby vytvořil model hrozeb, který odráží pochopení bezpečnostních cílů a návrhu projektu.
Skenování commitů: Skenuje zranitelnosti kontrolou změn na úrovni commitů v celém repozitáři s využitím modelu hrozeb, jakmile je nový kód potvrzen. Když je repozitář poprvé připojen, Aardvark prohledá jeho historii, aby identifikoval stávající problémy. Aardvark vysvětluje nalezené zranitelnosti krok za krokem a anotuje kód pro kontrolu člověkem.
Ověření: Jakmile Aardvark identifikuje potenciální zranitelnost, pokusí se ji vyvolat v izolovaném, sandboxovém prostředí, aby potvrdil její zneužitelnost. Aardvark popisuje kroky podniknuté k zajištění toho, aby uživatelům byly poskytovány přesné poznatky vysoké kvality s nízkým počtem falešně pozitivních výsledků.
Opravy: Aardvark se integruje s OpenAI Codex, aby pomohl opravit nalezené zranitelnosti. Ke každému nálezu připojuje Codexem vytvořenou a Aardvarkem skenovanou opravu pro kontrolu člověkem a efektivní opravu jedním kliknutím.

Aardvark spolupracuje s programátory, integruje se s GitHubem, Codexem a stávajícími pracovními postupy, aby poskytoval jasné a použitelné poznatky, aniž by zpomaloval vývoj. Ačkoli je Aardvark navržen pro zabezpečení, při našem testování jsme zjistili, že dokáže odhalit také chyby, jako jsou logické chyby, neúplné opravy a problémy s ochranou soukromí.

Skutečný přínos, už dnes

Aardvark je v provozu již několik měsíců a nepřetržitě běží napříč interním kódem OpenAI a kódem externích alfa partnerů. Uvnitř OpenAI odhalil významné zranitelnosti, čímž přispěl k lepší obraně OpenAI. Partneři vyzdvihli hloubku jeho analýzy, přičemž Aardvark odhaluje problémy, které se objevují pouze za složitých podmínek.

Při srovnávacím testování na „zlatých“ repozitářích Aardvark identifikoval 92 % známých a uměle zavedených zranitelností, což dokazuje vysokou úroveň zpětného vyhledávání a účinnost v reálném světě.

Aardvark pro open source

Aardvark byl také použit v open source projektech, kde objevil řadu zranitelností, které jsme poté zveřejnili – deset z nich obdrželo identifikátory Common Vulnerabilities and Exposures (CVE).

Protože využíváme desetiletí otevřeného výzkumu a odpovědného zveřejňování, zavazujeme se také přispívat – nástroji a poznatky, díky kterým je digitální ekosystém bezpečnější pro všechny. Plánujeme nabídnout pro bono skenování vybraným nekomerčním open source repozitářům, abychom přispěli k bezpečnosti ekosystému open source softwaru a dodavatelského řetězce.

Nedávno jsme aktualizovali⁠ zásady koordinovaného zveřejňování informací⁠, které se staví přívětivě k vývojářům a jsou zaměřené na spolupráci a škálovatelný dopad namísto striktních časových harmonogramů zveřejňování, které mohou vyvíjet tlak na vývojáře. Očekáváme, že nástroje jako Aardvark povedou k objevení rostoucího počtu chyb a chceme udržitelně spolupracovat na dosažení dlouhodobé odolnosti.

Proč na tom záleží

Software je nyní páteří každého odvětví – což znamená, že zranitelnosti softwaru představují systémové riziko pro firmy, infrastrukturu a společnost. V roce 2024 bylo nahlášeno přes 40 000 CVE. Naše testování ukazuje, že přibližně 1,2 % commitů zavádí chyby – malé změny, které mohou mít neúměrně velké následky.

Aardvark představuje nový model zaměřený na obranu: agentský bezpečnostní výzkumník, který spolupracuje s týmy a poskytuje nepřetržitou ochranu, jak se kód vyvíjí. Tím, že včas zachytí zranitelnosti, ověří jejich využitelnost v reálném světě a nabídne jasná řešení, může Aardvark posílit bezpečnost, aniž by zpomalil inovace. Věříme v rozšiřování přístupu k odborným znalostem v oblasti zabezpečení. Začínáme privátní beta verzí a dostupnost budeme rozšiřovat, jak se budeme učit.

Privátní beta verze je nyní k dispozici

Zveme vybrané partnery, aby se připojili k privátní beta verzi nástroje Aardvark. Účastníci získají předčasný přístup a budou přímo spolupracovat s naším týmem na zdokonalení přesnosti detekce, validačních pracovních postupů a uživatelského prostředí reportování.

Chceme ověřit výkon v různých prostředích. Pokud má vaše organizace nebo open source projekt zájem se připojit, může se přihlásit zde⁠.