Idag presenterar vi Aardvark, en agentbaserad säkerhetsforskare som drivs av GPT‑5.
Programvarusäkerhet är ett av de viktigaste – och mest utmanande – områdena inom teknik. Varje år upptäcks tiotusentals nya sårbarheter i kodbaser inom företagsmiljöer och projekt med öppen källkod. Säkerhetsteam står inför den svåra uppgiften att hitta och åtgärda sårbarheter innan angriparna gör det. På OpenAI arbetar vi för att ge säkerhetsteamen övertaget.
Aardvark representerar ett genombrott inom AI- och säkerhetsforskning: en autonom agent som kan hjälpa utvecklare och säkerhetsteam att upptäcka och åtgärda säkerhetsbrister i stor skala. Aardvark finns nu tillgängligt i privat betaversion för att validera och förfina dess funktioner i verkliga miljöer.
Aardvark analyserar kontinuerligt källkodsförråd för att identifiera sårbarheter, bedöma hur de kan utnyttjas, prioritera allvarlighetsgrad och föreslå riktade åtgärder.
Aardvark fungerar genom att övervaka incheckningar och ändringar i kodbaser, identifiera sårbarheter, hur de kan utnyttjas och föreslå lösningar. Aardvark förlitar sig inte på traditionella metoder för programanalys, såsom fuzzing eller analys av programvarukomposition. Istället använder den LLM-baserat resonemang och verktygsanvändning för att förstå kodbeteende och identifiera sårbarheter. Aardvark letar efter buggar på samma sätt som en mänsklig säkerhetsforskare skulle göra det: genom att läsa, analysera och testa kod, använda verktyg och mycket mer.
Aardvark använder en flerstegsmetod för att identifiera, förklara och åtgärda sårbarheter:
- Analys: Den börjar med att analysera hela arkivet för att ta fram en hotmodell som återspeglar dess förståelse av projektets säkerhetsmål och utformning.
- Granskning av incheckningar: Den söker efter sårbarheter genom att granska ändringar på incheckningsnivå mot hela arkivet och hotmodellen när ny kod checkas in. När ett kodförråd ansluts för första gången genomsöker Aardvark dess historik för att identifiera befintliga problem. Aardvark förklarar de sårbarheter den hittar steg för steg och kommenterar koden för manuell granskning.
- Validering: När Aardvark har identifierat en potentiell sårbarhet försöker den utlösa den i en isolerad sandlådemiljö för att bekräfta hur den kan utnyttjas. Aardvark beskriver de steg som tas för att säkerställa att användarna får tillförlitliga och högkvalitativa insikter med minimalt antal falska positiva resultat.
- Patching: Aardvark integreras med OpenAI Codex för att hjälpa till att åtgärda de sårbarheter den hittar. Den lägger till en Codex-genererad och Aardvark-granskad patch till varje fynd för manuell granskning och effektiv patchning med ett klick.
Aardvark arbetar tillsammans med ingenjörer och integreras med GitHub, Codex och befintliga arbetsflöden för att leverera tydliga och handlingsbara insikter utan att bromsa utvecklingen. Aardvark är utvecklat för säkerhet, men våra tester har visat att det även kan identifiera andra typer av buggar – som logiska fel, ofullständiga korrigeringar och integritetsrelaterade problem.
Aardvark har varit i aktiv användning i flera månader och körs kontinuerligt i både OpenAI:s interna kodbaser och hos externa alfapartners. Internt hos OpenAI har den avslöjat viktiga sårbarheter och bidragit till att stärka OpenAI:s säkerhetsförsvar. Våra partners har lyft fram hur djupgående Aardvarks analyser är, där den har identifierat problem som endast uppstår under komplexa förhållanden.
I benchmarktester på så kallade "gyllene" kodförråd identifierade Aardvark 92 % av både kända och avsiktligt införda sårbarheter – ett resultat som visar på hög träffsäkerhet och stor effektivitet i verkliga miljöer.
Aardvark har även använts i projekt med öppen källkod, där det har upptäckt och vi på ett ansvarsfullt sätt rapporterat ett flertal sårbarheter – varav tio har tilldelats Common Vulnerabilities and Exposures (CVE)-identifierare.
Efter att själva ha dragit nytta av decennier av öppen forskning och ansvarsfull rapportering vill vi ge tillbaka – med verktyg och resultat som stärker säkerheten i hela det digitala ekosystemet. Vi planerar att erbjuda kostnadsfri skanning till utvalda icke-kommersiella kodförråd med öppen källkod för att bidra till säkerheten i ekosystemet för öppen källkod och dess leveranskedja.
Vi uppdaterade nyligen vår policy för samordnad extern rapportering – med en mer utvecklarvänlig inriktning och fokus på samarbete och skalbar effekt, snarare än strikta tidsfrister för offentliggörande som kan sätta press på utvecklare. Vi förväntar oss att verktyg som Aardvark kommer att leda till att allt fler buggar upptäcks, och vi vill samarbeta på ett hållbart sätt för att bygga upp långsiktig motståndskraft.
Programvara är numera ryggraden i alla branscher, vilket innebär att sårbarheter i programvara utgör en systemrisk för företag, infrastruktur och samhället. Över 40 000 CVE:er rapporterades bara under 2024. Våra tester visar att omkring 1,2 % av incheckningarna introducerar buggar – små ändringar som kan få oproportionerligt stora konsekvenser.
Aardvark representerar en ny modell som sätter försvaret i fokus: en agentbaserad säkerhetsforskare som samarbetar med team och ger löpande skydd i takt med att koden utvecklas. Genom att upptäcka sårbarheter tidigt, validera hur de kan utnyttjas i verkliga miljöer och erbjuda tydliga lösningar kan Aardvark stärka säkerheten utan att bromsa innovationen. Vi tror på att utöka tillgången till säkerhetsexpertis. Vi börjar med en privat betaversion och kommer att göra den tillgänglig för fler i takt med att vi samlar erfarenhet.
Vi bjuder in utvalda partners att delta i den privata betaversionen av Aardvark. Deltagarna får tidig åtkomst och arbetar direkt med vårt team för att förbättra träffsäkerhet i identifiering, arbetsflöden för validering och hur rapporteringen upplevs.
Vi strävar efter att validera prestanda i flera olika miljöer. Om din organisation eller ditt projekt med öppen källkod är intresserad av att delta kan du ansöka här.
Författare
Deltagare
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight


