Hopp til hovedinnhold
OpenAI

Vi introduserer Aardvark: OpenAIs agentdrevne sikkerhetsforsker

Nå i privat betaversjon: en AI-agent som tenker som en sikkerhetsforsker og skalerer for å møte kravene til moderne programvare.

Laster inn …

I dag presenterer vi Aardvark, en agentbasert sikkerhetsforsker drevet av GPT‑5.

Programvaresikkerhet er en av de viktigste – og mest utfordrende – yttergrensene innen teknologi. Hvert år oppdages titusenvis av svakheter i forskjellige bedriftskodebaser og kodebaser med åpen kildekode. Forsvarere har den tøffe oppgaven med å finne og fikse svakheter før uvedkommende gjør det. Hos OpenAI jobber vi for å gi forsvarerne en fordel.

Aardvark representerer et gjennombrudd innen AI og sikkerhetsforskning: en autonom agent som kan hjelpe utvikler- og sikkerhetsteam med å oppdage og fikse sikkerhetssvakheter i stor skala. Aardvark er nå tilgjengelig i en privat betaversjon for å validere og forbedre dens funksjoner i felten.

Slik fungerer Aardvark

Aardvark analyserer kontinuerlig kildekoderepositorier for å identifisere sårbarheter, vurdere utnyttbarhet, prioritere alvorlighetsgrad og foreslå målrettede oppdateringer.

Aardvark fungerer ved å overvåke commits og endringer til kodebaser, identifisere sårbarheter, hvordan de kan utnyttes og foreslå rettelser. Aardvark er ikke avhengig av tradisjonelle programanalyseteknikker som fuzz-testing eller analyse av programvarekomposisjon. I stedet bruker den LLM-drevet resonnering og verktøybruk for å forstå kodeadferd og identifisere sårbarheter. Aardvark ser etter feil på samme måte som en menneskelig sikkerhetsforsker: ved å lese kode, analysere den, skrive og utføre tester, bruke verktøy med mer.

Diagram med tittelen «AARDVARK — Vulnerability Discovery Agent Workflow», som viser en prosessflyt fra Git-repositorium til trusselmodellering, oppdagelse av sårbarheter, valideringssandkasse, patching med Codex og menneskelig gjennomgang som fører til en pull-forespørsel.

Aardvark belager seg på en flertrinnsprosess for å identifisere, forklare og fikse svakheter.

  • Analyse: Den begynner med å analysere hele repositoriet for å produsere en trusselmodell som reflekterer dens forståelse av prosjektets sikkerhetsmål og -utforming.
  • Commit-skanning: Den skanner etter svakheter ved å inspisere endringer på commit-nivå mot hele repositoriet og trusselmodellen når ny kode legges inn. Når et repositorium blir koblet til for første gang, vil Aardvark skanne historikken for å identifisere eksisterende problemer. Aardvark forklarer svakhetene den finner steg for steg, og kommenterer kode for menneskelig gjennomgang.
  • Validering: Når Aardvark har identifisert en potensiell svakhet, vil den prøve å utløse den i et isolert sandkassemiljø for å bekrefte utnyttbarheten. Aardvark beskriver stegene den tar for å sikre at nøyaktig innsikt av høy kvalitet med lave falske positive resultater returneres til brukerne.
  • Patching: Aardvark integreres med OpenAI Codex for å fikse svakhetene den finner. Den legger ved en Codex-generert og Aardvark-skannet patch til hvert funn for menneskelig gjennomgang og effektiv patching med ett klikk.

Aardvark samarbeider med ingeniører og integreres med GitHub, Codex og eksisterende arbeidsflyter for å levere tydelig og handlingsrettet innsikt uten å bremse utviklingen. Selv om Aardvark er bygget for sikkerhet, har vi funnet ut at den også kan avdekke feil som logiske brister, ufullstendige rettelser og personvernproblemer.

Ekte innvirkning, i dag

Aardvark har vært i drift i flere måneder, og kjører kontinuerlig på tvers av OpenAIs interne kodebaser og de som tilhører eksterne alfapartnere. Innenfor OpenAI har den avdekket betydelige svakheter og bidratt til OpenAIs defensive holdning. Partnere har fremhevet dybden i analysen, hvor Aardvark har funnet problemer som bare forekommer under komplekse omstendigheter.

I referansetesting på «gylne» repositorier, har Aardvark identifisert 92 % av kjente og syntetisk introduserte svakheter, noe som viser høy gjenkjenning og effektivitet i den virkelige verden.

Aardvark til åpen kildekode-miljøet

Aardvark har også blitt brukt i prosjekter med åpen kildekode, der den har oppdaget, og vi har offentliggjort, flere svakheter – hvorav ti stykker har fått identifikatoren Common Vulnerabilities and Exposures (CVE).

Som mottakere av fler tiår med åpen forskning og ansvarlig offentliggjøring, ønsker vi å gi tilbake ved å bidra med verktøy og funn som gjør det digitale økosystemet tryggere for alle. Vi planlegger å tilby pro bono-skanning til utvalgte ikke-kommersielle repositorier med åpen kildekode for å bidra til sikkerheten i økosystemet og forsyningskjeden for åpen kildekode.

Nylig oppdaterte vi våre retningslinjer for utgående koordinert offentliggjøring, som har en utviklervennlig innstilling som fokuserer på samarbeid og skalerbar effekt, snarere enn rigide tidsfrister for offentliggjøring som kan legge press på utviklere. Vi forventer at verktøy som Aardvark vil føre til at flere feil vil bli avdekket, og vi ønsker å samarbeide for å oppnå langsiktig robusthet på en bærekraftig måte.

Hvorfor er det viktig?

Programvare er nå ryggraden i alle bransjer – noe som betyr at programvaresvakheter er en systemisk risiko for bedrifter, infrastruktur og samfunnet. Over 40 000 CVE-er ble rapportert bare i 2024. Testingen vår viser at rundt 1,2 % av commits introduserer feil – små endringer som kan ha store konsekvenser.

Aardvark representerer en ny modell med forsvar som fokusområde: en agentdrevet sikkerhetsforsker som samarbeider med team ved å levere kontinuerlig beskyttelse etter hvert som koden utvikler seg. Ved å finne sårbarheter tidlig, bekrefte faktisk utnyttbarhet og tilby klare rettelser kan Aardvark styrke sikkerheten uten å bremse innovasjonen. Vi har troen på å utvide tilgangen til sikkerhetsekspertise. Vi begynner med en privat betaversjon og vil utvide tilgangen etter hvert som vi lærer mer.

Privat betaversjon er nå åpen

Vi inviterer utvalgte partnerer til å bli med i den private betaversjonen av Aardvark. Deltagerne vil få tidlig tilgang og jobbe direkte med teamet vårt for å forbedre oppdagelsesnøyaktigheten, bekrefte arbeidsflyter og rapportere erfaringer.

Vi ønsker å bekrefte ytelse på tvers av en rekke miljøer. Om organisasjonen eller åpen kildekode-prosjektet ditt er interessert i å delta, kan du søke her.

Forfatter

OpenAI

Bidragsytere

Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu og Matt Knight