Vorstellung von Aardvark: OpenAIs agentischer Sicherheitsforscher

Jetzt in der privaten Beta: ein KI-Agent, der wie ein Sicherheitsforscher denkt und sich skalieren lässt, um den Anforderungen moderner Software gerecht zu werden.

Laden …

Heute stellen wir Aardvark vor, einen agentischen Sicherheitsforscher, der von GPT‑5 unterstützt wird.

Softwaresicherheit ist eines der kritischsten und zugleich anspruchsvollsten Gebiete der Technologie. Jedes Jahr werden Zehntausende neuer Schwachstellen in Unternehmens- und Open-Source-Codebasen entdeckt. Verteidiger stehen vor der gewaltigen Aufgabe, diese Schwachstellen zu finden und zu beheben, bevor Angreifer sie ausnutzen. Bei OpenAI arbeiten wir daran, das Gleichgewicht zugunsten der Verteidiger zu verschieben.

Aardvark stellt einen Durchbruch in der KI- und Sicherheitsforschung dar: ein autonomer Agent, der Entwicklern und Sicherheitsteams hilft, Sicherheitslücken in großem Maßstab zu entdecken und zu beheben. Aardvark ist jetzt in der privaten Beta verfügbar, um seine Fähigkeiten im Praxiseinsatz zu validieren und zu verfeinern.

So funktioniert Aardvark

Aardvark analysiert kontinuierlich Quellcode-Repositorys, um Schwachstellen zu identifizieren, deren Ausnutzbarkeit zu bewerten, die Schwere zu priorisieren und gezielte Patches vorzuschlagen.

Aardvark arbeitet, indem es Commits und Änderungen an Codebasen überwacht, Schwachstellen identifiziert, deren potenzielle Ausnutzung analysiert und Korrekturen vorschlägt. Aardvark verlässt sich nicht auf klassische Programmanalysetechniken wie Fuzzing oder Software-Kompositionsanalyse. Stattdessen nutzt es Reasoning und Tool-Einsatz, gestützt auf LLMs, um das Codeverhalten zu verstehen und Schwachstellen zu erkennen. Aardvark sucht nach Fehlern wie ein menschlicher Sicherheitsforscher, durch Lesen und Analysieren von Code, Schreiben und Ausführen von Tests, den Einsatz von Tools und mehr.

Diagramm mit dem Titel „AARDVARK: Vulnerability Discovery Agent Workflow“, das einen Prozessfluss vom Git-Repository über Threat Modeling, Schwachstellenerkennung, Validierungs-Sandbox und Patching mit Codex bis hin zur manuellen Überprüfung und dem anschließenden Pull Request zeigt.

Aardvark stützt sich auf eine mehrstufige Pipeline, um Schwachstellen zu identifizieren, zu erklären und zu beheben.

Analyse: Es beginnt mit der Analyse des gesamten Repositorys, um ein Threat Model zu erstellen, das sein Verständnis der Sicherheitsziele und des Designs des Projekts widerspiegelt.
Commit-Scanning: Es sucht nach Schwachstellen, indem es Commit-Änderungen im gesamten Repository und im Bedrohungsmodell überprüft, sobald neuer Code eingespielt wird. Wenn ein Repository zum ersten Mal verbunden wird, scannt Aardvark dessen Verlauf, um bestehende Probleme zu identifizieren. Aardvark erklärt die gefundenen Schwachstellen Schritt für Schritt und versieht den Code mit Anmerkungen zur manuellen Überprüfung.
Validierung: Sobald Aardvark eine potenzielle Schwachstelle identifiziert hat, versucht es, diese in einer isolierten, Sandbox-basierten Umgebung auszulösen, um ihre Ausnutzbarkeit zu bestätigen. Aardvark beschreibt die durchgeführten Schritte, um sicherzustellen, dass die Ergebnisse präzise, hochwertig und mit einer geringen Rate an Fehlalarmen an die Benutzer zurückgegeben werden.
Patching: Aardvark wird mit OpenAI Codex integriert, um die gefundenen Schwachstellen zu beheben. Es fügt jedem Befund einen von Codex generierten und von Aardvark geprüften Patch hinzu, für eine manuelle Überprüfung oder ein schnelles, effizientes „One-Click“-Patching.

Aardvark arbeitet mit Entwicklern zusammen, integriert sich in GitHub, Codex und bestehende Workflows, um klare, umsetzbare Erkenntnisse zu liefern, ohne die Entwicklung zu verlangsamen. Obwohl Aardvark für Sicherheit entwickelt wurde, haben unsere Tests gezeigt, dass es auch Fehler wie Logikfehler, unvollständige Korrekturen und Datenschutzprobleme aufdecken kann.

Echte Ergebnisse, schon heute

Aardvark ist seit mehreren Monaten im Einsatz und läuft kontinuierlich in den internen Codebasen von OpenAI sowie bei externen Alpha-Partnern. Innerhalb von OpenAI hat es bedeutende Schwachstellen aufgedeckt und zur Stärkung der Sicherheitslage von OpenAI beigetragen. Partner haben die Tiefe seiner Analysen hervorgehoben, da Aardvark Probleme erkennt, die nur unter komplexen Bedingungen auftreten.

In Benchmark-Tests mit „goldenen“ Repositories identifizierte Aardvark 92 % der bekannten und synthetisch eingeführten Schwachstellen, ein Beleg für hohe Erkennungsrate und reale Wirksamkeit.

Aardvark für Open Source

Aardvark wurde auch auf Open-Source-Projekte angewendet, wo es zahlreiche Schwachstellen entdeckt hat. Viele davon wurden verantwortungsvoll offengelegt, zehn erhielten sogar offizielle Common Vulnerabilities and Exposures (CVE)-Kennungen.

Als Nutznießer jahrzehntelanger offener Forschung und verantwortungsvoller Offenlegung fühlen wir uns verpflichtet, etwas zurückzugeben – durch Tools und Erkenntnisse, die das digitale Ökosystem für alle sicherer machen. Wir planen, ausgewählte nichtkommerzielle Open-Source-Repositorys pro bono zu scannen, um zur Sicherheit des Open-Source-Software-Ökosystems und der Lieferkette beizutragen.

Wir haben vor Kurzem unsere⁠ koordinierte Offenlegungsrichtlinie aktualisiert⁠, die einen entwicklerfreundlichen Ansatz verfolgt, mit Fokus auf Zusammenarbeit und skalierbare Wirkung statt auf starre Offenlegungsfristen, die Entwickler unter Druck setzen können. Wir gehen davon aus, dass Tools wie Aardvark zunehmend Fehler aufdecken werden, und wollen langfristig nachhaltig zusammenarbeiten, um Resilienz aufzubauen.

Warum das wichtig ist

Software ist heute das Rückgrat jeder Branche – was bedeutet, dass Software-Schwachstellen ein systemisches Risiko für Unternehmen, Infrastruktur und die Gesellschaft darstellen. Allein im Jahr 2024 wurden über 40.000 CVEs gemeldet. Unsere Tests zeigen, dass rund 1,2 % aller Commits Fehler einführen – kleine Änderungen, die große Auswirkungen haben können.

Aardvark steht für ein neues „Defender-First“-Modell: ein agentischer Sicherheitsforscher, der mit Teams zusammenarbeitet und kontinuierlichen Schutz bietet, während sich Code weiterentwickelt. Indem Aardvark Schwachstellen früh erkennt, reale Ausnutzbarkeit überprüft und klare Korrekturen anbietet, kann es die Sicherheit stärken, ohne Innovation zu bremsen. Wir glauben daran, den Zugang zu Sicherheitskompetenz zu erweitern. Wir starten mit einer privaten Beta und werden die Verfügbarkeit schrittweise ausweiten, während wir dazulernen.

Die private Beta ist jetzt geöffnet

Wir laden ausgewählte Partner ein, an der privaten Beta von Aardvark teilzunehmen. Teilnehmende erhalten frühzeitigen Zugang und arbeiten direkt mit unserem Team zusammen, um Erkennungsgenauigkeit, Validierungsabläufe und Reporting zu verfeinern.

Wir möchten die Leistung in verschiedenen Umgebungen validieren. Wenn deine Organisation oder dein Open-Source-Projekt Interesse an einer Teilnahme hat, kannst du dich hier bewerben⁠.