Zum Hauptinhalt springen
OpenAI

17. Juli 2025

Bug-Bounty für Agenten-Bios

Teste universelle Jailbreaks auf Bio-Risiken im ChatGPT‑Agenten

Einladung

Im Rahmen unserer laufenden Bestrebungen, unsere Schutzmaßnahmen für fortschrittliche KI-Fähigkeiten in der Biologie zu verstärken, nehmen wir jetzt Bewerbungen für unsere Bio-Bug-Bounty entgegen. Wir haben das ChatGPT‑Agentenmodell eingeführt und arbeiten aktiv daran, die Sicherheitsmaßnahmen für den ChatGPT‑Agent und andere Modelle weiter zu verstärken. Wir laden Forschende mit Erfahrung in AI-Red-Teaming, Sicherheit sowie chemischen und biologischen Risiken ein, einen universellen Jailbreak zu finden, der unsere zehnstufige Bio-/Chemie-Herausforderung überwinden kann.

Programmübersicht

  • Betroffenes Modell: Nur ChatGPT‑Agent.
  • Herausforderung: Identifiziere einen universellen Jailbreak-Prompt, um alle zehn Bio-/Chemie-Sicherheitsfragen aus einem sauberen Chat zu beantworten.
  • Belohnungen:
    • 25.000 US-Dollar für den ersten echten universellen Jailbreak, der alle zehn Fragen löst.
    • 10.000 US-Dollar für das erste Team, das alle zehn Fragen mit mehreren Jailbreak-Prompts beantwortet.
    • Kleinere Belohnungen können nach unserem Ermessen für Teilerfolge vergeben werden.
  • Zeitplan: Bewerbungen sind ab dem 17. Juli 2025 möglich. Die Annahmen erfolgen fortlaufend. Die Testphase beginnt am 29. Juli 2025.
  • Zugriff: Nur mit Bewerbung und auf Einladung. Wir laden eine geprüfte Liste vertrauenswürdiger Bio-Red-Teamer ein und prüfen neue Bewerbungen. Ausgewählte Teilnehmende werden in die Bio-Bug-Bounty-Plattform aufgenommen.
  • Offenlegung: Alle Prompts, Antworten, Ergebnisse und Kommunikationen unterliegen einer Vertraulichkeitsvereinbarung (NDA).

So bewirbst du dich

Reiche bis zum 29. Juli 2025 hier(wird in einem neuen Fenster geöffnet) eine kurze Bewerbung ein (Name, Zugehörigkeit, kurzer Werdegang und ein 150 Wörter umfassender Plan). Akzeptierte Bewerber und Mitarbeitende müssen über ein bestehendes ChatGPT‑Konto verfügen und eine Vertraulichkeitsvereinbarung (NDA) unterzeichnen.

Bewirb dich jetzt und hilf uns, Frontier-KI sicherer zu machen.

Bewirb dich für das OpenAI Bio-Bug-Bounty-Programm

Autor

OpenAI