Gå direkt till huvudinnehåll
OpenAI

17 juli 2025

Buggjaktsprogram för biologiska agenter

Test av universella jailbreaks för biologiska risker i ChatGPT Agent

Inbjudan

Som en del av de pågående ansträngningar att stärka våra skyddsåtgärder för avancerade AI-funktioner inom biologi är vårt buggjaktsprogram för biologiska agenter nu öppet för ansökningar. Vi har implementerat en agentmodell för ChatGPT och arbetar aktivt med att ytterligare stärka säkerhetsskyddet för den och andra modeller. Vi bjuder in forskare med erfarenhet av red teaming för AI, säkerhet eller kemiska och biologiska risker att försöka hitta en universell jailbreak som kan klara vår utmaning på tio nivåer inom biologi/kemi.

Programöversikt

  • Modeller som omfattas: Endast ChatGPT:s agent.
  • Utmaning: Identifiera en universell jailbreaking-prompt som kan svara på tio säkerhetsfrågor om biologi/kemi från en ren chatt.
  • Belöningar:
    • 25 000 dollar till den första universella jailbreak som besvarar de tio frågorna.
    • 10 000 dollar till det första teamet som besvarar alla tio frågorna med flera jailbreak-prompter.
    • Mindre utmärkelser kan tilldelas för delvinster (efter vårt gottfinnande).
  • Timeline: Ansökningar tas emot löpande från den 17 juli 2025. Testningen börjar den 29 juli 2025.
  • Åtkomst: Ansökan och endast per inbjudan. Vi kommer att skicka inbjudan till ett utvalt antal biologiska red teaming-medlemmar och granska nya ansökningar. När processen är klar kommer valda ansökande att registreras på plattformen för buggjaktsprogrammet.
  • Sekretessavtal: Alla promptar, slutfört arbete, resultat och kommunikation omfattas av sekretessavtalet.

Så här ansöker du

Skicka in en kortfattad ansökan här(öppnas i ett nytt fönster) (namn, samarbeten, kortfattad meritlista och en plan på 150 ord) senast den 29 juli 2025. Ansökande och samarbetspartner som antas måste ha befintliga ChatGPT‑konton och behöver skriva på ett sekretessavtal.

Ansök nu och hjälp oss att göra banbrytande AI säkrare.

Ansök till OpenAI:s buggjaktsprogram

Författare

OpenAI