跳到主要內容
OpenAI

2025年7月17日

智能代理生物漏洞賞金

透過通用越獄攻擊測試 ChatGPT 智能代理的生物風險

邀請

為了持續加強對先進 AI 在生物學能力方面的安全措施,我們的生物漏洞賞金現正公開接受申請。我們部署了 ChatGPT 代理程式模型,並致力進一步提升 ChatGPT 代理程式與其他模型的安全保障。我們誠邀擁有 AI 紅隊測試、系統防護或化學及生物風險經驗的研究人員參與測試,嘗試找出能撃破我們十級生物/化學挑戰的通用越獄攻擊。

計劃概述

  • 測試模型:僅限 ChatGPT 智能代理。
  • 挑戰:找出一個通用越獄提示,藉此在沒有歷史記錄的聊天對話中成功回答十個‍生物/化學安全機制問題。
  • 獎賞:
    • 首位真正能透過通用越獄提示通過全部十個問題的挑戰者可獲 25,000 美元。
    • 首隊能以多個通用越獄提示回答全部十個問題的隊伍可獲 10,000 美元。
    • 對於達至部分要求的挑戰者,我們可能會自行決定頒發較少的獎賞。
  • 時間:2025 年 7 月 17 日開始接受申請(持續審核參與資格)。測試於 2025 年 7 月 29 日開始。
  • 參與資格:透過申請及只限邀請。我們會向經過審查的可信生物紅隊測試人員發出邀請,同時會審核新申請。一經遴選,成功申請人將加入生物漏洞賞金平台,並展開使用流程。
  • 披露內容:所有提示、完成項目、測試結果和通訊均受保密協議約束。

申請方式

於 2025 年 7 月 29 日前在此(在新視窗中開啟)提交簡短申請(姓名、隸屬組織、簡短往績紀錄,及 150 字計劃)。成功申請人和合作者必須擁有現有的 ChatGPT 帳戶才能申請,並將簽署保密協議。

立即申請,幫助我們提升尖端 AI 的安全。

申請參加 OpenAI 生物漏洞賞金計劃

作者

OpenAI