2025年7月17日

智能代理生物漏洞賞金

透過通用越獄攻擊測試 ChatGPT 智能代理的生物風險

邀請

為了持續加強對先進 AI 在生物學能力方面的安全措施，我們的生物漏洞賞金現正公開接受申請。我們部署了 ChatGPT 代理程式模型，並致力進一步提升 ChatGPT 代理程式與其他模型的安全保障。我們誠邀擁有 AI 紅隊測試、系統防護或化學及生物風險經驗的研究人員參與測試，嘗試找出能撃破我們十級生物/化學挑戰的通用越獄攻擊。

計劃概述

測試模型：僅限 ChatGPT 智能代理。
挑戰：找出一個通用越獄提示，藉此在沒有歷史記錄的聊天對話中成功回答十個‍生物/化學安全機制問題。
獎賞：
• 首位真正能透過通用越獄提示通過全部十個問題的挑戰者可獲 25,000 美元。
• 首隊能以多個通用越獄提示回答全部十個問題的隊伍可獲 10,000 美元。
• 對於達至部分要求的挑戰者，我們可能會自行決定頒發較少的獎賞。
時間：2025 年 7 月 17 日開始接受申請（持續審核參與資格）。測試於 2025 年 7 月 29 日開始。
參與資格：透過申請及只限邀請。我們會向經過審查的可信生物紅隊測試人員發出邀請，同時會審核新申請。一經遴選，成功申請人將加入生物漏洞賞金平台，並展開使用流程。
披露內容：所有提示、完成項目、測試結果和通訊均受保密協議約束。