17 tháng 7, 2025

Tìm lỗi sinh học tác nhân

Kiếm thử các phương thức bẻ khóa phổ quát liên quan đến rủi ro sinh học ở Tác nhân ChatGPT

Thư mời

Nhằm tiếp tục tăng cường các cơ chế bảo vệ cho năng lực AI tiên tiến trong lĩnh vực sinh học, chúng tôi chính thức mở đăng ký tham gia chương trình săn thưởng lỗi sinh học. Chúng tôi đã triển khai mô hình tác nhân ChatGPT và đang tích cực củng cố thêm các biện pháp bảo vệ an toàn cho tác nhân ChatGPT cũng như các mô hình khác. Chúng tôi mời gọi các nhà nghiên cứu có kinh nghiệm trong lĩnh vực mô phỏng tấn công AI, an ninh hoặc rủi ro hóa học và sinh học tham gia tìm kiếm một phương thức bẻ khóa phổ quát có thể vượt qua thử thách mười cấp độ về sinh học và hóa học của chúng tôi.

Tổng quan về chương trình

Mô hình trong phạm vi: Chỉ tác nhân ChatGPT.
Thử thách: Xác định một lời nhắc bẻ khóa phổ quát có thể trả lời thành công cả mười câu hỏi an toàn sinh học/hóa học từ một phiên trò chuyện sạch.
Phần thưởng:
• $25.000 cho bản bẻ khóa phổ quát thực sự đầu tiên vượt qua được tất cả mười câu hỏi.
• $10.000 cho đội đầu tiên trả lời được tất cả mười câu hỏi bằng nhiều lời nhắc bẻ khóa.
• Các giải thưởng nhỏ hơn có thể được trao cho những chiến thắng đáp ứng một phần yêu cầu tùy theo quyết định của chúng tôi.
Lịch trình: Đơn đăng ký tham gia bắt đầu mở từ ngày 17 tháng 7 năm 2025 và được xét duyệt cuốn chiếu. Kiểm thử bắt đầu từ ngày 29 tháng 7 năm 2025.
Truy cập: Đơn đăng ký và chỉ thư mời. Chúng tôi sẽ gửi thêm thư mời đến một danh sách đã kiểm duyệt gồm các chuyên gia mô phỏng tấn công về sinh học đáng tin cậy và xét duyệt các đơn đăng ký mới. Sau khi được chọn, các ứng viên thành công sẽ được đưa vào nền tảng săn thưởng tìm lỗi sinh học.
Tiết lộ thông tin: Tất cả các lời nhắc, bản hoàn thiện, phát hiện và thông tin trao đổi đều theo quy định của NDA.

Cách nộp đơn đăng ký

Gửi một đơn đăng ký ngắn ở đây⁠(mở trong cửa sổ mới) (họ tên, liên kết, hồ sơ theo dõi ngắn gọn và kế hoạch 150 từ) chậm nhất vào ngày 29 tháng 7 năm 2025. Ứng viên và cộng tác viên được chấp nhận phải có tài khoản ChatGPT còn tồn tại để nộp đơn đăng ký và sẽ ký kết NDA.

Hãy nộp đơn ngay và giúp chúng tôi làm cho AI tối tân an toàn hơn.