25 tháng 3, 2026

Giới thiệu chương trình săn lỗi nhận thưởng của OpenAI

Kiểm tra các vấn đề về an toàn và lạm dụng trên OpenAI

Hôm nay, OpenAI ra mắt Chương trình Săn lỗi bảo mật công khai⁠(mở trong cửa sổ mới) tập trung vào việc xác định hành vi lạm dụng AI và các rủi ro an toàn trên các sản phẩm của chúng tôi. Khi công nghệ trí tuệ nhân tạo phát triển nhanh chóng, thì các cách thức lạm dụng tiềm tàng của nó cũng ngày càng đa dạng. Mục tiêu của chúng tôi là đảm bảo hệ thống của chúng tôi luôn an toàn và bảo mật trước những hành vi lạm dụng có thể dẫn đến thiệt hại hữu hình.

Chương trình mới này sẽ bổ sung cho Chương trình Săn tìm lỗi bảo mật⁠(mở trong cửa sổ mới) của OpenAI bằng cách tiếp nhận các vấn đề gây ra rủi ro đáng kể về lạm dụng và an toàn, ngay cả khi chúng không đáp ứng các tiêu chí của một lỗ hổng bảo mật. Thông qua chương trình này, chúng tôi mong muốn tiếp tục hợp tác với các nhà nghiên cứu về an toàn và bảo mật để giúp chúng tôi xác định và giải quyết các vấn đề nằm ngoài phạm vi các lỗ hổng bảo mật thông thường nhưng vẫn tiềm ẩn những rủi ro thực sự. Các nội dung gửi đến sẽ được các nhóm Săn tìm lỗi bảo mật về An toàn và An ninh của OpenAI phân loại, và có thể được chuyển giữa hai chương trình tùy theo phạm vi và đơn vị phụ trách.

Tổng quan về chương trình

Chương trình Săn lỗi nhận thưởng an toàn⁠(mở trong cửa sổ mới) mới tập trung vào các tình huống an toàn dành riêng cho AI được liệt kê bên dưới:

Rủi ro về tính tác nhân, bao gồm MCP

Chèn câu lệnh của bên thứ ba và rò rỉ dữ liệu: khi văn bản của kẻ tấn công có thể chiếm quyền điều khiển một cách ổn định tác nhân của nạn nhân (bao gồm Browser, ChatGPT Agent và các sản phẩm dạng tác nhân tương tự) để lừa tác nhân đó thực hiện một hành động gây hại hoặc làm lộ thông tin nhạy cảm của người dùng. Hành vi này phải có thể được tái hiện ít nhất 50% số lần.
Một sản phẩm OpenAI đại lý thực hiện một hành động không được phép trên trang web của OpenAI trên quy mô lớn.
Một sản phẩm AI tác nhân của OpenAI thực hiện một hành động có khả năng gây hại mà không được liệt kê ở trên. Các báo cáo hợp lệ ở đây phải chỉ ra tác hại hợp lý và đáng kể.
Bất kỳ thử nghiệm nào về rủi ro MCP phải tuân thủ các điều khoản dịch vụ của bất kỳ bên thứ ba nào.

Thông tin độc quyền của OpenAI

Các đầu ra của mô hình trả về thông tin độc quyền liên quan đến suy luận.
Các lỗ hổng làm lộ thông tin độc quyền OpenAI khác.

Tính toàn vẹn của tài khoản và của nền tảng

Các lỗ hổng trong tính toàn vẹn tài khoản và tín hiệu toàn vẹn nền tảng, chẳng hạn như bỏ qua các kiểm soát chống tự động hóa, thao túng tín hiệu tin cậy của tài khoản, trốn tránh các hạn chế tài khoản/tạm ngừng/cấm tài khoản và các vấn đề tương tự.
Các vấn đề cho phép người dùng truy cập vào các tính năng, dữ liệu hoặc chức năng vượt quá quyền được cấp phép nên được báo cáo tới Chương trình Săn tìm lỗi bảo mật⁠(mở trong cửa sổ mới).

Mặc dù các phương thức bẻ khóa không thuộc phạm vi của chương trình này, chúng tôi định kỳ triển khai các chiến dịch săn thưởng lỗi riêng tư tập trung vào một số loại tác hại nhất định, chẳng hạn như các vấn đề về nội dung rủi ro sinh học trong ChatGPT Agent⁠ và GPT‑5⁠. Chúng tôi mời các nhà nghiên cứu quan tâm đăng ký tham gia các chương trình này khi chúng được triển khai.

Ngoài các danh mục đã nêu ở trên, nếu các nhà nghiên cứu xác định được những lỗ hổng tạo điều kiện trực tiếp gây hại cho người dùng và các bước khắc phục cụ thể, có thể thực hiện được, thì những trường hợp này có thể được xem xét để trao thưởng dựa trên từng trường hợp cụ thể. Các hành vi lách luật nội dung nói chung mà không gây ảnh hưởng rõ rệt đến an toàn hoặc khả năng lạm dụng đều nằm ngoài phạm vi của chương trình này. Ví dụ: các trường hợp “bẻ khóa” khiến mô hình sử dụng ngôn từ thô lỗ hoặc trả về thông tin có thể dễ dàng tìm thấy qua các công cụ tìm kiếm là không thuộc phạm vi xem xét.

Cách tham gia

Các nhà nghiên cứu quan tâm đến việc tham gia có thể đăng ký thông qua Chương trình Săn lỗi an toàn⁠(mở trong cửa sổ mới) của chúng tôi. Chúng tôi mong muốn được làm việc cùng với các nhà nghiên cứu, tin tặc có đạo đức và cộng đồng an toàn và bảo mật trong việc theo đuổi một hệ sinh thái AI an toàn.

2026

Tác giả

OpenAI

Hãy tiếp tục xem

Xem tất cả

Safety and alignment in an era of long-horizon models

An toàn20 thg 7, 2026

Why teens deserve access to safe AI — card image

Vì sao thanh thiếu niên cần được tiếp cận AI an toàn

An toàn16 thg 7, 2026

GPT-Red: Mở khóa tự cải thiện để tăng độ vững chắc

An toàn15 thg 7, 2026