7 tháng 10, 2025

Ngăn chặn hành vi sử dụng AI cho mục đích độc hại: Tháng 10 năm 2025

Hình ảnh trừu tượng với các dải màu pastel mềm mại pha trộn giữa hồng, tím oải hương và xanh lam, tạo nên không gian nhẹ nhàng, thoáng đãng.

Đang tải…

Sứ mệnh của chúng tôi là bảo đảm trí tuệ nhân tạo tổng hợp sẽ mang lại lợi ích cho toàn nhân loại. Chúng tôi thúc đẩy sứ mệnh này bằng cách triển khai các sáng kiến đổi mới giúp con người giải quyết những vấn đề khó khăn và bằng cách xây dựng một hệ thống AI dân chủ, dựa trên các nguyên tắc lý lẽ thông thường giúp bảo vệ con người khỏi những tác hại thực tế.

Kể từ khi chúng tôi bắt đầu công bố các báo cáo về mối đe dọa vào tháng 02 năm 2024, chúng tôi đã ngăn chặn và báo cáo hơn 40 mạng lưới vi phạm chính sách sử dụng của chúng tôi. Điều này bao gồm ngăn chặn các hành vi sử dụng AI bởi các chế độ độc tài nhằm kiểm soát người dân hoặc ép buộc các quốc gia khác, cũng như các hình thức lạm dụng như lừa đảo, hoạt động mạng độc hại và các chiến dịch gây ảnh hưởng bí mật.

Trong bản cập nhật này, chúng tôi sẽ chia sẻ các trường hợp sử dụng trong quý vừa qua và cách chúng tôi phát hiện cũng như ngăn chặn việc sử dụng mô hình của chúng tôi cho các mục đích độc hại. Chúng tôi tiếp tục nhận thấy các tác nhân đe dọa ứng dụng AI vào các chiến thuật cũ để hành động nhanh hơn chứ không phải để tạo khả năng tấn công mới từ các mô hình của chúng tôi. Khi một hoạt động vi phạm chính sách của mình, chúng tôi sẽ chặn các tài khoản và, nếu phù hợp, sẽ chia sẻ thông tin với các đối tác. Việc công bố công khai, thực thi chính sách và hợp tác với các đơn vị cùng lĩnh vực là nhằm nâng cao nhận thức về hành vi lạm dụng, đồng thời tăng cường bảo vệ cho người dùng hàng ngày.

Read the full report(mở trong cửa sổ mới)

Tác giả

Ben Nimmo, Kimo Bumanglag, Michael Flossman, Nathaniel Hartley, Jack Stubbs, Albert Zhang

Hãy tiếp tục xem

Xem tất cả

Building AI infrastructure with the Effingham County community

Vấn đề toàn cầu22 thg 7, 2026

Advancing the next era of national science

Vấn đề toàn cầu22 thg 7, 2026

Helping build shared standards for advanced AI - card image

Hoa Kỳ đang thúc đẩy an toàn AI qua hành động cấp bang và liên bang

Vấn đề toàn cầu15 thg 7, 2026