遏止惡意使用人工智慧:2025 年 10 月

載入中…
我們的使命是透過通用人工智慧為人類帶來福祉。我們透過推行能協助人們解決難題的創新成果,打造以常識性原則為基礎、能防止實際危害的民主化人工智慧,不斷推進這一使命。
自 2024 年 2 月開始公開威脅報告以來,我們已制止並通報超過 40 個違反使用政策的網路。其中包括防止威權政權利用人工智慧控制民眾或脅迫其他國家,以及防範詐騙、惡意網路活動和秘密影響他人行動等濫用情形。
本次更新中,我們將分享過去一季的案例研究,以及我們如何偵測和遏止模型惡意使用行為。我們觀察到,威脅行為者不斷將人工智慧套用到既有的手法中,加快了行動速度,而不是從我們的模型中獲得新的攻擊能力。當活動違反我們的政策時,我們會對相關帳戶採取封禁措施,並且在適當情況下與合作夥伴分享相關資訊。我們公開報告、執行政策並與同業合作,旨在提升大眾對濫用行為的認識,同時加強對一般使用者的保護。


