2025年10月7日

遏止惡意使用人工智慧：2025 年 10 月

載入中…

我們的使命是透過通用人工智慧為人類帶來福祉。我們透過推行能協助人們解決難題的創新成果，打造以常識性原則為基礎、能防止實際危害的民主化人工智慧，不斷推進這一使命。

自 2024 年 2 月開始公開威脅報告以來，我們已制止並通報超過 40 個違反使用政策的網路。其中包括防止威權政權利用人工智慧控制民眾或脅迫其他國家，以及防範詐騙、惡意網路活動和秘密影響他人行動等濫用情形。

本次更新中，我們將分享過去一季的案例研究，以及我們如何偵測和遏止模型惡意使用行為。我們觀察到，威脅行為者不斷將人工智慧套用到既有的手法中，加快了行動速度，而不是從我們的模型中獲得新的攻擊能力。當活動違反我們的政策時，我們會對相關帳戶採取封禁措施，並且在適當情況下與合作夥伴分享相關資訊。我們公開報告、執行政策並與同業合作，旨在提升大眾對濫用行為的認識，同時加強對一般使用者的保護。

Read the full report(在新視窗中開啟)

作者

Ben Nimmo、Kimo Bumanglag、Michael Flossman、Nathaniel Hartley、Jack Stubbs和Albert Zhang

繼續閱讀

檢視全部

Building AI infrastructure with the Effingham County community

國際事務2026年7月22日

Advancing the next era of national science

國際事務2026年7月22日

Helping build shared standards for advanced AI - card image

美國正透過州與聯邦行動推進 AI 安全

國際事務2026年7月15日