2025年10月7日

打击恶意使用 AI 的行为：2025 年 10 月

以柔和的粉色、薰衣草紫和蓝色渐变呈现的抽象图，流畅交融的色调营造出轻柔而通透的氛围。

正在加载…

我们的使命是确保通用人工智能造福全人类。我们推进这一使命的方式就是部署创新技术，让这些技术帮助人们解决棘手问题，同时构建基于常识规则的民主人工智能，以此保护人们免受实际伤害。

自 2024 年 2 月开始发布威胁报告以来，我们已打击并报告了 40 多个违反我们使用政策的网络。其中包括防止威权政权利用 AI 控制民众或胁迫他国，以及防范欺诈、恶意网络活动和秘密影响行动等滥用行为。

在本期报告中，我们分享了过去一个季度的案例研究，以及我们如何侦测和打击恶意使用模型的行为。我们观察到，威胁行为者继续将 AI 嫁接到旧有攻击脚本上以加快行动速度，而不是利用我们的模型获取新型攻击能力。如果发现违反政策的活动，我们就会封禁相关帐户，并视需要与合作伙伴共享相关洞察。通过公开报告、政策执行和同行协作，我们致力于提高公众对滥用行为的认知，同时加大对普通用户的保护力度。

Read the full report（在新窗口中打开）

作者

Ben Nimmo、Kimo Bumanglag、Michael Flossman、Nathaniel Hartley、Jack Stubbs、Albert Zhang

继续阅读

查看全部

Building AI infrastructure with the Effingham County community

全球事务2026年7月22日

Advancing the next era of national science

全球事务2026年7月22日

Helping build shared standards for advanced AI - card image

美国正通过州和联邦行动推进 AI 安全

全球事务2026年7月15日