跳至主要内容
OpenAI

2025年10月7日

全球事务

打击恶意使用 AI 的行为:2025 年 10 月

以柔和的粉色、薰衣草紫和蓝色渐变呈现的抽象图,流畅交融的色调营造出轻柔而通透的氛围。
正在加载…

我们的使命是确保通用人工智能造福全人类。我们推进这一使命的方式就是部署创新技术,让这些技术帮助人们解决棘手问题,同时构建基于常识规则的民主人工智能,以此保护人们免受实际伤害。

2024 年 2 月开始发布威胁报告以来,我们已打击并报告了 40 多个违反我们使用政策的网络。其中包括防止威权政权利用 AI 控制民众或胁迫他国,以及防范欺诈、恶意网络活动和秘密影响行动等滥用行为。

在本期报告中,我们分享了过去一个季度的案例研究,以及我们如何侦测和打击恶意使用模型的行为。我们观察到,威胁行为者继续将 AI 嫁接到旧有攻击脚本上以加快行动速度,而不是利用我们的模型获取新型攻击能力。如果发现违反政策的活动,我们就会封禁相关帐户,并视需要与合作伙伴共享相关洞察。通过公开报告、政策执行和同行协作,我们致力于提高公众对滥用行为的认知,同时加大对普通用户的保护力度。

作者

Ben Nimmo、Kimo Bumanglag、Michael Flossman、Nathaniel Hartley、Jack Stubbs、Albert Zhang