跳至主要内容
OpenAI

2025年10月27日

安全刊发

GPT‑5 系统卡增强版:敏感对话

正在加载…

在推出 GPT‑5 时,我们已在系统说明中指出,我们正致力于建立更完善的基准测试体系,并持续强化模型在心理与情绪困扰相关领域的安全性。10 月 3 日,我们部署了体现这些工作的更新(在新窗口中打开),优化了 ChatGPT 的默认模型,使其能更有效地识别并支持处于困境中的人们。为此我们联合 170 余位心理健康专家,使 ChatGPT 能更可靠地识别困境征兆、给予关怀回应并引导用户获取现实支持——相关不当回复率已降低 65% 至 80%。 

我们发布了相关博客文章,详细说明这项工作,并通过 GPT‑5 系统卡增强版分享基础安全评估报告。该评估对比了 ChatGPT 默认模型(即 GPT‑5 Instant)的 8 月 15 日版本(在新窗口中打开)与 10 月 3 日更新版本。