OpenAI o3 和 OpenAI o4-mini 模型综合了最先进的推理能力与完整的工具功能——网页浏览、Python、图像和文件分析、图像生成、画布、自动化、文件搜索以及记忆功能。这些模型在解决复杂的数学、编程和科学难题方面表现出色,同时还具备强大的视觉感知和分析能力。这些模型在思维链中运用工具来增强自身能力,例如,在思考过程中裁剪或转换图像、搜索网页,或者使用 Python 分析数据。
OpenAI 通过基于思维链的大规模强化学习来训练 o 系列模型。这些先进的推理能力为提升我们模型的安全性和鲁棒性开辟了新途径。特别是,我们的模型能够通过审慎对齐的方式,在应对潜在不安全的提示时,结合上下文对我们的安全政策进行推理。
这是我们“防范准备框架”第二版下发布的首个上线版本及系统卡。OpenAI 的安全咨询小组 (SAG) 审查了我们的防范准备情况评估结果,并确定 OpenAI o3 和 o4-mini 在我们的三个跟踪类别中均未达到高阈值:生化能力、网络安全和人工智能自我改进。我们将在下文详细介绍这些评估结果,并汇报我们在缓解这些领域风险方面的工作进展。
有关 o3 和 o4-mini 系统卡的增补内容:Codex,请点击此处阅读。
有关 o3 和 o4-mini 系统卡的增补内容:OpenAI o3 Operator,请点击此处阅读。