跳至主要内容
OpenAI

GPT‑5 是一个统一系统,包含一个智能且快速的模型,能够回答大多数问题;一个更深入的推理模型,用于解决更复杂的问题;以及一个实时路由器,能够根据对话类型、复杂度、工具需求和明确意图(例如,在提示中说“仔细想想这个问题”)快速决定使用哪个模型。路由器会持续基于真实信号进行训练,包括用户切换模型、对回复的偏好率以及测量准确性,并随着时间的推移不断优化。当达到使用限制时,每个模型的精简版本将处理剩余的查询。在不久的将来,我们计划将这些功能整合到一个单一模型中。

在此系统卡中,我们将快速、高吞吐量的模型标记为 gpt-5-main 和 gpt-5-main-mini,将思考型模型标记为 gpt-5-thinking 和 gpt-5-thinking-mini。在 API 中,我们提供对思考型模型、其迷你版本以及专为开发人员设计的更小、更快的纳米版本 (gpt-5-thinking-nano) 的直接访问权限。在 ChatGPT 中,我们还通过一种利用并行测试时间计算的设置,提供了对 gpt-5-thinking 的访问;我们将其称为 gpt-5-thinking-pro。

将 GPT‑5 模型视为前代模型的继任者可能有所帮助:

前代模型

GPT‑5 模型

GPT‑4o

gpt-5-main

GPT‑4o‑mini

gpt-5-main-mini

OpenAI o3

gpt-5-thinking

OpenAI o4-mini

gpt-5-thinking-mini

GPT‑4.1‑nano

gpt-5-thinking-nano

OpenAI o3 Pro

gpt-5-thinking-pro

本系统卡主要关注 gpt-5-thinking 和 gpt-5-main,而其他模型的评估结果可在附录中查阅。GPT‑5 不仅在基准测试中表现优于前代模型,回答问题也更快,但最重要的是,它在处理现实世界查询时更加实用。我们在减少幻觉、提升指令遵循能力以及减少阿谀奉承方面取得了显著进展,同时在 ChatGPT 最常见的三个应用场景中提升了 GPT‑5 的性能:写作、编程和医疗保健。所有 GPT‑5 模型均新增了安全完成功能,这是我们最新的安全训练方法,旨在防止生成违规内容。

与 ChatGPT 智能体类似,我们决定将 gpt-5-thinking 在生物和化学领域归类为“高能力”,并根据我们的《防范准备框架》激活相关安全措施。尽管我们没有确凿证据表明该模型能实质性帮助新手造成严重生物危害——我们定义的高能力阈值(在新窗口中打开)——但我们选择采取预防性措施。

作者

OpenAI