跳至主要内容
OpenAI

Published: 2026年5月6日

OpenAI B2B Signals

前沿竞争优势正步入复利增长期。

今天,我们正式推出 B2B Signals,它是 OpenAI Signals 在商业领域的延伸,旨在衡量 AI 在各组织的普及进程。早期信号已十分明确:前沿企业之所以脱颖而出,不仅是因为他们能够使用 AI,更在于他们已经将 AI 深度融入到各项工作之中。

B2B Signals 是一套周期性的衡量指标,其核心基于对企业级 AI 使用情况的大规模、隐私保护型分析。通过对行为模式的持续追踪,B2B Signals 旨在协助各类机构深入洞察如何将人工智能转化为实际的商业价值。

前沿 (frontier) 企业,即 AI 使用排名位于前 5% (P95) 的企业,展现出更高的人均智能使用率。这些企业不仅更密集地采用尖端工具,还将 AI 嵌入业务流程之中。对于部分企业而言,这种领先优势正产生复利效应,而竞争差距也日益体现为使用深度的不同。

核心要点

  • 前沿优势正产生复利效应:前沿企业的人均智能使用量已达普通企业的 3.5 倍,较一年前的 2 倍进一步拉大。
  • 前沿企业应用更深,而非仅是频率更高:消息量仅能解释前沿企业与普通企业之间 36% 的差距,绝大部分优势源于更深层次的应用。
  • 智能体工作流正成为前沿应用的标志:这种差距在高级智能体工具上最为显著,前沿企业发送的 Codex 消息量是普通企业的 16 倍。
  • 组织可通过变革缩小差距:为了迎头赶上,企业需要衡量应用深度、优先构建治理系统、加大培训与支持体系的投入、大规模推广成功案例,并实现从“对话式辅助”向“智能体任务委派”的转型。

深度

前沿优势正步入复利增长期,AI 应用最深入的企业正在扩大领先优势

对于企业而言,席位部署仅仅是起点。更清晰的指标在于员工是否正利用 AI 处理更深层次、更复杂的任务。本图表对比了前沿企业(定义为 P95 级别)与普通企业(定义为 P50 中位水平)的人均 Token 生成量。

虽然 Token 并非衡量商业价值的完美指标:简短的回答可能非常有价值,而冗长的回复可能价值不高。但 Token 生成量有助于衡量员工要求 AI 执行的任务负载,它是反映 AI 应用深度以及员工对“智能”需求量的替代指标。

前沿企业的人均智能需求量是普通企业的 3.5 倍。这一差距已从 2025 年 4 月的 2 倍进一步拉大,表明深度应用 AI 的企业正在扩大领先优势,并能更从容地将 AI 的新能力转化为更深层次、更复杂的业务产出。

前沿优势主要源于应用深度,而非更高的消息量

前沿企业的人均智能需求显著高于普通企业,但这种差距绝非单纯的消息量所能解释。本图表对 3.5 倍的前沿优势进行了拆解:即便普通企业保持与前沿企业相同的消息发送频率,也只能弥补这 3.5 倍差距中的 36%。

剩下的差距则与应用深度相关。前沿企业的员工正要求 AI 承担更复杂的工作,并为模型提供更丰富的业务背景信息,从而产出更具实质性的成果。

广度

前沿优势在高级工具与智能体工具中最为显著,其中 Codex 使用量高出 16 倍

前沿优势在支持高级工作流的工具上表现最为突出。在 Codex 上的差异最为巨大,前沿企业的人均消息发送量高达 16 倍。在 ChatGPT 智能体、ChatGPT 内的应用程序、深度研究 (Deep Research) 以及 GPT 上也展现出较大的差距。这表明前沿企业更擅长利用工具来辅助编程、委派多步任务、融合公司私有知识并开展复杂的调研工作。

相比之下,更通用且易于上手的工具(如用户上传、搜索和数据分析)所展现的前沿优势较小。这些工具对大多数企业来说更易使用,因为它们是对既有工作流的延伸。前沿优势在高级工具与智能体工具中最为显著,因为这些工具的采用需要更强的专业能力、与工作空间知识及工具的更深入联动,以及将任务交由 AI 处理的决策意愿。

前沿企业最显著的优势体现在教育与学习方面

在教育与学习类任务中,前沿优势最为突出:前沿企业在此类任务中的消息发送量是普通企业的 7 倍。前沿企业利用 AI 帮助员工培养技能并学习新课题。他们还利用 AI 来深化对人工智能的理解,包括其功能边界、如何高效使用,以及如何将其融入既有的工作流。这一差距的规模表明,普通企业在将 AI 作为员工学习与发展工具方面,可能存在利用不足的情况。

编程方面同样展现出 4 倍的显著差距,这与高级工具及智能体工具使用上的整体差距相一致。“操作指南”以及“写作与沟通”类任务的前沿差距最小,这可能是因为此类任务是更易上手、更为人熟知的 AI 用途。

消除“能力积压 (capability overhang)”需要的是培训与支持体系,而非仅仅是准入。OpenAI 的企业资源OpenAI Academy 提供了实用指南、培训教材及部署资源,助力团队更自信地应用 AI。

AI 应用在写作领域最为广泛,但特定职能的应用正在增长

写作与沟通仍是 ChatGPT 最常见的使用场景。然而,不同职能的使用模式存在显著差异。IT 与安全团队 60% 的消息集中在操作手册与规程指引;软件开发及数据科学与工程团队近一半的消息与编程相关;而财务团队有十分之一的消息涉及分析与计算。

这些模式与更广泛的证据相一致,即前沿模型正在有效提升具有经济价值的职能任务。GDPval 是一项针对 44 种职业的真实知识型工作评估,旨在衡量模型在产出实际工作成果(如文档、电子表格、幻灯片、图表和多媒体)时的表现。随着 AI 能力的增强,企业级应用正延伸至与各职能核心职责结合更紧密的任务中。

基于业务语境的任务类型

基于业务语境的任务类型
业务语境
ChatGPT 任务
写作与沟通
操作手册与规程指引
信息获取
分析与计算
建议
创意媒体
商务
编程
教育与学习
消息占比
较上一周期的增长较低较高
最高增长各业务语境下增长最快的任务

覆盖范围

行业领先地位并非单一维度:不同领域在 ChatGPT、Codex 及 API 方面占据领先地位

AI 的应用路径并非千篇一律,不存在单一的“领跑榜单”。行业排名因衡量指标而异。专业、科学及技术服务业在 Codex 采用率和 API 调用强度上均排名第一,表明其在开发者及产品集成工作流中拥有更先进的应用。金融与保险业凭借大规模的部署在 ChatGPT 应用上领先;而教育服务业的消息密度最高,意味着人均应用更深入。零售贸易与医疗保健行业在 API 调用强度上排名很高,尽管在其他指标上排名较低。

这些差异表明,行业的领先地位是多维度的。一些行业正通过技术和开发工作流接轨 AI,而另一些行业则通过广泛的 ChatGPT 普及或更密集的终端用户使用来实现规模化。

基于 AI 采用指标的行业排名

基于 AI 采用指标的行业排名
行业
金融与保险
1+1
10-4
30
60
信息获取
2-1
20
20
4-1
专业、科学与技术服务
30
10
10
10
艺术、娱乐与休闲
40
4-1
50
3+1
公用事业
50
80
90
90
建筑
6-1
50
10-1
10-1
房地产及租赁业
7-1
7+1
11-1
80
制造业
8-1
3+1
40
70
医疗保健与社会援助
90
90
6+1
50
零售贸易
10-2
11-1
7-1
20
公共行政
11-1
6+1
80
11-1

企业正将 API 应用推向生产级工作流与面向客户的应用场景

公司正越来越多地利用 API 将模型直接集成到产品、服务及内部系统中。常见的生产级用例包括:应用内助手、编程与开发工具、客户支持、调研工作流以及工作流自动化。

这些部署案例表明,企业级 AI 正在跨越实验阶段,进入具有可衡量运营影响的可复用工作流。在各类客户案例中,企业正利用 OpenAI 模型来加速知识型工作、提升工程吞吐量,并为客户和员工打造 AI 驱动的交互体验。

各行业的热门 API 用例

公文包图标

专业服务

  • 知识助手与搜索(如问答工具、研究助手、内部知识助手)

  • 客户与销售支持(如客户支持、语音及聊天智能体、销售辅助)

  • 数据分析、总结与提取(如公司数据分析、市场情报、交易标注与对账)

  • 编程与开发者工具(如模型评估工具、编程助手、工作流自动化工具)

财务图标

金融与保险

  • 数据分析、总结与提取(如数据提取、票据与费用分析、投资研究)

  • 文档与工作流生成(如自动化费用管理、研究摘要生成、工作流优化)

  • 知识助手与搜索(如投资策略助手、政策搜索、特定职能助手)

  • 客户与服务支持(如语音及聊天客服智能体、个人银行助手、情绪分类)

实时状态图标

信息获取

  • 编程与开发者工具(如编程助手、软件测试工具、网页自动化工具)

  • 知识助手与搜索(如产品内嵌入助手、内部搜索工具、文档助手)

  • 客户和服务支持(如语音及聊天客服智能体、多渠道客户服务自动化)

  • 内容、媒体与设计生成(如品牌素材生成、营销工具)

  • Cisco 利用 Codex 在大型企业工程组织中加速复杂的软件开发。在生产工作流中,Codex 将构建时间缩短了约 20%,每月节省超过 1500 小时的工程时间,并将缺陷修复的吞吐量提升了 10 至 15 倍。正如 Cisco 团队所言,最大的收益源于将 Codex 视为“团队的一员”。

  • Rakuten 在工程运营与软件交付中部署了 Codex,将平均故障恢复时间 (MTTR) 缩短了约 50%,使团队解决生产问题的速度翻倍。Rakuten 还利用 Codex 根据内部标准进行自动代码审查和漏洞检查,在不牺牲安全性的前提下加速版本发布。在复杂项目中,Codex 能够将部分需求转化为可运行的全栈实现,将交付周期从季度缩短至数周。

  • Balyasny Asset Management 利用 OpenAI 在大型专业知识型组织中加速投资研究。其专有的 AI 研究平台已被约 95% 的投资团队使用,将原本耗时数天的研究流程缩短至数小时。例如,以前需要两天的央行演讲分析流程,现在仅需约 30 分钟,帮助分析师在申报文件、会议纪要、研究报告和市场数据之间更快地进行推理。

访问我们的客户案例页面了解更多实例。

组织如何迈向前沿

OpenAI 与各行业、各职能以及处于不同 AI 成熟度阶段的企业均有合作,这让我们得以洞察 AI 应用如何从“实验阶段”演进到“生产阶段”。在这些部署案例中,进展最快的公司往往不再仅仅关注“准入”,而是更多地关注深度应用 AI 所需的组织系统,即衡量、治理、培训与支持体系、扩大影响力,以及智能体部署等体系。

以下五项实践是组织从今天起即可采取的务实步骤,可有效深化 AI 应用:

  1. 除了衡量访问情况外,还要衡量使用深度。
    相关的指标不仅是多少员工拥有 AI 帐户,还包括团队随着时间的推移,是否在更实质性地使用 AI。组织应追踪 AI 的使用是否变得更频繁、更复杂,并与高价值的工作流结合得更紧密。
  2. 构建支持生产级应用的治理体系。
    领先企业并非在回避治理,而是利用治理让智能体 AI 更具可部署性。企业需要明确规则:智能体可以在哪里运行、可以使用哪些信息、何时应仅提供建议而非直接行动,以及人类如何审核高风险决策。前沿企业正在将这些标准定义为部署流程的一部分,使治理成为安全扩大应用规模的加速器,而非阻碍物。
  3. 将培训与支持体系视为核心基础设施,而非边缘项目。
    随着 AI 能力的提升,员工与组织都需要相应的体系来跟上步伐。前沿企业不将培训与支持体系视为一次性的培训冲刺,而是通过针对特定职能的培训、用例研讨会、黑客松、内部先锋骨干网络、专项实验时间以及工作流/最佳实践/技能的共享库,将持续学习植入部署过程。
  4. 识别内部的前沿团队并扩大其影响力。
    在许多组织中,最先进的应用往往集中在少数团队中。这些团队可以揭示哪些工作流、习惯和运营模式是行之有效的。管理者应识别这些团队,理解并复制其成功背后的条件,并帮助他们向公司其他部门分享深度应用 AI 的洞察与案例。
  5. 实现从“对话”到“任务委派”的跨越。
    企业级 AI 正在从“聊天助手”转向“可委派给智能体的工作”。软件工程领域印证了这一趋势,但任务委派正在向各职能部门扩散。借助 Codex,工程师可以将明确定义的任务交给智能体,提供必要的上下文,让其跨文件、跨代码库和工具运行,随后审核结果并根据反馈优化工作流。前沿企业正鼓励员工向 AI 委派任务,而非仅仅将其视为静态助手。

本报告的所有分析均基于去标识化的聚合企业使用数据。消息内容由自动化系统进行分类,在分析过程中,任何 OpenAI 员工均未审查过任何企业、商业或 API 客户的个体数据。

如果你希望获取完整报告,或了解如何以负责任的方式在组织中引入 AI,[欢迎与我们联系⁠]。

探索更多内容

Signals > Layout > Group > Footer > Cards > Signals homepage > Media > Asset
Signals > Layout > Group > Footer > Cards > Data lab > Media > Asset
Signals > Layout > Group > Footer > Cards > Research and analysis > Media > Asset

研究与分析

围绕 AI 采用情况及其经济和社会影响的研究与分析。