OpenAI B2B Signals
前沿竞争优势正步入复利增长期。
今天,我们正式推出 B2B Signals,它是 OpenAI Signals 在商业领域的延伸,旨在衡量 AI 在各组织的普及进程。早期信号已十分明确:前沿企业之所以脱颖而出,不仅是因为他们能够使用 AI,更在于他们已经将 AI 深度融入到各项工作之中。
B2B Signals 是一套周期性的衡量指标,其核心基于对企业级 AI 使用情况的大规模、隐私保护型分析。通过对行为模式的持续追踪,B2B Signals 旨在协助各类机构深入洞察如何将人工智能转化为实际的商业价值。
前沿 (frontier) 企业,即 AI 使用排名位于前 5% (P95) 的企业,展现出更高的人均智能使用率。这些企业不仅更密集地采用尖端工具,还将 AI 嵌入业务流程之中。对于部分企业而言,这种领先优势正产生复利效应,而竞争差距也日益体现为使用深度的不同。
核心要点
- 前沿优势正产生复利效应:前沿企业的人均智能使用量已达普通企业的 3.5 倍,较一年前的 2 倍进一步拉大。
- 前沿企业应用更深,而非仅是频率更高:消息量仅能解释前沿企业与普通企业之间 36% 的差距,绝大部分优势源于更深层次的应用。
- 智能体工作流正成为前沿应用的标志:这种差距在高级智能体工具上最为显著,前沿企业发送的 Codex 消息量是普通企业的 16 倍。
- 组织可通过变革缩小差距:为了迎头赶上,企业需要衡量应用深度、优先构建治理系统、加大培训与支持体系的投入、大规模推广成功案例,并实现从“对话式辅助”向“智能体任务委派”的转型。
深度
前沿优势正步入复利增长期,AI 应用最深入的企业正在扩大领先优势
对于企业而言,席位部署仅仅是起点。更清晰的指标在于员工是否正利用 AI 处理更深层次、更复杂的任务。本图表对比了前沿企业(定义为 P95 级别)与普通企业(定义为 P50 中位水平)的人均 Token 生成量。
虽然 Token 并非衡量商业价值的完美指标:简短的回答可能非常有价值,而冗长的回复可能价值不高。但 Token 生成量有助于衡量员工要求 AI 执行的任务负载,它是反映 AI 应用深度以及员工对“智能”需求量的替代指标。
前沿企业的人均智能需求量是普通企业的 3.5 倍。这一差距已从 2025 年 4 月的 2 倍进一步拉大,表明深度应用 AI 的企业正在扩大领先优势,并能更从容地将 AI 的新能力转化为更深层次、更复杂的业务产出。
前沿优势主要源于应用深度,而非更高的消息量
前沿企业的人均智能需求显著高于普通企业,但这种差距绝非单纯的消息量所能解释。本图表对 3.5 倍的前沿优势进行了拆解:即便普通企业保持与前沿企业相同的消息发送频率,也只能弥补这 3.5 倍差距中的 36%。
剩下的差距则与应用深度相关。前沿企业的员工正要求 AI 承担更复杂的工作,并为模型提供更丰富的业务背景信息,从而产出更具实质性的成果。
广度
前沿优势在高级工具与智能体工具中最为显著,其中 Codex 使用量高出 16 倍
前沿优势在支持高级工作流的工具上表现最为突出。在 Codex 上的差异最为巨大,前沿企业的人均消息发送量高达 16 倍。在 ChatGPT 智能体、ChatGPT 内的应用程序、深度研究 (Deep Research) 以及 GPT 上也展现出较大的差距。这表明前沿企业更擅长利用工具来辅助编程、委派多步任务、融合公司私有知识并开展复杂的调研工作。
相比之下,更通用且易于上手的工具(如用户上传、搜索和数据分析)所展现的前沿优势较小。这些工具对大多数企业来说更易使用,因为它们是对既有工作流的延伸。前沿优势在高级工具与智能体工具中最为显著,因为这些工具的采用需要更强的专业能力、与工作空间知识及工具的更深入联动,以及将任务交由 AI 处理的决策意愿。
前沿企业最显著的优势体现在教育与学习方面
在教育与学习类任务中,前沿优势最为突出:前沿企业在此类任务中的消息发送量是普通企业的 7 倍。前沿企业利用 AI 帮助员工培养技能并学习新课题。他们还利用 AI 来深化对人工智能的理解,包括其功能边界、如何高效使用,以及如何将其融入既有的工作流。这一差距的规模表明,普通企业在将 AI 作为员工学习与发展工具方面,可能存在利用不足的情况。
编程方面同样展现出 4 倍的显著差距,这与高级工具及智能体工具使用上的整体差距相一致。“操作指南”以及“写作与沟通”类任务的前沿差距最小,这可能是因为此类任务是更易上手、更为人熟知的 AI 用途。
消除“能力积压 (capability overhang)”需要的是培训与支持体系,而非仅仅是准入。OpenAI 的企业资源和 OpenAI Academy 提供了实用指南、培训教材及部署资源,助力团队更自信地应用 AI。
AI 应用在写作领域最为广泛,但特定职能的应用正在增长
写作与沟通仍是 ChatGPT 最常见的使用场景。然而,不同职能的使用模式存在显著差异。IT 与安全团队 60% 的消息集中在操作手册与规程指引;软件开发及数据科学与工程团队近一半的消息与编程相关;而财务团队有十分之一的消息涉及分析与计算。
这些模式与更广泛的证据相一致,即前沿模型正在有效提升具有经济价值的职能任务。GDPval 是一项针对 44 种职业的真实知识型工作评估,旨在衡量模型在产出实际工作成果(如文档、电子表格、幻灯片、图表和多媒体)时的表现。随着 AI 能力的增强,企业级应用正延伸至与各职能核心职责结合更紧密的任务中。
基于业务语境的任务类型
| 业务语境 | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ChatGPT 任务 | ||||||||||||
| 写作与沟通 | ||||||||||||
| 操作手册与规程指引 | ||||||||||||
| 信息获取 | ||||||||||||
| 分析与计算 | ||||||||||||
| 建议 | ||||||||||||
| 创意媒体 | ||||||||||||
| 商务 | ||||||||||||
| 编程 | ||||||||||||
| 教育与学习 | ||||||||||||
覆盖范围
行业领先地位并非单一维度:不同领域在 ChatGPT、Codex 及 API 方面占据领先地位
AI 的应用路径并非千篇一律,不存在单一的“领跑榜单”。行业排名因衡量指标而异。专业、科学及技术服务业在 Codex 采用率和 API 调用强度上均排名第一,表明其在开发者及产品集成工作流中拥有更先进的应用。金融与保险业凭借大规模的部署在 ChatGPT 应用上领先;而教育服务业的消息密度最高,意味着人均应用更深入。零售贸易与医疗保健行业在 API 调用强度上排名很高,尽管在其他指标上排名较低。
这些差异表明,行业的领先地位是多维度的。一些行业正通过技术和开发工作流接轨 AI,而另一些行业则通过广泛的 ChatGPT 普及或更密集的终端用户使用来实现规模化。
基于 AI 采用指标的行业排名
| 行业 | ||||
|---|---|---|---|---|
| 金融与保险 | 1+1 | 10-4 | 30 | 60 |
| 信息获取 | 2-1 | 20 | 20 | 4-1 |
| 专业、科学与技术服务 | 30 | 10 | 10 | 10 |
| 艺术、娱乐与休闲 | 40 | 4-1 | 50 | 3+1 |
| 公用事业 | 50 | 80 | 90 | 90 |
| 建筑 | 6-1 | 50 | 10-1 | 10-1 |
| 房地产及租赁业 | 7-1 | 7+1 | 11-1 | 80 |
| 制造业 | 8-1 | 3+1 | 40 | 70 |
| 医疗保健与社会援助 | 90 | 90 | 6+1 | 50 |
| 零售贸易 | 10-2 | 11-1 | 7-1 | 20 |
| 公共行政 | 11-1 | 6+1 | 80 | 11-1 |
企业正将 API 应用推向生产级工作流与面向客户的应用场景
公司正越来越多地利用 API 将模型直接集成到产品、服务及内部系统中。常见的生产级用例包括:应用内助手、编程与开发工具、客户支持、调研工作流以及工作流自动化。
这些部署案例表明,企业级 AI 正在跨越实验阶段,进入具有可衡量运营影响的可复用工作流。在各类客户案例中,企业正利用 OpenAI 模型来加速知识型工作、提升工程吞吐量,并为客户和员工打造 AI 驱动的交互体验。
各行业的热门 API 用例
专业服务
知识助手与搜索(如问答工具、研究助手、内部知识助手)
客户与销售支持(如客户支持、语音及聊天智能体、销售辅助)
数据分析、总结与提取(如公司数据分析、市场情报、交易标注与对账)
编程与开发者工具(如模型评估工具、编程助手、工作流自动化工具)
金融与保险
数据分析、总结与提取(如数据提取、票据与费用分析、投资研究)
文档与工作流生成(如自动化费用管理、研究摘要生成、工作流优化)
知识助手与搜索(如投资策略助手、政策搜索、特定职能助手)
客户与服务支持(如语音及聊天客服智能体、个人银行助手、情绪分类)
信息获取
编程与开发者工具(如编程助手、软件测试工具、网页自动化工具)
知识助手与搜索(如产品内嵌入助手、内部搜索工具、文档助手)
客户和服务支持(如语音及聊天客服智能体、多渠道客户服务自动化)
内容、媒体与设计生成(如品牌素材生成、营销工具)
Cisco 利用 Codex 在大型企业工程组织中加速复杂的软件开发。在生产工作流中,Codex 将构建时间缩短了约 20%,每月节省超过 1500 小时的工程时间,并将缺陷修复的吞吐量提升了 10 至 15 倍。正如 Cisco 团队所言,最大的收益源于将 Codex 视为“团队的一员”。
Rakuten 在工程运营与软件交付中部署了 Codex,将平均故障恢复时间 (MTTR) 缩短了约 50%,使团队解决生产问题的速度翻倍。Rakuten 还利用 Codex 根据内部标准进行自动代码审查和漏洞检查,在不牺牲安全性的前提下加速版本发布。在复杂项目中,Codex 能够将部分需求转化为可运行的全栈实现,将交付周期从季度缩短至数周。
Balyasny Asset Management 利用 OpenAI 在大型专业知识型组织中加速投资研究。其专有的 AI 研究平台已被约 95% 的投资团队使用,将原本耗时数天的研究流程缩短至数小时。例如,以前需要两天的央行演讲分析流程,现在仅需约 30 分钟,帮助分析师在申报文件、会议纪要、研究报告和市场数据之间更快地进行推理。
访问我们的客户案例页面了解更多实例。
组织如何迈向前沿
OpenAI 与各行业、各职能以及处于不同 AI 成熟度阶段的企业均有合作,这让我们得以洞察 AI 应用如何从“实验阶段”演进到“生产阶段”。在这些部署案例中,进展最快的公司往往不再仅仅关注“准入”,而是更多地关注深度应用 AI 所需的组织系统,即衡量、治理、培训与支持体系、扩大影响力,以及智能体部署等体系。
以下五项实践是组织从今天起即可采取的务实步骤,可有效深化 AI 应用:
- 除了衡量访问情况外,还要衡量使用深度。
相关的指标不仅是多少员工拥有 AI 帐户,还包括团队随着时间的推移,是否在更实质性地使用 AI。组织应追踪 AI 的使用是否变得更频繁、更复杂,并与高价值的工作流结合得更紧密。 - 构建支持生产级应用的治理体系。
领先企业并非在回避治理,而是利用治理让智能体 AI 更具可部署性。企业需要明确规则:智能体可以在哪里运行、可以使用哪些信息、何时应仅提供建议而非直接行动,以及人类如何审核高风险决策。前沿企业正在将这些标准定义为部署流程的一部分,使治理成为安全扩大应用规模的加速器,而非阻碍物。 - 将培训与支持体系视为核心基础设施,而非边缘项目。
随着 AI 能力的提升,员工与组织都需要相应的体系来跟上步伐。前沿企业不将培训与支持体系视为一次性的培训冲刺,而是通过针对特定职能的培训、用例研讨会、黑客松、内部先锋骨干网络、专项实验时间以及工作流/最佳实践/技能的共享库,将持续学习植入部署过程。 - 识别内部的前沿团队并扩大其影响力。
在许多组织中,最先进的应用往往集中在少数团队中。这些团队可以揭示哪些工作流、习惯和运营模式是行之有效的。管理者应识别这些团队,理解并复制其成功背后的条件,并帮助他们向公司其他部门分享深度应用 AI 的洞察与案例。 - 实现从“对话”到“任务委派”的跨越。
企业级 AI 正在从“聊天助手”转向“可委派给智能体的工作”。软件工程领域印证了这一趋势,但任务委派正在向各职能部门扩散。借助 Codex,工程师可以将明确定义的任务交给智能体,提供必要的上下文,让其跨文件、跨代码库和工具运行,随后审核结果并根据反馈优化工作流。前沿企业正鼓励员工向 AI 委派任务,而非仅仅将其视为静态助手。
本报告的所有分析均基于去标识化的聚合企业使用数据。消息内容由自动化系统进行分类,在分析过程中,任何 OpenAI 员工均未审查过任何企业、商业或 API 客户的个体数据。
如果你希望获取完整报告,或了解如何以负责任的方式在组织中引入 AI,[欢迎与我们联系]。


