OpenAI B2B Signals
前沿優勢正開始累積並放大。
今日,我們推出 B2B Signals,這是 OpenAI Signals 在商業領域的延伸,用以衡量 AI 如何在機構之間擴展。早期跡象已經很清晰:前沿企業之所以領先,不只是因為這些企業能夠使用 AI,而是因為他們將 AI 更深入地應用於各項工作。
B2B Signals 是一套定期更新的指標,建基於對企業 AI 使用情況的大規模私隱保護分析。當中追蹤各種行為和模式,協助機構了解如何將智能轉化為業務價值。
前沿企業是指 AI 使用量位處第 95 百分位的企業;這些企業中每位員工使用的智能更多,採用進階工具的程度更高,亦更深入地把將 AI 融入工作流程。對部分企業而言,差距正開始累積擴大,而差異亦越來越取決於使用深度。
重點摘要
- 前沿優勢正開始累積並放大:與一般企業相比,前沿企業現時每位員工使用的智能高出 3.5 倍,高於一年前的 2 倍。
- 前沿企業使用 AI 更深入,而不只是更頻繁:訊息量只能解釋前沿企業與一般企業之間差距的 36%。前沿優勢大多來自更深入的使用。
- 智能代理工作流程正成為前沿採用的重要指標:差距在進階智能代理工具方面最為明顯,前沿企業傳送的 Codex 訊息數量是一般企業的 16 倍。
- 企業可以透過組織變革收窄前沿差距:要追上前沿企業,企業需要衡量使用深度、優先處理治理、投資於支援 AI 採用、擴展有效做法,並由對話式協助,轉為把工作委派給智能代理。
深度
前沿優勢正開始累積並放大,而最深入使用 AI 的企業正在擴大領先距離
對企業而言,席位部署只是起點。更清晰的訊號,是員工是否正在使用 AI 處理更深入、更複雜的工作。此圖表比較前沿企業與一般企業每名員工生成的 Token 數量,其中前沿企業定義為第 95 百分位,一般企業定義為第 50 百分位。
Token 並不是衡量業務價值的完美指標。簡短回覆可以非常有價值,冗長回覆亦可能價值不高。不過,Token 量有助衡量員工要求 AI 完成多少工作,因此可作為 AI 使用深度,以及員工向 AI 要求多少智能量的實用替代指標。
前沿企業每名員工要求的智能量是一般企業的 3.5 倍。這項差距已由 2025 年 4 月的 2 倍擴大,顯示最深入使用 AI 的企業正在擴大領先距離,亦更有利於將新的 AI 能力轉化為更深入、更複雜的工作。
前沿優勢大多來自更深入的使用,而不是更高訊息量
前沿企業每名員工要求的智能量遠高於一般企業,但大部分差距並不能單靠訊息量解釋。此圖表分析 3.5 倍的前沿優勢,並發現即使一般企業以與前沿企業相同的頻率傳送訊息,也只能收窄 3.5 倍差距中的 36%。
餘下差距則與更深入的使用相關。前沿企業的員工會要求 AI 處理更複雜的工作,向模型提供更豐富的背景資料,並產生更具實質內容的輸出。
廣度
前沿優勢在進階和智能代理工具上最大,其中 Codex 使用量高出 16 倍
前沿優勢在支援更進階工作流程的工具上最大。Codex 的差距最大,前沿企業每名員工傳送的訊息量高出 16 倍。ChatGPT 智能代理、ChatGPT 中的應用程式、深度研究和 GPT 亦呈現相對較大的差距,顯示前沿企業更善於運用能協助員工編寫程式碼、委派多步驟任務、套用公司背景資料,以及進行更複雜研究的工具。
相比之下,用戶上載、搜尋和資料分析等較通用且容易上手的工具,前沿優勢較小。這些工具延伸了用戶熟悉的工作流程,因此較易被大多數企業採納使用。前沿優勢在進階和智能代理工具上最明顯,因為採用這些工具需要更高專業能力、與工作場所知識和工具連接,並需要更放心把工作委派給 AI。
最大的前沿優勢在於教育與學習
教育與學習任務的前沿優勢最大,前沿企業傳送的訊息量是一般企業的 7 倍。在前沿企業中,企業會使用 AI 協助員工建立技能和學習新主題。企業亦利用 AI 加深對 AI 本身的理解,包括 AI 可以做甚麼、如何善用 AI,以及 AI 可以如何融入現有工作流程。這項差距顯示,一般企業可能未有充分利用 AI 作為員工學習與發展工具。
編碼亦有明顯的 4 倍差距,與進階及智能代理工具使用上的整體差距一致。操作方法指引、寫作與溝通方面的前沿差距最小,可能是因為這些任務較易上手,也是較熟悉的 AI 用途。
要縮窄能力落差,企業需要支援 AI 採用,而不只是提供存取權。OpenAI 的企業資源和 OpenAI Academy 包括實用指南、培訓材料和部署資源,協助團隊更有信心地採用 AI。
AI 在寫作方面使用最廣泛,但特定職能的使用正在增長
寫作與溝通仍然是 ChatGPT 最常見的用途。不過,使用模式會因職能而有明顯差異。IT 與安全訊息中有 60% 集中於操作方法和程序指引;軟件開發、數據科學與工程訊息中接近一半與編碼相關;財務訊息中則有十分之一與分析及計算相關。
這些模式與更廣泛的證據一致,顯示前沿模型在具經濟價值的工作場所任務上正在提升表現。GDPval 是一項針對 44 種職業的現實世界知識工作評估,衡量模型在能產生實際工作輸出的任務上的表現,例如文件、試算表、簡報、圖表和多媒體。隨著 AI 能力提升,企業使用似乎正擴展至與各職能核心工作更緊密相關的任務。
按業務背景劃分的任務類型
| 業務背景 | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ChatGPT 任務 | ||||||||||||
| 寫作與溝通 | ||||||||||||
| 操作方法和程序指引 | ||||||||||||
| 資訊 | ||||||||||||
| 分析與計算 | ||||||||||||
| 建議 | ||||||||||||
| 創意媒體 | ||||||||||||
| 商業 | ||||||||||||
| 編碼 | ||||||||||||
| 教育與學習 | ||||||||||||
觸及範圍
行業領先地位並非單面向:不同產業分別在 ChatGPT、Codex 和 API 方面領先
對於 AI 採用狀況,並沒有單一排行榜可以概覽各企業的進展。行業排名會因所用衡量標準而異。專業、科學及技術服務在 Codex 採用和 API 使用密度方面均排名第一,顯示在開發人員和產品整合工作流程中的使用相對進階。金融與保險因大規模部署而在 ChatGPT 採用方面領先,而教育服務的訊息密度最高,顯示每人使用深度更高。零售業和醫療護理在 API 使用密度方面排名靠前,即使在其他衡量標準上排名較低。
這些差異顯示,行業領先地位並非單面向:有些產業似乎透過技術和開發人員工作流程採用 AI,另一些則透過廣泛採用 ChatGPT 或更密集的終端用戶使用來擴展。
按 AI 採用指標劃分的行業排名
| 行業 | ||||
|---|---|---|---|---|
| 金融與保險 | 1+1 | 10-4 | 30 | 60 |
| 資訊 | 2-1 | 20 | 20 | 4-1 |
| 專業、科學和技術服務 | 30 | 10 | 10 | 10 |
| 藝術、娛樂及康樂 | 40 | 4-1 | 50 | 3+1 |
| 公用事業 | 50 | 80 | 90 | 90 |
| 建築 | 6-1 | 50 | 10-1 | 10-1 |
| 房地產、租賃及租務 | 7-1 | 7+1 | 11-1 | 80 |
| 製造業 | 8-1 | 3+1 | 40 | 70 |
| 醫療護理及社會援助 | 90 | 90 | 6+1 | 50 |
| 零售業 | 10-2 | 11-1 | 7-1 | 20 |
| 公共行政 | 11-1 | 6+1 | 80 | 11-1 |
企業正將 API 使用推進正式工作流程和面向客戶的應用程式
公司越來越多使用 API,將模型直接整合到產品、服務和內部系統。常見的正式使用場景包括應用程式內助理、編碼和開發人員工具、客戶支援、研究工作流程,以及工作流程自動化。
這些部署顯示,企業 AI 正由實驗階段,邁向可重複執行並具備可衡量營運影響的工作流程。從客戶例子可見,企業正使用 OpenAI 模型加快知識工作、提升工程產出效率,並為客戶和員工建立由 AI 驅動的體驗。
各行業的主要 API 用例
專業服務
知識助理和搜尋(例如問答工具、研究助理、內部知識助理)
客戶與銷售支援(例如客戶支援、語音和對話智能代理、銷售協助)
數據分析、摘要及擷取(例如公司數據分析、市場情報、交易標籤及對賬)
編碼和開發人員工具(例如模型評估工具、編碼助理、工作流程自動化工具)
金融與保險
數據分析、摘要及擷取(例如數據擷取、收據及開支分析、投資研究)
文件及工作流程生成(例如自動化開支管理、研究摘要生成、工作流程最佳化)
知識助理和搜尋(例如投資策略助理、政策搜尋、按職能設計的助理。)
客戶與服務支援(例如客戶支援語音和對話智能代理、個人銀行助理、情緒分類)
資訊
編碼和開發人員工具(例如編碼助理、軟件測試工具、網絡自動化工具)
知識助理和搜尋(例如產品內助理、內部搜尋工具、文件記錄助理)
客戶與服務支援(例如客戶支援語音和聊天智能代理、多渠道客戶服務自動化)
內容、媒體和設計生成(例如品牌素材生成、市場推廣工具)
Cisco 使用 Codex,在大型企業工程組織中加快複雜軟件工作。在正式工作流程中,Codex 協助將構建時間縮短約 20%、每月節省超過 1,500 小時工程時間,並將缺陷解決處理量提升 10 至 15 倍。正如 Cisco 團隊所說,最大收益來自他們把 Codex 視為「團隊一員」。
Rakuten 在工程營運和軟件交付中部署 Codex,將平均復原時間縮短約 50%,而團隊處理生產環境問題的速度亦提升了一倍。Rakuten 亦使用 Codex 進行自動化程式碼審查,以及按內部標準進行漏洞檢查,協助在不影響安全的情況下加快發佈。在複雜項目中,Codex 可以將部分需求轉化為可運作的全架構實踐,將工作時間由數個季度壓縮至數星期。
Balyasny Asset Management 使用 OpenAI,在大型專門知識工作機構中加快投資研究。Balyasny 專有的 AI 研究平台獲約 95% 的投資團隊使用,並協助將研究工作流程由數天縮減至數小時。例如,過去需要兩天的中央銀行演講分析工作流程,現在約 30 分鐘即可完成,協助分析師更快地綜合申報文件、逐字稿、研究報告和市場數據進行推理。
更多例子請參閱我們的客戶應用實例頁面。
機構可以如何邁向前沿
OpenAI 與不同行業、職能和 AI 成熟度階段的企業合作,讓我們了解 AI 採用如何由實驗發展至正式使用。在這些部署中,進展最快的企業往往不只是着眼於存取權,而是更重視深入使用 AI 所需的組織系統:衡量、治理、支援 AI 採用、擴大影響,以及智能代理部署。
有五項做法特別突出,可作為任何機構今天即可開始採取的實用步驟,推動更深入地採用 AI。
- 除了存取權,亦要衡量使用深度。
相關訊號不只是有多少員工擁有 AI 帳戶,而是團隊是否隨時間更實質地使用 AI。機構應追蹤 AI 使用是否變得更頻繁、更複雜,並與有價值的工作流程更緊密相關。 - 建立支援正式使用的治理。
領先企業不會迴避治理;而是會利用治理,讓智能代理 AI 更容易部署。企業需要清晰規則,界定智能代理可在哪些地方運作、可以使用哪些資訊、何時應提出建議而非採取行動,以及人類如何審查較高風險的決定。前沿企業會將這些標準定義為部署流程的一部分,讓治理成為安全擴大採用的方式,而不是拖慢採用的阻力。 - 將 AI 採用支援視為核心基礎設施,而不是附帶項目。
隨著 AI 能力提升,員工和機構都需要系統協助他們跟上步伐。前沿企業不會把支援 AI 採用視為單次的培訓推動工作;而是透過按職能設計的培訓、用例工作坊、黑客松、內部推動者網絡、專門實驗時間,以及共享的工作流程、最佳做法和技能資料庫,將持續學習融入部署之中。 - 識別前沿團隊,並擴大影響力。
在很多機構中,最進階的使用方式往往集中在少數團隊。這些團隊可以顯示哪些工作流程、習慣和營運模式正在發揮作用。管理層應識別這些團隊,了解並擴大成功背後的條件,並協助他們與企業其他部門分享更深入使用 AI 的分析見解和例子。 - 超越對話,轉為委派工作。
企業 AI 正由對話助理,轉為可委派予智能代理的工作。軟件工程展現了這個趨勢,但委派式工作正在擴展至不同職能。透過 Codex,工程師可以交託明確任務、提供智能代理所需的背景資料,然後讓智能代理在不同檔案、程式碼庫和工具之間工作,再審閱結果,並透過意見回饋改善工作流程。前沿企業正鼓勵員工將任務委派給 AI,而不只是把 AI 當作靜態助理使用。
本報告中的所有分析均基於已去識別化並彙總處理的企業使用資料。訊息內容已使用自動化系統分類,在此分析過程中,沒有任何 OpenAI 員工審閱個別企業、業務或 API 客戶資料。
如你想探索完整研究結果,或了解如何負責任地把 AI 引入你的機構,[歡迎與我們聯繫]。


