跳到主要內容
OpenAI

2026年4月1日

初創企業

Gradient Labs 為每位銀行客戶提供 AI 客戶經理

Gradient Labs 使用 GPT‑4.1 以及 GPT‑5.4 mini 和 nano,以高準確度和低延遲執行複雜的金融支援工作流程。

柔和流動的漸變背景,以暖橙和黃色過渡至藍綠色,中央位置有白色幾何立方體圖示,旁邊是「Gradient Labs」字樣。
公司規模: 初創公司
地區: 歐洲及英國
行業: 科技, 金融
產品: API

成效

10x

收入增長

成效

98%

客戶對 AI 智能代理體驗的滿意度

成效

+11%

GPT-4.1 相較次佳供應商具備更高準確度

正在載入...

在銀行業,處理客戶問題通常絕不簡單。例如欺詐或付款被凍結等個案,往往需要跨多個團隊,嚴格遵循複雜程序。如果系統未能應付,客戶就會被轉來轉去,要長時間排隊等候,並在風險最高的時刻面對延誤。

Gradient Labs(在新視窗中開啟) 專為應對這種複雜性而設。這間總部位於倫敦的公司,正全力構建 AI 智能代理,讓每位銀行客戶都能享有專屬客戶經理的體驗。公司由一支曾於 Monzo 領導 AI 和數據工作的團隊創辦,整個平台建基於 OpenAI 模型,現時正將生產流量轉移至 GPT‑5.4 mini 和 nano。

Gradient Labs 聯合創辦人兼首席科學家 Danai Antoniou 表示:「我們觀察到 GPT‑5.4 mini 和 nano 的延遲為 500 毫秒,這正正是自然語音對話所需要的水平。我們正把相當大部分的工作負載轉移過去。」

「我們需要同時達成三件事:指令跟從的準確度、低幻覺率,以及函數調用的可靠性,而且全部都要在語音延遲限制下完成。OpenAI 是唯一可在三方面都達標的供應商。」
Gradient Labs 聯合創辦人兼首席科學家 Danai Antoniou

由 SOP 走向即時系統

在銀行業,客戶互動通常受標準作業流程 (SOP) 規範,這些程序界定了每個步驟應如何處理。

典型的客戶互動可能會是這樣:

  1. 客戶來電指信用卡被盜。
  2. 系統即時核實其身份,並處理更正和對話中的打擾和插話。
  3. 完成核實後,系統會凍結該信用卡,同時啟動補發程序。
  4. 系統會回答跟進問題,例如送達時間,並建議下一步行動。

每個步驟都會依循既定程序,並根據用戶輸入、情境、所執行的防護機制,以及客戶與智能代理的回應即時作出決定,以確保合規。

Antoniou 表示:「模型需要在插話、附和回應和話題切換之間維持程序狀態,同時保持快速生成回應,大多數供應商幾乎不願意嘗試這項挑戰。」

Gradient Labs 會以最具挑戰性的程序作基準來評估不同供應商的表現,同時根據他們所稱的軌跡準確度來進行評估:即衡量系統能否由開始到結束都沿著正確路徑執行。

在其中一次早期評估中,GPT‑4.1 是唯一能達到 97% 軌跡準確度和一致性的模型。而表現最接近的下一個供應商,則只達到 88%。

Antoniou 表示:「在金融服務中,這就是解決一個顧客來電與引發合規事故之間的差別。」

這個結果影響了 Gradient Labs 的系統設計方式。團隊建立了一套混合架構:以 OpenAI 模型處理需要密集推理的步驟,而較小型的模型就負責更快速、更明確的任務,同時透過根據複雜度和延遲限制作出調整的路由機制來分配工作。

在內部,系統由一個中央推理智能代理協調多種專門技能組成,讓複雜個案可跨工作流程處理,而不會失去上下文。

對於每次互動,系統都會並行運行 15 個以上的防護系統,確保對話維持在既定程序和合規界線之內,其中包括金融建議偵測、漏洞訊號、投訴,以及嘗試繞過驗證或存取敏感數據等情況。

在高風險環境中證明可靠性

當金融機構需要部署這種系統,單憑信念並不足夠。他們需要逐步確認,系統能在現實環境下正常和正確地運作。

Antoniou 表示:「你必須由底層開始,以零幻覺為前提去做架構設計,這必須是整個建構過程中的指導原則。」

為了評估新模型及現有模型,團隊會重播真實客戶對話,並把系統行為與預期程序逐步比對。他們亦會生成合成對話,在任何內容部署前測試邊緣個案和罕見情境。

Gradient Labs 亦讓團隊可自行控制系統的引入方式。他們會分析歷史支援數據,了解銀行處理哪類客戶問題,以及各類問題出現的頻率。之後,團隊可以選擇哪些類別可交由 AI 處理,通常是先從風險較低的工作流程着手,再隨時間擴大範圍。

銀行支援工具的資料主頁介面,顯示一項名為「欺詐冒充他人回電」的程序,以及用於核實可疑付款的逐步指示。右方顯示一段即時通話逐字稿,內容為 AI 智能代理與客戶之間的訊息交流,包括確認身份,以及發送驗證碼以保障帳戶安全。

在正式採用前,客戶可模擬不同對話,以檢視系統在各種情境下如何回應,從而更有信心系統可按預期運作。

部署通常會先由一小部分流量開始,並透過持續監察和自動檢查,標示可能需要人工覆核的對話。隨着系統持續展現穩定表現,覆蓋範圍亦會逐步擴大。

由第一日開始展現成效,以及未來方向

Gradient Labs 的客戶回報指出,其 CSAT 分數高達 98%,部分情況甚至超越他們表現最好的真人客戶服務人員。

這種影響亦反映在公司的增長上。過去一年,Gradient Labs 的收入增長超過 10 倍,並由從外接收的個案支援擴展至對外和後勤流程。

展望未來,Gradient Labs 正專注於能夠在互動之間延續上下文的系統:理解客戶歷史、追蹤持續中的問題,並從上一次對話中斷的位置接續處理。這個方向亦與 Gradient Labs 對其與 OpenAI 長期合作關係的看法高度一致。

「我們不只是為今天選擇一個模型。我們是建立在一個平台之上,而我們看到推理模型的發展軌跡,正與我們的產品方向一致。」
Gradient Labs 聯合創辦人兼首席科學家 Danai Antoniou

隨着模型持續改進,可安全自動化的程序範圍亦不斷擴大。對 Gradient Labs 而言,這代表他們正更接近一個系統:讓每次客戶互動都能以媲美頂尖智能代理的一致性、判斷力和連貫性來處理。