跳到主要內容

2026年4月1日

初創企業

Gradient Labs 為每位銀行客戶提供 AI 客戶經理

Gradient Labs 使用 GPT‑4.1 以及 GPT‑5.4 mini 和 nano，以高準確度和低延遲執行複雜的金融支援工作流程。

柔和流動的漸變背景，以暖橙和黃色過渡至藍綠色，中央位置有白色幾何立方體圖示，旁邊是「Gradient Labs」字樣。

公司規模: 初創公司

地區: 歐洲及英國

行業: 科技, 金融

產品: API

成效

10x

收入增長

成效

98%

客戶對 AI 智能代理體驗的滿意度

成效

+11%

GPT-4.1 相較次佳供應商具備更高準確度

正在載入...

在銀行業，處理客戶問題通常絕不簡單。例如欺詐或付款被凍結等個案，往往需要跨多個團隊，嚴格遵循複雜程序。如果系統未能應付，客戶就會被轉來轉去，要長時間排隊等候，並在風險最高的時刻面對延誤。

Gradient Labs⁠（在新視窗中開啟）專為應對這種複雜性而設。這間總部位於倫敦的公司，正全力構建 AI 智能代理，讓每位銀行客戶都能享有專屬客戶經理的體驗。公司由一支曾於 Monzo 領導 AI 和數據工作的團隊創辦，整個平台建基於 OpenAI 模型，現時正將生產流量轉移至 GPT‑5.4 mini 和 nano。

Gradient Labs 聯合創辦人兼首席科學家 Danai Antoniou 表示：「我們觀察到 GPT‑5.4 mini 和 nano 的延遲為 500 毫秒，這正正是自然語音對話所需要的水平。我們正把相當大部分的工作負載轉移過去。」

「我們需要同時達成三件事：指令跟從的準確度、低幻覺率，以及函數調用的可靠性，而且全部都要在語音延遲限制下完成。OpenAI 是唯一可在三方面都達標的供應商。」

Gradient Labs 聯合創辦人兼首席科學家 Danai Antoniou

由 SOP 走向即時系統

在銀行業，客戶互動通常受標準作業流程 (SOP) 規範，這些程序界定了每個步驟應如何處理。

典型的客戶互動可能會是這樣：

客戶來電指信用卡被盜。
系統即時核實其身份，並處理更正和對話中的打擾和插話。
完成核實後，系統會凍結該信用卡，同時啟動補發程序。
系統會回答跟進問題，例如送達時間，並建議下一步行動。

每個步驟都會依循既定程序，並根據用戶輸入、情境、所執行的防護機制，以及客戶與智能代理的回應即時作出決定，以確保合規。

Antoniou 表示：「模型需要在插話、附和回應和話題切換之間維持程序狀態，同時保持快速生成回應，大多數供應商幾乎不願意嘗試這項挑戰。」

Gradient Labs 會以最具挑戰性的程序作基準來評估不同供應商的表現，同時根據他們所稱的軌跡準確度來進行評估：即衡量系統能否由開始到結束都沿著正確路徑執行。

在其中一次早期評估中，GPT‑4.1 是唯一能達到 97% 軌跡準確度和一致性的模型。而表現最接近的下一個供應商，則只達到 88%。

Antoniou 表示：「在金融服務中，這就是解決一個顧客來電與引發合規事故之間的差別。」

這個結果影響了 Gradient Labs 的系統設計方式。團隊建立了一套混合架構：以 OpenAI 模型處理需要密集推理的步驟，而較小型的模型就負責更快速、更明確的任務，同時透過根據複雜度和延遲限制作出調整的路由機制來分配工作。

在內部，系統由一個中央推理智能代理協調多種專門技能組成，讓複雜個案可跨工作流程處理，而不會失去上下文。

對於每次互動，系統都會並行運行 15 個以上的防護系統，確保對話維持在既定程序和合規界線之內，其中包括金融建議偵測、漏洞訊號、投訴，以及嘗試繞過驗證或存取敏感數據等情況。

在高風險環境中證明可靠性

當金融機構需要部署這種系統，單憑信念並不足夠。他們需要逐步確認，系統能在現實環境下正常和正確地運作。

Antoniou 表示：「你必須由底層開始，以零幻覺為前提去做架構設計，這必須是整個建構過程中的指導原則。」

為了評估新模型及現有模型，團隊會重播真實客戶對話，並把系統行為與預期程序逐步比對。他們亦會生成合成對話，在任何內容部署前測試邊緣個案和罕見情境。

Gradient Labs 亦讓團隊可自行控制系統的引入方式。他們會分析歷史支援數據，了解銀行處理哪類客戶問題，以及各類問題出現的頻率。之後，團隊可以選擇哪些類別可交由 AI 處理，通常是先從風險較低的工作流程着手，再隨時間擴大範圍。

銀行支援工具的資料主頁介面，顯示一項名為「欺詐冒充他人回電」的程序，以及用於核實可疑付款的逐步指示。右方顯示一段即時通話逐字稿，內容為 AI 智能代理與客戶之間的訊息交流，包括確認身份，以及發送驗證碼以保障帳戶安全。

在正式採用前，客戶可模擬不同對話，以檢視系統在各種情境下如何回應，從而更有信心系統可按預期運作。

部署通常會先由一小部分流量開始，並透過持續監察和自動檢查，標示可能需要人工覆核的對話。隨着系統持續展現穩定表現，覆蓋範圍亦會逐步擴大。

由第一日開始展現成效，以及未來方向

Gradient Labs 的客戶回報指出，其 CSAT 分數高達 98%，部分情況甚至超越他們表現最好的真人客戶服務人員。

這種影響亦反映在公司的增長上。過去一年，Gradient Labs 的收入增長超過 10 倍，並由從外接收的個案支援擴展至對外和後勤流程。

展望未來，Gradient Labs 正專注於能夠在互動之間延續上下文的系統：理解客戶歷史、追蹤持續中的問題，並從上一次對話中斷的位置接續處理。這個方向亦與 Gradient Labs 對其與 OpenAI 長期合作關係的看法高度一致。

「我們不只是為今天選擇一個模型。我們是建立在一個平台之上，而我們看到推理模型的發展軌跡，正與我們的產品方向一致。」

Gradient Labs 聯合創辦人兼首席科學家 Danai Antoniou

隨着模型持續改進，可安全自動化的程序範圍亦不斷擴大。對 Gradient Labs 而言，這代表他們正更接近一個系統：讓每次客戶互動都能以媲美頂尖智能代理的一致性、判斷力和連貫性來處理。

OpenAI 熱愛初創企業

加入社群開始構建

繼續閲讀

Warp customer story 1x1 hero art card

Warp 以 GPT-5.5 大舉投入開源建構

初創企業2026年5月27日

Parloa builds service agents customers want to talk to

初創企業2026年5月7日

Descript > 1x1 Card

How Descript engineers multilingual video dubbing at scale

初創企業2026年3月6日