Intercom 打造永續 AI 優勢的三大課題
Intercom 透過早期實驗、嚴謹評估,以及建置可跟著模型持續進化的架構,打造出可擴展的 AI 平台,只要幾天就能推出新功能,不必耗時數季。

2022 年 GPT‑4 問世時,Intercom(在新視窗中開啟) 並非單純關注新聞,而是立即著手準備開發相關應用。這家客戶服務軟體公司在數小時內就開始投入實驗,短短四個月後就推出了專屬 AI 智慧體 Fin,如今每個月為數百萬客戶解決問題。
那股雷厲風行的動能並非偶然。隨著 LLM 技術快速躍進,Intercom 早已意識到 AI 將重塑客戶體驗。因此領導高層迅速展開行動,成立跨部門任務小組、取消與 AI 無關的專案,並挹資 1 億美元,以 AI 為核心重構業務平台。
這項決策帶動了全公司的各項變革:重整產品團隊、制定全新的 AI 優先客服策略,以及建置專屬平台來支援 Fin 處理大量且複雜的客戶問題。
以下是 Intercom 從這段歷程中歸納出的三大課題,無論處於什麼階段,任何團隊都能立即付諸實踐。
Intercom 產品長 Paul Adams:
Intercom 在早期頻繁測試模型,深入瞭解模型的運作模式。
團隊很早就開始對生成式模型進行各種實驗,透過實際操作經驗掌握模型限制和挖掘潛在機會。2023 年初 GPT‑4 正式上線時,他們已做好萬全準備,在短短四個月內就推出了 Fin,且並未就此放緩腳步。
工程部門資深副總裁 Jordan Neill 表示:「我們成功運用 GPT‑3.5 進行流暢且帶點神奇感的對話,不過成熟度尚不足,還無法安心用來服務客戶。我們早已做好萬全準備,所以當 GPT‑4 問世時,我們知道時機已成熟,當機立斷推出了 Fin。」
歸功於對模型的熟練度,Intercom 也成功設計出 Fin Tasks 系統,用於自動處理退款和技術支援等複雜工作流程。雖然團隊一開始規劃採用檢索型架構,但評估後發現 GPT‑4.1 可以獨立處理任務,且具備高穩定性和低延遲表現。
如今,GPT‑4.1 是驅動越來越多 Intercom AI 應用的重要核心,包括 Fin Tasks 的關鍵邏輯。團隊也發現,就算查詢內容不涉及推理,只要加入思路鏈提示,不需要進行完整的 RAG 流程也能提升表現。
Intercom 的寶貴經驗:對模型越熟悉,就能越快採用不斷進化的尖端技術。
在 Intercom 的評估中,GPT‑4.1 完成任務的穩定性表現最優異,與 GPT‑4o 相比成本降低了 20%
若要快速推進,就必須先衡量哪些做法有效,以及背後的原因。
Intercom 之所以能順利採用新模型、模態和架構,都要歸功於其嚴謹的評估流程。無論是用於 Fin Voice (採用 Realtime API) 或 Fin Tasks (採用 GPT‑4.1),每款 OpenAI 新模型在部署之前,都會經過結構化的離線測試和線上 A/B 測試,以評估其指令遵循能力、工具使用準確率以及整體連貫性。
舉例來說,團隊以實際支援服務互動的逐字稿為基準,評估模型在處理退款這類多步驟指令、維持 Fin 品牌口吻,以及穩定執行函數呼叫的能力。然後根據這些評估結果進行線上 A/B 測試,比較不同模型 (如 GPT‑4 和 GPT‑4.1) 在問題解決率和客戶滿意度方面的表現。
透過這套做法,Intercom 只花了幾天就從 GPT‑4 移轉到 GPT‑4.1。他們確認 GPT‑4.1 處理指令和執行函數的能力均有所改善後,就在 Fin Tasks 中全面部署 GPT‑4.1,立即提升了效能和使用者滿意度。
Intercom 工程部門資深副總裁 Jordan Neill 表示:「GPT‑4.1 推出後,我們在 48 小內就得到評估結果,並立刻展開計畫。我們很快就發現,GPT‑4.1 同時兼具智慧及低延遲效能,能滿足我們客戶的需求。」
Intercom 也對 Fin Voice 採用了相同的評估流程,有效驗證新語音模型版本快照,並精準找出延遲、執行函數和遵循腳本方面有待改善的地方,這些都是提供真人水準電話支援服務的重要關鍵。
為了找出影響語音互動的額外要素,Intercom 進一步延伸了評估範圍,針對個性、口吻、遭打斷時的應對方式以及背景噪音等因素,對 Fin Voice 進行系統性評估,確保客戶能獲得優質體驗。
Intercom 一開始就以與時俱進為目標,設計出彈性十足的架構,可因應核心模型的演進持續調整。
Fin 系統採模組化設計,支援聊天、電子郵件和語音等多種模態,每種模態在延遲和複雜度方面各有取捨。這套架構讓 Intercom 能將查詢交給最合適的模型處理,且不需要重新設計底層系統就能替換模型。
這樣的彈性經過刻意設計,且與時俱進,不斷進化。Fin 的架構已歷經三次重大改版,而且下一版已投入開發。隨著模型不斷進步,團隊也會在必要時增加複雜度以引進新功能,並盡可能簡化流程。
這種靈活應變的能力,在 Fin Tasks 中發揮了關鍵作用。最初,團隊假設他們需要一套客製化的檢索型架構來支援 Fin Tasks,讓 Fin 有能力解決複雜的客戶問題,以及執行多步驟流程,例如核發退款、更動帳戶資料或技術疑難排解等。
但經過測試後,GPT‑4.1 遵循指令的能力優於預期,以更低的延遲和成本展現了相同的穩定性。
首席機器學習工程師 Pratik Bothra 表示:「老實說,我認為人們還不夠關注 GPT‑4.1。我們對於它的延遲表現和成本效益感到非常驚喜,不僅讓我們能靈活調整架構,更大幅降低了複雜度。」

Fin AI Engine™
這支團隊才剛起步,Intercom 採用先進模型及無關模型的模組化架構,應用範圍從客戶支援服務擴展到公司內各項工作流程,有效加快問題解決速度及改善客戶體驗:
- 支援團隊:透過 Fin AI 智慧體解決大部分經由聊天、電子郵件和語音等管道收到的查詢問題
- 營運團隊:透過 Fin Tasks 自動處理複雜工作流程,例如退款、帳戶資料更動和訂閱方案更新
- 產品團隊:透過 Intercom 的 MCP Server、ChatGPT 等 AI 工具可以存取客戶對話、客服單和使用者資料,協助公司各團隊找出問題、規劃藍圖、調整訊息傳達方式,以及準備每季業務回顧 (QBR)。
Intercom 憑藉嚴謹的評估、以效能為依據的原則以及彈性的設計,成功打造出可擴展的 AI 平台,不僅重新定義了支援服務,也提供寶貴的經驗讓其他希望導入 AI 的公司借鏡。


