Ba bài học của Intercom về xây dựng lợi thế bền vững với AI
Bằng cách thử nghiệm sớm, đo lường nghiêm ngặt và xây dựng hệ thống cho phép chuyển đổi theo từng mô hình, Intercom đã xây dựng một nền tảng AI có thể mở rộng, cho phép triển khai các tính năng mới chỉ trong vài ngày thay vì hàng quý.

Khi GPT‑4 ra mắt năm 2022, Intercom(mở trong cửa sổ mới) không chỉ theo dõi tin tức mà họ còn sẵn sàng hành động. Chỉ trong vài giờ, công ty phần mềm dịch vụ khách hàng này đã bắt đầu thử nghiệm, và chỉ bốn tháng sau khi ra mắt, Trợ lý AI Fin của họ giờ đây đã giải quyết hàng triệu yêu cầu mỗi tháng từ khách hàng.
Sự bứt phá từ sớm đó không phải là ngẫu nhiên. Với bước tiến vượt bậc của mô hình ngôn ngữ lớn (LLM), Intercom nhận ra rằng AI có thể định hình lại trải nghiệm khách hàng. Ban lãnh đạo đã hành động nhanh chóng, thành lập một đội đặc nhiệm với các thành viên đến từ nhiều bộ phận, hủy các dự án không ứng dụng AI, và dành 100 triệu USD để tái thiết mô hình kinh doanh xoay quanh AI.
Quyết định đó đã khơi dậy những thay đổi trên phạm vi toàn công ty: tổ chức lại các nhóm sản phẩm, triển khai chiến lược hỗ trợ khách hàng mới ưu tiên ứng dụng AI, và xây dựng một nền tảng để hỗ trợ Fin xử lý khối lượng lớn các yêu cầu phức tạp từ khách hàng.
Dưới đây là ba bài học đúc rút được từ mô hình của Intercom mà bất kỳ đội ngũ nào, với mọi xuất phát điểm, cũng đều có thể áp dụng ngay bây giờ.
“AI phải được tích hợp ngay từ đầu; bạn không thể lồng ghép nó giữa chừng.”
Intercom thường xuyên thử nghiệm từ sớm các mô hình và học hỏi sâu từ kết quả triển khai.
Nhóm đã bắt đầu thử nghiệm các mô hình tạo sinh từ sớm và những kinh nghiệm thực tế đã giúp họ phát hiện các hạn chế của mô hình và tìm ra các cơ hội. Khi GPT‑4 ra mắt vào đầu năm 2023 thì họ đã sẵn sàng. Trong vòng bốn tháng, họ cho ra mắt Fin và vẫn không ngừng phát triển kể từ đó.
Jordan Neill, Phó chủ tịch cấp cao phụ trách Kỹ thuật, cho biết: "Chúng tôi đã có thể tận dụng GPT‑3.5 để thực hiện những cuộc trò chuyện ngắn mượt mà, nhưng như vậy là chưa đủ để chiếm được sự tin tưởng từ khách hàng". “Vì chúng tôi đã hoàn tất những gì cần làm nên khi GPT‑4 xuất hiện, chúng tôi biết rằng đã đến lúc triển khai Fin.”
Chính năng lực thành thạo đó đã giúp Intercom thiết kế ra Fin Tasks, một hệ thống tự động hóa các quy trình làm việc phức tạp như hoàn tiền và hỗ trợ kỹ thuật. Mặc dù ban đầu nhóm dự định sử dụng mô hình ngăn xếp dựa trên truy xuất, nhưng kết quả thẩm định đã cho thấy GPT‑4.1 có thể tự xử lý công việc này với độ tin cậy cao và độ trễ thấp hơn.
Giờ đây, GPT‑4.1 hỗ trợ ngày càng nhiều ứng dụng AI của Intercom, bao gồm cả logic chính bên trong Fin Tasks. Nhóm nghiên cứu phát hiện ra rằng việc áp dụng kỹ thuật đặt câu lệnh theo chuỗi tư duy đối với các yêu cầu không đòi hỏi suy luận giúp cải thiện hiệu suất rõ rệt mà không cần triển khai toàn bộ quy trình RAG.
Bài học rút ra từ Intercom: càng hiểu rõ về mô hình của mình, bạn càng có thể thích nghi nhanh hơn khi công nghệ phát triển.
Trong các kết quả thẩm định của Intercom, GPT‑4.1 cho thấy độ tin cậy cao nhất về khả năng hoàn thành tác vụ đồng thời giảm 20% chi phí so với GPT‑4o
Để hành động nhanh, bạn phải đo lường xem điều gì hiệu quả và tại sao.
Năng lực áp dụng các mô hình, phương thức và kiến trúc mới một cách nhanh chóng của Intercom bắt nguồn từ quy trình thẩm định nghiêm ngặt của họ. Mỗi mô hình OpenAI mới — dù được sử dụng cho Fin Voice, được trang bị Realtime API hay cho Fin Tasks, dựa trên GPT‑4.1 — đều trải qua các bài kiểm tra ngoại tuyến mang tính cấu trúc và thử nghiệm A/B trực tiếp để đánh giá khả năng làm theo hướng dẫn, độ chính xác khi tương tác với các công cụ bên ngoài và tính nhất quán tổng thể trước khi triển khai.
Ví dụ: nhóm đánh giá các mô hình bằng cách so sánh với bản ghi của các cuộc hội thoại hỗ trợ khách hàng thực tế xem chúng xử lý tốt đến đâu các hướng dẫn nhiều bước như yêu cầu hoàn tiền, có thể hiện được tiếng nói thương hiệu của Fin và có thể gọi hàm một cách đáng tin cậy hay không. Những kết quả này cung cấp thông tin cho các thử nghiệm A/B so sánh tỷ lệ giải quyết và mức độ hài lòng của khách hàng trên các mô hình như GPT‑4 và GPT‑4.1.
Cách tiếp cận này đã giúp Intercom chuyển đổi từ GPT‑4 sang GPT‑4.1 chỉ trong vài ngày. Sau khi xác nhận những chuyển biến tích cực trong việc xử lý hướng dẫn và gọi hàm, họ đã triển khai GPT‑4.1 trên Fin Tasks và nhận thấy sự cải thiện ngay lập tức về cả hiệu suất lẫn mức độ hài lòng của người dùng.
Jordan Neill, Phó chủ tịch cấp cao phụ trách Kỹ thuật tại Intercom cho biết: "Khi GPT‑4.1 ra mắt, chúng tôi đã có kết quả thẩm định trong vòng 48 giờ và kế hoạch triển khai ngay sau đó". “Chúng tôi nhận thấy ngay rằng GPT‑4.1 có sự kết hợp lý tưởng giữa tính thông minh và độ trễ, cho phép đáp ứng nhu cầu của khách hàng.”
Với Fin Voice, Intercom đã sử dụng cùng quy trình thẩm định đó để kiểm chứng các phiên bản mô hình giọng nói mới, đồng thời phát hiện những cải tiến về độ trễ, khả năng gọi hàm và mức độ tuân thủ kịch bản: tất cả đều đóng vai trò then chốt trong việc mang đến trải nghiệm hỗ trợ qua điện thoại như do con người thực hiện.
Intercom đã mở rộng hoạt động thẩm định để ghi nhận khía cạnh khác mà giọng nói thể hiện trong quá trình tương tác. Họ đánh giá Fin Voice một cách có hệ thống ở các yếu tố như tính cách, giọng điệu, cách xử lý gián đoạn và tiếng ồn xung quanh để đảm bảo khách hàng có được trải nghiệm chất lượng cao.
Ngay từ đầu, Intercom đã được xây dựng để thích ứng với sự thay đổi. Công ty này thiết kế một kiến trúc đủ linh hoạt để phát triển song hành với các mô hình nền tảng.
Hệ thống của Fin được thiết kế theo dạng mô-đun, hỗ trợ nhiều phương thức như chat, email và thoại. Mỗi phương thức có những ưu nhược điểm khác nhau về độ trễ và độ phức tạp. Kiến trúc này cho phép Intercom chuyển hướng yêu cầu đến mô hình phù hợp nhất và hoán đổi mô hình mà không cần thiết kế lại hệ thống nền tảng.
Sự linh hoạt đó là có chủ đích và vẫn không ngừng phát triển. Kiến trúc của Fin hiện đang ở phiên bản thứ ba và công ty đã bắt đầu phát triển phiên bản tiếp theo. Khi các mô hình hiệu quả hơn, nhóm sẽ tăng độ phức tạp khi cần để khai thác những khả năng mới và đơn giản hóa khi có thể.
Khả năng thích ứng này đóng vai trò trọng yếu với Fin Tasks. Ban đầu, nhóm cho rằng họ sẽ cần một kiến trúc dựa trên truy xuất tùy chỉnh để hỗ trợ Fin Tasks — cho phép Fin giải quyết các yêu cầu phức tạp của khách hàng và thực hiện các quy trình nhiều bước như hoàn tiền, tiến hành thay đổi trong tài khoản hoặc khắc phục sự cố kỹ thuật.
Nhưng trong quá trình thử nghiệm, khả năng làm theo hướng dẫn của GPT‑4.1 đã vượt xa mong đợi, mang đến độ tin cậy tương tự nhưng với độ trễ và chi phí thấp hơn.
Pratik Bothra, Kỹ sư trưởng về máy học tại Intercom, cho biết: "Thành thật mà nói, tôi không nghĩ mọi người đã quan tâm đủ nhiều đến GPT‑4.1". “Chúng tôi thực sự ngạc nhiên về độ trễ và chi phí triển khai. Nó cho phép chúng tôi thay đổi kiến trúc và loại bỏ đáng kể sự phức tạp.”

Fin AI Engine™
Nhóm mới chỉ bắt đầu công việc. Được trang bị các mô hình tiên tiến và xây dựng trên kiến trúc dạng mô-đun, áp dụng với mọi mô hình, Intercom đang mở rộng ra ngoài lĩnh vực hỗ trợ khách hàng để thúc đẩy các quy trình làm việc trên toàn doanh nghiệp, mang đến các giải pháp nhanh hơn và trải nghiệm khách hàng tốt hơn:
- Các nhóm hỗ trợ: Giải quyết phần lớn các yêu cầu đầu vào qua tính năng chat, email, giọng nói, v.v. với Trợ lý AI Fin
- Nhóm vận hành: Tự động hóa các quy trình làm việc phức tạp như hoàn tiền, sửa đổi nội dung tài khoản và cập nhật gói đăng ký với Fin Tasks
- Nhóm sản phẩm: Bằng việc sử dụng Máy chủ MCP của Intercom, các công cụ AI như ChatGPT có thể truy cập các cuộc trò chuyện với khách hàng, phiếu yêu cầu hỗ trợ và dữ liệu người dùng - giúp mọi bộ phận trong toàn doanh nghiệp phát hiện lỗi, xác định lộ trình, tinh chỉnh tin nhắn và chuẩn bị cho đánh giá kết quả kinh doanh hằng quý (QBR).
Intercom đã xây dựng một nền tảng AI có khả năng mở rộng thông qua việc duy trì thẩm định nghiêm ngặt, tập trung vào hiệu suất và tính linh hoạt trong thiết kế — tái định nghĩa dịch vụ hỗ trợ và là tấm gương cho bất kỳ công ty nào đang muốn phát triển dựa vào AI.


