Gradient Labs đem đến quản lý tài khoản AI cho khách ngân hàng
Gradient Labs dùng GPT‑4.1 cùng GPT‑5.4 mini và nano để vận hành các quy trình hỗ trợ tài chính phức tạp với độ chính xác cao và độ trễ thấp.

Kết quả
10x
Tăng trưởng doanh thu
Kết quả
98%
Mức hài lòng của khách hàng với trải nghiệm tác nhân AI
Kết quả
+11%
Độ chính xác cao hơn với GPT-4.1 so với nhà cung cấp tốt thứ hai
Trong lĩnh vực ngân hàng, việc giải quyết một vấn đề của khách hàng hiếm khi đơn giản. Các trường hợp như gian lận hoặc thanh toán bị chặn đòi hỏi phải tuân thủ nghiêm ngặt những quy trình phức tạp của nhiều đội ngũ. Khi hệ thống không đáp ứng được, khách hàng bị chuyển qua lại giữa các đội ngũ, phải chờ trong hàng đợi và đối mặt với sự chậm trễ đúng vào những thời điểm quan trọng nhất.
Gradient Labs(mở trong cửa sổ mới) được xây dựng để xử lý sự phức tạp này. Công ty có trụ sở tại London đang phát triển các tác nhân AI mang đến cho mọi khách hàng ngân hàng trải nghiệm của một quản lý tài khoản chuyên trách. Được thành lập bởi đội ngũ từng dẫn dắt các nỗ lực về AI và dữ liệu tại Monzo, nền tảng của công ty được xây trên các mô hình OpenAI và hiện đang chuyển lưu lượng công việc sang GPT‑5.4 mini và nano.
“Chúng tôi thấy độ trễ là 500 mili giây với GPT‑5.4 mini và nano, đúng bằng mức chúng tôi cần cho các cuộc đàm thoại bằng giọng nói tự nhiên,” Danai Antoniou, Đồng sáng lập kiêm Nhà khoa học trưởng tại Gradient Labs, cho biết. “Chúng tôi đang chuyển một phần đáng kể khối lượng công việc sang đó.”
“Chúng tôi đồng thời cần ba yếu tố: độ chính xác trong việc làm theo chỉ dẫn, tỷ lệ ảo giác thấp và độ tin cậy khi gọi hàm, tất cả đều trong giới hạn độ trễ của giọng nói. OpenAI là nhà cung cấp duy nhất đáp ứng cả ba.”
Trong ngành ngân hàng, các tương tác với khách hàng được chi phối bởi các quy trình vận hành chuẩn (SOP) xác định điều gì cần xảy ra ở từng bước.
Một tương tác điển hình với khách hàng có thể diễn ra như sau:
- Khách hàng gọi điện để báo mất thẻ.
- Hệ thống xác minh danh tính của họ, xử lý các điều chỉnh và gián đoạn trong thời gian thực.
- Sau khi xác minh, hệ thống khóa thẻ và khởi tạo cấp thẻ thay thế.
- Hệ thống trả lời các câu hỏi tiếp theo, như thời gian giao thẻ, và gợi ý các bước tiếp theo.
Mỗi bước đều tuân theo một quy trình xác định, với các quyết định được đưa ra trong thời gian thực dựa trên thông tin đầu vào của người dùng, ngữ cảnh, các cơ chế kiểm soát đang chạy, cùng phản hồi của cả khách hàng lẫn tác nhân để đảm bảo tuân thủ.
“Mô hình cần duy trì trạng thái quy trình ngay cả khi có gián đoạn, trao đổi bên lề, và chuyển chủ đề, trong khi vẫn giữ tốc độ tạo phản hồi nhanh,” Antoniou nói. “Hầu hết các nhà cung cấp thậm chí còn không thể thử làm điều đó.”
Gradient Labs so sánh các nhà cung cấp dựa trên những quy trình thách thức nhất và đánh giá theo thứ họ gọi là độ chính xác quỹ đạo: liệu hệ thống có đi đúng lộ trình từ đầu đến cuối hay không.
Trong một trong những bài đánh giá ban đầu, GPT‑4.1 là mô hình duy nhất đạt 97% độ chính xác và tính nhất quán về quỹ đạo. Nhà cung cấp hiệu quả gần nhất tiếp theo đạt 88%.
“Trong dịch vụ tài chính, đó là khác biệt giữa việc giải quyết một cuộc gọi và tạo ra một sự cố về tuân thủ,” Antoniou nói.
Kết quả này đã định hình cách Gradient Labs thiết kế hệ thống của mình. Đội ngũ đã xây dựng một kiến trúc lai sử dụng các mô hình OpenAI cho những bước cần suy luận chuyên sâu và các mô hình nhỏ hơn cho các tác vụ nhanh hơn, ít biến động hơn, với cơ chế định tuyến thích ứng theo độ phức tạp và giới hạn độ trễ.
Ở bên trong, hệ thống được cấu thành từ các kỹ năng chuyên biệt do một tác nhân suy luận trung tâm điều phối, cho phép các trường hợp phức tạp di chuyển qua nhiều quy trình mà không đánh mất ngữ cảnh.
Với mỗi tương tác, hơn 15 hệ thống cơ chế kiểm soát chạy song song để bảo đảm các cuộc trò chuyện luôn nằm trong những ranh giới quy trình và tuân thủ đã xác định, bao gồm phát hiện tư vấn tài chính, tín hiệu cho thấy lỗ hổng quy trình, khiếu nại, và các nỗ lực vượt qua xác minh hoặc truy cập dữ liệu nhạy cảm.
Các tổ chức tài chính không triển khai những hệ thống như thế này chỉ bằng niềm tin. Họ cần thấy từng bước một rằng hệ thống hành xử đúng trong các điều kiện thực tế.
“Bạn phải thiết kế từ nền móng để loại bỏ ảo giác,” Antoniou nói. “Đó phải là nguyên tắc chỉ đạo trong suốt quá trình xây dựng.”
Để đánh giá cả mô hình mới lẫn mô hình hiện có, đội ngũ phát lại các cuộc trò chuyện thực của khách hàng và so sánh hành vi của hệ thống với quy trình được kỳ vọng. Họ cũng tạo ra các cuộc trò chuyện tổng hợp để kiểm thử các trường hợp biên và những tình huống hiếm gặp trước khi bất cứ thứ gì được triển khai.
Gradient Labs cũng trao cho các đội ngũ quyền kiểm soát cách hệ thống được giới thiệu. Họ phân tích dữ liệu hỗ trợ trong quá khứ để lập sơ đồ các loại vấn đề khách hàng mà một ngân hàng xử lý và tần suất xuất hiện của chúng. Sau đó, các đội ngũ có thể chọn những danh mục mà AI nên xử lý, bắt đầu với các quy trình có rủi ro thấp hơn rồi mở rộng theo thời gian.

Trước khi chính thức vận hành, khách hàng có thể mô phỏng các cuộc trò chuyện để xem lại cách hệ thống phản hồi trong những kịch bản khác nhau, từ đó xây dựng niềm tin rằng hệ thống hoạt động như mong đợi.
Việc triển khai thường bắt đầu với một tỷ lệ nhỏ lưu lượng, cùng hoạt động giám sát liên tục và các bước kiểm tra tự động để gắn cờ những cuộc trò chuyện có thể cần con người xem xét. Theo thời gian, phạm vi bao phủ được mở rộng khi hệ thống chứng minh hiệu năng nhất quán.
Khách hàng của Gradient Labs báo cáo điểm CSAT lên tới 98%, trong một số trường hợp còn vượt qua các tác nhân con người tốt nhất của họ. Phần lớn các đợt triển khai bắt đầu với tỷ lệ giải quyết trên 50% ngay từ ngày đầu, ngay cả với những quy trình phức tạp như tranh chấp, xác minh tài khoản, và gian lận.
Tác động đó được phản ánh trong tăng trưởng của công ty. Gradient Labs đã tăng doanh thu hơn 10 lần trong năm qua, mở rộng từ hỗ trợ bộ phận tiếp nhận (inbound) sang các quy trình xử lý đi (outbound) và vận hành nội bộ (back-office).
Trong tương lai, Gradient Labs tập trung vào các hệ thống có thể duy trì ngữ cảnh xuyên suốt nhiều tương tác: hiểu lịch sử của khách hàng, theo dõi các vấn đề đang diễn ra và tiếp tục từ chỗ các cuộc trò chuyện trước đã dừng lại. Hướng đi này gắn chặt với cách Gradient Labs nhìn nhận quan hệ đối tác dài hạn của mình với OpenAI.
“Chúng tôi không chỉ chọn một mô hình cho hôm nay. Chúng tôi đang xây dựng trên một nền tảng mà ở đó chúng tôi thấy quỹ đạo phát triển của các mô hình suy luận đi cùng hướng với sản phẩm của mình.”
Khi các mô hình tiếp tục được cải thiện, phạm vi quy trình có thể được tự động hóa an toàn cũng mở rộng. Với Gradient Labs, điều đó có nghĩa là tiến gần hơn tới một hệ thống nơi mọi tương tác với khách hàng đều được xử lý với cùng mức độ nhất quán, khả năng phán đoán và tính liên tục như một tác nhân con người hàng đầu.


