Gradient Labs memberi manajer akun AI kepada tiap nasabah bank
Gradient Labs menggunakan GPT‑4.1 serta GPT‑5.4 mini dan nano untuk menjalankan alur kerja dukungan keuangan yang kompleks dengan akurasi tinggi dan latensi rendah.

Hasil
10x
Pertumbuhan pendapatan
Hasil
98%
Kepuasan pelanggan terhadap pengalaman agen AI
Hasil
+11%
Akurasi lebih tinggi dengan GPT-4.1 dibanding penyedia terbaik di urutan berikutnya
Dalam dunia perbankan, penyelesaian masalah pelanggan jarang sekali merupakan hal yang sederhana. Kasus-kasus seperti penipuan atau pembayaran yang terblokir menuntut kepatuhan ketat terhadap prosedur yang rumit di berbagai tim. Ketika sistem gagal berfungsi optimal, pelanggan justru dilempar dari satu tim ke tim lain, harus mengantre, dan menghadapi penundaan tepat pada saat-saat di mana urgensi dan risikonya berada di titik tertinggi.
Gradient Labs(terbuka di jendela baru) dibangun untuk menangani kompleksitas ini. Perusahaan yang berbasis di London ini membangun agen AI yang memberi pengalaman seperti memiliki manajer akun khusus kepada setiap nasabah bank. Didirikan oleh tim yang sebelumnya memimpin upaya AI dan data di Monzo, platform perusahaan ini dibangun di atas model OpenAI dan kini sedang mengalihkan trafik produksi ke GPT‑5.4 mini dan nano.
“Kami melihat latensi 500 milidetik dengan GPT‑5.4 mini dan nano, yang persis kami butuhkan untuk percakapan suara yang alami,” kata Danai Antoniou, Co-Founder dan Kepala Ilmuwan di Gradient Labs. “Kami sedang memindahkan porsi besar beban kerja kami ke sana.”
“Kami membutuhkan tiga hal sekaligus: akurasi dalam mengikuti instruksi, tingkat halusinasi rendah, dan keandalan pemanggilan fungsi, semuanya harus terpenuhi dalam batasan latensi suara. OpenAI adalah satu-satunya penyedia yang berhasil memenuhi ketiganya.”
Dalam perbankan, interaksi pelanggan diatur oleh standard operating procedures (SOP) yang menentukan apa yang harus terjadi pada setiap langkah.
Interaksi pelanggan yang umum mungkin terlihat seperti ini:
- Seorang pelanggan menelepon untuk melaporkan kartu yang dicuri.
- Sistem memverifikasi identitas mereka, menangani koreksi dan interupsi secara real time.
- Setelah terverifikasi, sistem membekukan kartu dan memulai penggantian.
- Sistem menjawab pertanyaan lanjutan, seperti waktu pengiriman, dan menyarankan langkah berikutnya.
Setiap langkah mengikuti prosedur yang telah ditetapkan, dengan keputusan dibuat secara real time berdasarkan input pengguna, konteks, batasan pengamanan yang berjalan, serta respons pelanggan dan agen untuk memastikan kepatuhan.
“Model harus mempertahankan status prosedur di tengah interupsi, backchannel, dan pergantian topik sambil tetap memastikan pembuatan respons cepat,” kata Antoniou. “Sebagian besar penyedia bahkan tidak bisa mencobanya.”
Gradient Labs membandingkan para penyedia pada prosedur mereka yang paling menantang dan mengevaluasi mereka berdasarkan apa yang mereka sebut akurasi trajektori: apakah sistem mengikuti jalur yang benar dari awal hingga akhir.
Dalam salah satu evaluasi awal mereka, GPT‑4.1 adalah satu-satunya model yang mencapai akurasi dan konsistensi trajektori sebesar 97%. Penyedia terdekat berikutnya meraih 88%.
“Dalam layanan keuangan, itulah perbedaan antara menyelesaikan panggilan dan menciptakan insiden kepatuhan,” kata Antoniou.
Hasil ini membentuk cara Gradient Labs merancang sistemnya. Tim membangun arsitektur hibrida yang menggunakan model OpenAI untuk langkah-langkah yang intensif penalaran dan model yang lebih kecil untuk tugas yang lebih cepat dan deterministik, dengan routing yang menyesuaikan berdasarkan kompleksitas dan batas latensi.
Secara internal, sistem ini terdiri dari keterampilan khusus yang diorkestrasi oleh agen penalaran yang terpusat, sehingga kasus kompleks dapat berpindah antar alur kerja tanpa kehilangan konteks.
Untuk setiap interaksi, lebih dari 15 sistem batasan pengamanan berjalan paralel untuk memastikan percakapan tetap berada dalam prosedur yang ditetapkan dan batas kepatuhan, termasuk deteksi nasihat keuangan, sinyal kerentanan, keluhan, dan upaya untuk melewati verifikasi atau mengakses data sensitif.
Lembaga keuangan tidak menerapkan sistem seperti ini hanya berdasarkan keyakinan. Mereka perlu melihat, langkah demi langkah, bahwa sistem ini berperilaku benar dalam kondisi dunia nyata.
“Anda harus merancang dari nol agar tidak ada halusinasi,” kata Antoniou. “Itu harus menjadi prinsip panduan saat Anda membangunnya.”
Untuk mengevaluasi model baru maupun yang sudah ada, tim memutar ulang percakapan asli pelanggan dan membandingkan perilaku sistem dengan prosedur yang diharapkan. Mereka juga membuat percakapan sintetis untuk menguji kasus tepi dan skenario langka sebelum apa pun diterapkan.
Gradient Labs juga memberi kendali kepada tim atas bagaimana sistem diperkenalkan. Mereka menganalisis data dukungan historis untuk memetakan jenis masalah pelanggan yang ditangani bank dan seberapa sering masalah itu terjadi. Tim kemudian dapat memilih kategori mana yang harus ditangani AI, dimulai dari alur kerja berisiko lebih rendah dan berkembang seiring waktu.

Sebelum ditayangkan, pelanggan dapat mensimulasikan percakapan untuk meninjau bagaimana sistem merespons di berbagai skenario, membangun keyakinan bahwa sistem berperilaku seperti yang diharapkan.
Penerapan biasanya dimulai dengan persentase trafik yang kecil, dengan pemantauan berkelanjutan dan pemeriksaan otomatis yang menandai percakapan yang mungkin memerlukan tinjauan manusia. Seiring waktu, cakupan meluas saat sistem menunjukkan kinerja yang konsisten.
Pelanggan Gradient Labs melaporkan skor CSAT setinggi 98%, dalam beberapa kasus mengungguli agen manusia terbaik mereka. Sebagian besar penerapan dimulai dengan tingkat penyelesaian di atas 50% pada hari pertama, bahkan untuk alur kerja kompleks seperti sengketa, verifikasi akun, dan penipuan.
Dampak itu tercermin dalam pertumbuhan perusahaan. Gradient Labs telah meningkatkan pendapatan lebih dari 10 kali lipat selama setahun terakhir, berkembang dari dukungan inbound ke proses outbound dan back-office.
Ke depannya, Gradient Labs berfokus pada sistem yang dapat membawa konteks lintas interaksi: memahami riwayat pelanggan, melacak masalah yang sedang berlangsung, dan melanjutkan dari titik terakhir percakapan sebelumnya. Arah ini sangat selaras dengan cara Gradient Labs memandang kemitraan jangka panjangnya dengan OpenAI.
“Kami tidak hanya memilih model untuk hari ini. Kami membangun berdasarkan platform di mana kami melihat arah perkembangan model penalaran selaras dengan produk kami.”
Seiring dengan terus meningkatnya model, rentang prosedur yang dapat diotomatisasi dengan aman pun meluas. Bagi Gradient Labs, itu berarti semakin mendekati sistem di mana setiap interaksi pelanggan ditangani dengan konsistensi, penilaian, dan kesinambungan yang sama seperti agen manusia kelas atas.


