1 April 2026

Startup

Gradient Labs memberi manajer akun AI kepada tiap nasabah bank

Gradient Labs menggunakan GPT‑4.1 serta GPT‑5.4 mini dan nano untuk menjalankan alur kerja dukungan keuangan yang kompleks dengan akurasi tinggi dan latensi rendah.

Mulai membangun

Latar belakang gradien yang lembut dan mengalir, memadukan warna oranye dan kuning hangat dengan warna teal, disertai ikon kubus geometris berwarna putih di samping teks "Gradient Labs" yang terletak di tengah gambar.

Ukuran perusahaan: Startup

Wilayah: Eropa & Inggris Raya

Industri: Teknologi, Keuangan

Produk: API

Hasil

10x

Pertumbuhan pendapatan

Hasil

98%

Kepuasan pelanggan terhadap pengalaman agen AI

Hasil

+11%

Akurasi lebih tinggi dengan GPT-4.1 dibanding penyedia terbaik di urutan berikutnya

Memuat…

Dalam dunia perbankan, penyelesaian masalah pelanggan jarang sekali merupakan hal yang sederhana. Kasus-kasus seperti penipuan atau pembayaran yang terblokir menuntut kepatuhan ketat terhadap prosedur yang rumit di berbagai tim. Ketika sistem gagal berfungsi optimal, pelanggan justru dilempar dari satu tim ke tim lain, harus mengantre, dan menghadapi penundaan tepat pada saat-saat di mana urgensi dan risikonya berada di titik tertinggi.

Gradient Labs⁠(terbuka di jendela baru) dibangun untuk menangani kompleksitas ini. Perusahaan yang berbasis di London ini membangun agen AI yang memberi pengalaman seperti memiliki manajer akun khusus kepada setiap nasabah bank. Didirikan oleh tim yang sebelumnya memimpin upaya AI dan data di Monzo, platform perusahaan ini dibangun di atas model OpenAI dan kini sedang mengalihkan trafik produksi ke GPT‑5.4 mini dan nano.

“Kami melihat latensi 500 milidetik dengan GPT‑5.4 mini dan nano, yang persis kami butuhkan untuk percakapan suara yang alami,” kata Danai Antoniou, Co-Founder dan Kepala Ilmuwan di Gradient Labs. “Kami sedang memindahkan porsi besar beban kerja kami ke sana.”

“Kami membutuhkan tiga hal sekaligus: akurasi dalam mengikuti instruksi, tingkat halusinasi rendah, dan keandalan pemanggilan fungsi, semuanya harus terpenuhi dalam batasan latensi suara. OpenAI adalah satu-satunya penyedia yang berhasil memenuhi ketiganya.”

Danai Antoniou, Co-Founder dan Kepala Ilmuwan di Gradient Labs

Beralih dari SOP ke sistem real time

Dalam perbankan, interaksi pelanggan diatur oleh standard operating procedures (SOP) yang menentukan apa yang harus terjadi pada setiap langkah.

Interaksi pelanggan yang umum mungkin terlihat seperti ini:

Seorang pelanggan menelepon untuk melaporkan kartu yang dicuri.
Sistem memverifikasi identitas mereka, menangani koreksi dan interupsi secara real time.
Setelah terverifikasi, sistem membekukan kartu dan memulai penggantian.
Sistem menjawab pertanyaan lanjutan, seperti waktu pengiriman, dan menyarankan langkah berikutnya.

Setiap langkah mengikuti prosedur yang telah ditetapkan, dengan keputusan dibuat secara real time berdasarkan input pengguna, konteks, batasan pengamanan yang berjalan, serta respons pelanggan dan agen untuk memastikan kepatuhan.

“Model harus mempertahankan status prosedur di tengah interupsi, backchannel, dan pergantian topik sambil tetap memastikan pembuatan respons cepat,” kata Antoniou. “Sebagian besar penyedia bahkan tidak bisa mencobanya.”

Gradient Labs membandingkan para penyedia pada prosedur mereka yang paling menantang dan mengevaluasi mereka berdasarkan apa yang mereka sebut akurasi trajektori: apakah sistem mengikuti jalur yang benar dari awal hingga akhir.

Dalam salah satu evaluasi awal mereka, GPT‑4.1 adalah satu-satunya model yang mencapai akurasi dan konsistensi trajektori sebesar 97%. Penyedia terdekat berikutnya meraih 88%.

“Dalam layanan keuangan, itulah perbedaan antara menyelesaikan panggilan dan menciptakan insiden kepatuhan,” kata Antoniou.

Hasil ini membentuk cara Gradient Labs merancang sistemnya. Tim membangun arsitektur hibrida yang menggunakan model OpenAI untuk langkah-langkah yang intensif penalaran dan model yang lebih kecil untuk tugas yang lebih cepat dan deterministik, dengan routing yang menyesuaikan berdasarkan kompleksitas dan batas latensi.

Secara internal, sistem ini terdiri dari keterampilan khusus yang diorkestrasi oleh agen penalaran yang terpusat, sehingga kasus kompleks dapat berpindah antar alur kerja tanpa kehilangan konteks.

Untuk setiap interaksi, lebih dari 15 sistem batasan pengamanan berjalan paralel untuk memastikan percakapan tetap berada dalam prosedur yang ditetapkan dan batas kepatuhan, termasuk deteksi nasihat keuangan, sinyal kerentanan, keluhan, dan upaya untuk melewati verifikasi atau mengakses data sensitif.

Membuktikan keandalan di lingkungan berisiko tinggi

Lembaga keuangan tidak menerapkan sistem seperti ini hanya berdasarkan keyakinan. Mereka perlu melihat, langkah demi langkah, bahwa sistem ini berperilaku benar dalam kondisi dunia nyata.

“Anda harus merancang dari nol agar tidak ada halusinasi,” kata Antoniou. “Itu harus menjadi prinsip panduan saat Anda membangunnya.”

Untuk mengevaluasi model baru maupun yang sudah ada, tim memutar ulang percakapan asli pelanggan dan membandingkan perilaku sistem dengan prosedur yang diharapkan. Mereka juga membuat percakapan sintetis untuk menguji kasus tepi dan skenario langka sebelum apa pun diterapkan.

Gradient Labs juga memberi kendali kepada tim atas bagaimana sistem diperkenalkan. Mereka menganalisis data dukungan historis untuk memetakan jenis masalah pelanggan yang ditangani bank dan seberapa sering masalah itu terjadi. Tim kemudian dapat memilih kategori mana yang harus ditangani AI, dimulai dari alur kerja berisiko lebih rendah dan berkembang seiring waktu.

Antarmuka dasbor untuk alat pendukung perbankan, menampilkan prosedur berjudul "Panggilan Balik Peniruan Identitas (Fraud Impersonation)" yang memuat instruksi langkah demi langkah untuk memverifikasi pembayaran yang mencurigakan. Di sisi kanan, ditampilkan transkrip panggilan langsung yang berisi pertukaran pesan antara agen AI dan seorang nasabah, guna mengonfirmasi identitas serta mengirimkan kode verifikasi demi mengamankan akun.

Sebelum ditayangkan, pelanggan dapat mensimulasikan percakapan untuk meninjau bagaimana sistem merespons di berbagai skenario, membangun keyakinan bahwa sistem berperilaku seperti yang diharapkan.

Penerapan biasanya dimulai dengan persentase trafik yang kecil, dengan pemantauan berkelanjutan dan pemeriksaan otomatis yang menandai percakapan yang mungkin memerlukan tinjauan manusia. Seiring waktu, cakupan meluas saat sistem menunjukkan kinerja yang konsisten.

Menunjukkan dampak sejak hari pertama, dan menapaki jalan ke depan

Pelanggan Gradient Labs melaporkan skor CSAT setinggi 98%, dalam beberapa kasus mengungguli agen manusia terbaik mereka. Sebagian besar penerapan dimulai dengan tingkat penyelesaian di atas 50% pada hari pertama, bahkan untuk alur kerja kompleks seperti sengketa, verifikasi akun, dan penipuan.

Dampak itu tercermin dalam pertumbuhan perusahaan. Gradient Labs telah meningkatkan pendapatan lebih dari 10 kali lipat selama setahun terakhir, berkembang dari dukungan inbound ke proses outbound dan back-office.

Ke depannya, Gradient Labs berfokus pada sistem yang dapat membawa konteks lintas interaksi: memahami riwayat pelanggan, melacak masalah yang sedang berlangsung, dan melanjutkan dari titik terakhir percakapan sebelumnya. Arah ini sangat selaras dengan cara Gradient Labs memandang kemitraan jangka panjangnya dengan OpenAI.

“Kami tidak hanya memilih model untuk hari ini. Kami membangun berdasarkan platform di mana kami melihat arah perkembangan model penalaran selaras dengan produk kami.”

Danai Antoniou, Co-Founder dan Kepala Ilmuwan di Gradient Labs

Seiring dengan terus meningkatnya model, rentang prosedur yang dapat diotomatisasi dengan aman pun meluas. Bagi Gradient Labs, itu berarti semakin mendekati sistem di mana setiap interaksi pelanggan ditangani dengan konsistensi, penilaian, dan kesinambungan yang sama seperti agen manusia kelas atas.

OpenAI <3 startup

Bergabunglah dengan komunitas Mulai membangun

Terus membaca

Lihat semua

Taruhan besar Warp membangun open source dengan GPT-5.5

Startup27 Mei 2026

Parloa builds service agents customers want to talk to

Startup7 Mei 2026

How Descript engineers multilingual video dubbing at scale

Startup6 Mar 2026