Gradient Labs svakom klijentu banke omogućava AI voditelja računa
Gradient Labs koristi GPT‑4.1 te GPT‑5.4 mini i nano za upravljanje složenim procesima korisničke podrške u financijama uz visoku točnost i nisku latenciju.

Rezultati
10x
Rast prihoda
Rezultati
98%
Zadovoljstvo korisnika iskustvom s AI agentom
Rezultati
+11%
Veća točnost s modelom GPT-4.1 u odnosu na sljedećeg najboljeg pružatelja
. Rješavanje problema korisnika u bankarstvu rijetko je jednostavno. Slučajevi poput prijevare ili blokiranih plaćanja zahtijevaju strogo pridržavanje složenih procedura u više timova. Kad sustavi zakažu, korisnici se prebacuju između timova, čekaju u redovima i suočavaju se s kašnjenjima u trenucima kad su ulozi najveći.
Gradient Labs(otvara se u novom prozoru) razvijen je kako bi se nosio s tom složenošću. Tvrtka sa sjedištem u Londonu razvija AI agente koji svakom bankovnom klijentu pružaju iskustvo osobnog voditelja računa. Tvrtku je osnovao tim koji je prethodno vodio AI i podatkovne inicijative u Monzu, a njezina je platforma izgrađena na OpenAI-jevim modelima te sad preusmjerava produkcijski promet na GPT‑5.4 mini i nano.
„Vidimo latenciju od 500 milisekundi s GPT‑5.4 mini i nano, a to je točno ono što nam treba za prirodne glasovne razgovore”, kaže Danai Antoniou, suosnivačica i glavna znanstvenica u Gradient Labsu. „Premještamo značajan dio svog opterećenja.”
„Trebale su nam istodobno tri stvari: precizno praćenje uputa, niska stopa halucinacija i pouzdano pozivanje funkcija, sve uz ograničenja latencije glasa. OpenAI je bio jedini pružatelj koji je zadovoljio sva tri kriterija.”
U bankarstvu korisničkim interakcijama upravljaju standardni operativni postupci (SOP-ovi) koji definiraju što se treba dogoditi u svakom koraku.
Tipična korisnička interakcija može izgledati ovako:
- Korisnik zove kako bi prijavio ukradenu karticu.
- Sustav potvrđuje njegov identitet, pritom u stvarnom vremenu obrađuje ispravke i prekide.
- Nakon potvrde blokira karticu i pokreće izdavanje zamjenske kartice.
- Odgovara na dodatna pitanja, poput roka isporuke, i predlaže sljedeće korake.
Svaki korak slijedi definirani postupak, a odluke se donose u stvarnom vremenu na temelju informacija korisnika, aktivnih zaštitnih mehanizama te odgovora korisnika i agenta kako bi se osigurala usklađenost.
„Model mora održavati stanje procedure kroz prekide, usputne potvrde i promjene teme, a pritom zadržati brzo generiranje odgovora”, kaže Antoniou. „Većina pružatelja to nije mogla ni pokušati.”
Gradient Labs uspoređuje pružatelje na najzahtjevnijim procedurama i procjenjuje ih prema onome što nazivaju točnošću putanje: slijedi li sustav ispravan tijek od početka do kraja.
U jednoj od početnih evaluacija, GPT‑4.1 bio je jedini model koji je dosegnuo 97 % točnosti i dosljednosti putanje. Sljedeći najbliži pružatelj bio je na 88 %.
„U financijskim uslugama to je razlika između rješavanja poziva i izazivanja regulatornog incidenta”, kaže Antoniou”, kaže Antoniou.
Taj je rezultat oblikovao način na koji je Gradient Labs osmislio svoj sustav. Tim je razvio hibridnu arhitekturu koja koristi modele OpenAI za korake koji zahtijevaju složeno zaključivanje te manje modele za brže, determinističke zadatke, uz usmjeravanje koje se prilagođava složenosti i ograničenjima latencije.
Interno, sustav se sastoji od specijaliziranih vještina kojima upravlja središnji agent za rasuđivanje, što omogućuje da se složeni slučajevi kreću kroz tijekove rada bez gubitka konteksta.
Za svaku interakciju paralelno radi više od 15 zaštitnih sustava kako bi se osiguralo da razgovori ostanu unutar definiranih procedura i granica usklađenosti, uključujući otkrivanje financijskih savjeta, signale ranjivosti, pritužbe te pokušaje zaobilaženja provjere ili pristupa osjetljivim podacima.
Financijske institucije ne uvode ovakve sustave na temelju vjere. Moraju vidjeti, korak po korak, da se ponašaju ispravno u stvarnim uvjetima.
„Arhitekturu morate graditi od temelja tako da nema halucinacija”, kaže Antoniou. „To mora biti vodeće načelo tijekom razvoja.”
Kako bi procijenio nove i postojeće modele, tim ponovno reproducira stvarne korisničke razgovore i uspoređuje ponašanje sustava s očekivanom procedurom. Također generiraju sintetičke razgovore kako bi testirali rubne slučajeve i rijetke scenarije prije bilo kakvog puštanja u rad.
Gradient Labs timovima također daje kontrolu nad načinom uvođenja sustava. Analiziraju povijesne podatke podrške kako bi mapirali vrste korisničkih problema koje banka rješava te njihovu učestalost. Timovi zatim mogu odabrati kategorije koje AI treba obrađivati, počevši s tijekovima rada nižeg rizika i postupno se širiti.

Prije puštanja u rad korisnici mogu simulirati razgovore kako bi provjerili kako sustav reagira u različitim scenarijima i stekli povjerenje da se ponaša kako se očekuje.
Uvođenje obično počinje s malim postotkom prometa, uz kontinuirano praćenje i automatizirane provjere koje označavaju razgovore koji bi mogli zahtijevati ljudski pregled. S vremenom se obuhvat širi kako sustav pokazuje dosljedne rezultate.
Klijenti Gradient Labsa prijavljuju CSAT rezultate i do 98 %, a u nekim slučajevima nadmašuju svoje najbolje ljudske agente. Većina implementacija počinje sa stopama rješavanja većima od 50 % prvog dana, čak i za složene tijekove rada poput sporova, provjere računa i prijevare.
Taj se učinak odražava u rastu tvrtke. Gradient Labs je u protekloj godini povećao prihode više od 10 puta te se proširio s ulazne podrške na izlazne i back-office procese.
Gledajući unaprijed, Gradient Labs usmjeren je na sustave koji mogu zadržati kontekst kroz različite interakcije: razumjeti povijest korisnika, pratiti otvorene slučajeve i nastaviti ondje gdje su prethodni razgovori stali. Taj je smjer usko usklađen s načinom na koji Gradient Labs promišlja svoje dugoročno partnerstvo s OpenAI-jem.
„Ne biramo samo model za danas. Gradimo na platformi na kojoj vidimo da se putanja modela za rasuđivanje kreće u istom smjeru kao i naš proizvod.”
Kako se modeli nastavljaju poboljšavati, širi se i raspon procedura koje se mogu sigurno automatizirati. Za Gradient Labs to znači približavanje sustavu u kojem se svaka korisnička interakcija rješava s istom dosljednošću, prosudbom i kontinuitetom kao kod vrhunskog ljudskog agenta.


