Gradient Labs ger varje bankkund en AI-kontoansvarig
Gradient Labs använder GPT‑4.1 samt GPT‑5.4 mini och nano för att driva komplexa finansiella supportflöden med hög precision och låg latens.

Resultat
10x
Intäktstillväxt
Resultat
98%
Kundnöjdhet med AI-agentupplevelsen
Resultat
+11%
Högre precision med GPT-4.1 jämfört med näst bästa leverantör
Inom bankverksamhet är det sällan enkelt att lösa ett kundärende. Fall som bedrägeri eller blockerade betalningar kräver strikt efterlevnad av komplexa procedurer mellan flera team. När systemen inte räcker till skickas kunder mellan teamen, får vänta i köer och drabbas av förseningar i stunder när insatserna är som högst.
Gradient Labs(öppnas i ett nytt fönster) är byggt för att hantera denna komplexitet. Det London-baserade företaget bygger AI-agenter som ger varje bankkund upplevelsen av en dedikerad kontoansvarig. Företaget grundades av ett team som tidigare ledde AI- och dataarbetet på Monzo. Plattformen är byggd på OpenAI-modeller och flyttar nu över produktionstrafiken till GPT‑5.4 mini och nano.
”Vi ser en latens på 500 millisekunder med GPT‑5.4 mini och nano, vilket är precis vad vi behöver för naturliga röstsamtal”, säger Danai Antoniou, medgrundare och chefsforskare på Gradient Labs. ”Vi flyttar över en betydande del av vår arbetsbelastning.”
”Vi behövde tre saker samtidigt: hög precision i att följa instruktioner, låg hallucinationsgrad och tillförlitliga funktionsanrop, allt inom röstlatensens begränsningar. OpenAI var den enda leverantören som klarade alla tre.”
Inom bankverksamhet styrs kundinteraktioner av standardrutiner (SOP:er) som definierar vad som ska hända i varje steg.
En typisk kundinteraktion kan se ut så här:
- En kund ringer för att anmäla ett stulet kort.
- Systemet verifierar identiteten och hanterar korrigeringar och avbrott i realtid.
- När identiteten har verifierats spärrar det kortet och en ersättningsprocedur påbörjas.
- Det besvarar följdfrågor, till exempel om leveranstid, och föreslår nästa steg.
Varje steg följer en definierad procedur, där beslut fattas i realtid baserat på användarinmatning, kontext, aktiva skyddsåtgärder, samt både kundens och agentens svar för att säkerställa efterlevnad.
”Modellen behöver bibehålla procedurens tillstånd över avbrott, bakkanaler och ämnesbyten samtidigt som svarsgenereringen förblir snabb”, säger Antoniou. ”De flesta leverantörer skulle inte ens kunna försöka.”
Gradient Labs skapar riktmärken för leverantörer utifrån deras mest utmanande procedurer och utvärderar dem enligt vad de kallar banprecision: om systemet följer rätt väg från början till slut.
I en av deras första utvärderingar var GPT‑4.1 den enda modellen som nådde 97 % banprecision och konsekvens. Närmast efter låg en annan leverantör på 88 %.
”Inom finansiella tjänster utgör detta skillnaden mellan att lösa ett ärende och att skapa en efterlevnadsincident”, säger Antoniou.
Detta resultat formade hur Gradient Labs utformade sitt system. Teamet byggde en hybridarkitektur som använder OpenAI-modeller för resonemangsintensiva steg och mindre modeller för snabbare, deterministiska uppgifter, med routning som anpassas efter komplexitet och latenskrav.
Internt består systemet av specialiserade förmågor som orkestreras av en central resonemangsagent, vilket gör att komplexa ärenden kan röra sig mellan arbetsflöden utan att tappa kontext.
För varje interaktion körs fler än 15 skyddssystem parallellt för att säkerställa att samtal håller sig inom definierade procedurer och efterlevnadsgränser, inklusive upptäckt av finansiell rådgivning, sårbarhetssignaler, klagomål och försök att kringgå verifiering eller få åtkomst till känsliga data.
Finansiella institutioner implementerar inte sådana här system på tilltro. De behöver se steg för steg att det beter sig korrekt under verkliga förhållanden.
”Man måste utforma från grunden för att utesluta hallucinationer”, säger Antoniou. ”Det måste vara den vägledande principen när man bygger.”
För att utvärdera både nya och befintliga modeller spelar teamet upp riktiga kundsamtal igen och jämför systemets beteende med den förväntade proceduren. De genererar också syntetiska samtal för att testa gränsfall och ovanliga scenarier innan något driftsätts.
Gradient Labs ger också teamen kontroll över hur systemet ska introduceras. De analyserar historiska supportdata för att kartlägga vilka typer av kundärenden en bank hanterar och hur ofta de förekommer. Teamen kan sedan välja vilka kategorier som ska hanteras av AI-systemet, med start i arbetsflöden med lägre risk och utökning över tid.

Innan lansering kan kunder simulera samtal för att granska hur systemet svarar i olika scenarier, vilket bygger förtroende för att det beter sig som förväntat.
Driftsättning börjar vanligtvis med en liten andel av trafiken, med kontinuerlig övervakning och automatiserade kontroller som flaggar samtal som kan kräva mänsklig granskning. Med tiden utökas täckningen i takt med att systemet visar konsekvent prestanda.
Gradient Labs kunder rapporterar CSAT-nivåer på upp till 98 % och överträffar i vissa fall deras bästa mänskliga agenter. De flesta driftsättningar startar med lösningsgrader över 50 % redan första dagen, även för komplexa arbetsflöden som tvister, kontoverifiering och bedrägerier.
Den effekten återspeglas i företagets tillväxt. Gradient Labs har ökat intäkterna med mer än 10 gånger under det senaste året och expanderat från inbound support till outbound och backoffice-processer.
Framöver fokuserar Gradient Labs på system som kan bära med sig kontext mellan interaktioner: förstå en kunds historik, följa pågående ärenden och ta vid där tidigare samtal slutade. Denna riktning ligger nära hur Gradient Labs ser på sitt långsiktiga partnerskap med OpenAI.
”Vi väljer inte bara en modell för i dag. Vi bygger på en plattform där vi ser att resonemangsmodellers utveckling går i samma riktning som vår produkt.”
Allt eftersom modeller fortsätter att förbättras utökas omfattningen av procedurer som kan automatiseras på ett säkert sätt. För Gradient Labs innebär det att komma närmare ett system där varje kundinteraktion hanteras med samma konsekvens, omdöme och kontinuitet som för en mänsklig supportmedarbetare i toppklass.


