Gradient Labs gir hver bankkunde en AI-drevet kunderådgiver
Gradient Labs bruker GPT‑4.1 og GPT‑5.4 mini og nano til å kjøre komplekse arbeidsflyter for finansiell kundestøtte med høy nøyaktighet og lav latens.

Resultater
10x
Omsetningsvekst
Resultater
98%
Kundetilfredshet med AI-agentopplevelsen
Resultater
+11%
Høyere nøyaktighet med GPT-4.1 sammenlignet med nest beste leverandør
I banksektoren er det sjelden enkelt å løse et kundeproblem. Saker som svindel eller blokkerte betalinger krever streng etterlevelse av komplekse prosedyrer på tvers av flere team. Når systemene ikke strekker til, blir kundene sendt fra team til team, satt i kø og møtt med forsinkelser når det er som mest kritisk.
Gradient Labs(åpnes i et nytt vindu) er bygget for å håndtere denne kompleksiteten. Selskapet, som holder til i London, bygger AI-agenter som gir hver bankkunde opplevelsen av å ha en dedikert kunderådgiver. Selskapet ble grunnlagt av et team som tidligere ledet AI- og dataarbeid i Monzo, og plattformen er bygget på OpenAI-modeller og flytter nå produksjonstrafikk over på GPT‑5.4 mini og nano.
«Vi ser 500 millisekunders latens med GPT‑5.4 mini og nano, noe som er akkurat det vi trenger for naturlige talesamtaler», sier medgründer og sjefsforsker Danai Antoniou i Gradient Labs. «Vi flytter en betydelig del av arbeidslasten vår over.»
«Vi trengte tre ting samtidig: nøyaktig instruksjonsfølging, lav forekomst av hallusinasjoner og pålitelig funksjonskalling, alt innenfor krav til lav stemmelatens. OpenAI var den eneste leverandøren som besto på alle tre.»
I banksektoren styres kundeinteraksjoner av standardprosedyrer (SOP-er) som definerer hva som skal skje i hvert trinn.
En typisk kundeinteraksjon kan se slik ut:
- En kunde ringer for å melde fra om et stjålet kort.
- Systemet verifiserer identiteten til vedkommende og håndterer korrigeringer og avbrudd i sanntid.
- Når identiteten er bekreftet, sperrer det kortet og setter i gang utsendelse av et nytt.
- Systemet svarer på oppfølgingsspørsmål, for eksempel om leveringstid, og foreslår neste trinn.
Hvert trinn følger en definert prosedyre, med beslutninger tatt i sanntid basert på informasjon fra brukeren, kontekst, aktive sikkerhetsmekanismer og både kunde- og agentrespons, for å sikre etterlevelse.
«Modellen må opprettholde prosedyretilstanden gjennom avbrytelser, tilbakemeldingslyder og emneskifter, samtidig som responsgenereringen må gå raskt», sier Antoniou. «De fleste leverandører ville ikke hatt sjans.»
Gradient Labs sammenligner leverandører på deres mest utfordrende prosedyrer og vurderer dem ut fra det de kaller forløpsnøyaktighet: om systemet følger riktig løp fra start til slutt.
I en av de første evalueringene var GPT‑4.1 den eneste modellen som nådde 97 % forløpsnøyaktighet og konsistens. Den nest nærmeste leverandøren lå på 88 %.
«I finanstjenester utgjør det forskjellen på å løse et kundeproblem og å skape et overholdelsesproblem», sier Antoniou.
Dette resultatet formet hvordan Gradient Labs utformet systemet sitt. Teamet bygget en hybridarkitektur som bruker OpenAI-modeller til trinn som krever mye resonnering, og mindre modeller til raskere, deterministiske oppgaver, med ruting som tilpasser seg etter kompleksitet og latensbegrensninger.
Internt består systemet av spesialiserte ferdigheter orkestrert av en sentral resonneringsagent, noe som gjør at komplekse saker kan gå gjennom en rekke arbeidsprosesser uten å miste kontekst.
For hver interaksjon kjører over 15 sikkerhetssystemer parallelt for å sikre at samtalene holder seg innenfor definerte prosedyrer og overholdelsesrammer, inkludert deteksjon av økonomisk rådgivning, sårbarhetssignaler, klager og forsøk på å omgå verifisering eller få tilgang til sensitive data.
Finansinstitusjoner tar ikke i bruk slike systemer basert på blind tillit. De må se, trinn for trinn, at det oppfører seg som det skal, under forhold i den virkelige verden.
«Du må bygge arkitekturen fra grunnen av for null hallusinasjoner», sier Antoniou. «Det må være det styrende prinsippet mens du bygger.»
For å evaluere både nye og eksisterende modeller spiller teamet av ekte kundesamtaler på nytt og sammenligner systemets oppførsel med den forventede prosedyren. De genererer også syntetiske samtaler for å teste ekstreme tilfeller og sjeldne scenarioer før noe rulles ut.
Gradient Labs gir også team kontroll over hvordan systemet innføres. De analyserer historiske støttedata for å kartlegge hvilke typer kundeproblemer en bank håndterer og hvor ofte de oppstår. Teamene kan deretter velge hvilke kategorier AI-en skal håndtere, med start i arbeidsflyter med lavere risiko og gradvis utvidelse over tid.

Før lansering kan kundene simulere samtaler for å se hvordan systemet svarer i ulike scenarioer, noe som bygger tillit til at det oppfører seg som forventet.
Utrulling starter vanligvis med en liten andel av trafikken, med kontinuerlig overvåking og automatiserte kontroller som flagger samtaler som kan kreve menneskelig gjennomgang. Over tid utvides dekningen etter hvert som systemet viser stabil ytelse.
Gradient Labs’ kunder rapporterer CSAT-score på opptil 98 %, og i noen tilfeller overgår de sine beste menneskelige agenter. De fleste utrullinger starter med løsningsrater på over 50 % fra dag én, selv for komplekse arbeidsflyter som tvister, kontoverifisering og svindel.
Denne effekten gjenspeiles i selskapets vekst. Gradient Labs har mer enn tidoblet omsetningen det siste året, og utvidet fra innkommende kundestøtte til utgående og backoffice-prosesser.
I tiden fremover fokuserer Gradient Labs på systemer som kan opprettholde konteksten over alle interaksjonene: forstå en kundes historikk, følge opp pågående saker og ta opp igjen der tidligere samtaler slapp. Denne retningen er tett på linje med hvordan Gradient Labs ser på sitt langsiktige partnerskap med OpenAI.
«Vi velger ikke bare en modell for i dag. Vi bygger på en plattform der vi ser at utviklingen til resonneringsmodeller går i samme retning som produktet vårt.»
Etter hvert som modellene fortsetter å bli bedre, utvides spekteret av prosedyrer som kan automatiseres på en trygg måte. For Gradient Labs betyr det å komme nærmere et system der hver kundeinteraksjon håndteres med samme konsistens, dømmekraft og kontinuitet som en førsteklasses menneskelig agent.


