Gradient Labs giver alle bankkunder en AI-kontoadministrator
Gradient Labs bruger GPT‑4.1 og GPT‑5.4 mini og nano til at køre komplekse workflows for finansiel support med høj nøjagtighed og lav latenstid.

Resultater
10x
Omsætningsvækst
Resultater
98%
Kundetilfredshed med oplevelsen af AI-agenten
Resultater
+11%
Højere nøjagtighed med GPT-4.1 vs. næstbedste udbyder
I bankverdenen er det sjældent enkelt at løse et kundeproblem. Sager som svindel eller blokerede betalinger kræver streng overholdelse af komplekse procedurer på tværs af flere teams. Når systemer ikke slår til, bliver kunder sendt mellem teams, venter i kø og oplever forsinkelser, netop når risici er højest.
Gradient Labs(åbner i et nyt vindue) er bygget til at håndtere denne kompleksitet. Den London-baserede virksomhed bygger AI-agenter, der giver hver bankkunde oplevelsen af at have en dedikeret kontoadministrator. Virksomheden er grundlagt af et team, der tidligere stod i spidsen for AI- og dataarbejde hos Monzo, og platformen er bygget på OpenAI-modeller og flytter nu produktionstrafik over på GPT‑5.4 mini og nano.
“Vi ser en latenstid på 500 millisekunder med GPT‑5.4 mini og nano, hvilket er præcis det, vi har brug for til naturlige stemmesamtaler,” siger Danai Antoniou, medstifter og chefforsker hos Gradient Labs. “Vi flytter en betydelig del af vores workload over.”
“Vi havde samtidig brug for tre ting: nøjagtighed i at følge instruktioner, lave hallucinationsrater og pålidelighed i funktionskald, alt sammen under begrænsninger for stemmelatens. OpenAI var den eneste udbyder, der bestod på alle tre.”
I bankverdenen styres kundeinteraktioner af standardprocedurer (SOP'er), som definerer, hvad der skal ske i hvert trin.
En typisk kundeinteraktion kan se sådan ud:
- En kunde ringer for at anmelde et stjålet kort.
- Systemet verificerer kundens identitet og håndterer rettelser og afbrydelser i realtid.
- Når identiteten er bekræftet, spærrer det kortet og igangsætter bestilling af nyt kort.
- Det besvarer opfølgende spørgsmål, såsom leveringstid, og foreslår næste skridt.
Hvert trin følger en defineret procedure, hvor beslutninger træffes i realtid på baggrund af brugerinput, kontekst, aktive guardrails og både kunde- og agent-svar for at sikre compliance.
“Modellen skal kunne bevare proceduretilstanden på tværs af afbrydelser, backchannels og emneskift, samtidig med at svar genereres hurtigt,” siger Antoniou. “De fleste udbydere kunne ikke engang gøre forsøget.”
Gradient Labs benchmarker udbydere på deres mest udfordrende procedurer og evaluerer dem på det, de kalder trajectory accuracy: Om systemet følger den korrekte vej fra start til slut.
I en af deres første evalueringer var GPT‑4.1 den eneste model, der nåede 97 % trajectory accuracy og konsistens. Den næstbedste udbyder nåede 88 %.
“I finansielle tjenesteydelser er det forskellen mellem at løse et opkald og at skabe en compliance-hændelse,” siger Antoniou.
Dette resultat formede, hvordan Gradient Labs designede sit system. Teamet byggede en hybridarkitektur, der bruger OpenAI-modeller til ræsonneringstunge trin og mindre modeller til hurtigere, deterministiske opgaver, med routing der tilpasser sig efter kompleksitet og latenstidskrav.
Internt er systemet sammensat af specialiserede færdigheder, der orkestreres af en central ræsonneringsagent, så komplekse sager kan bevæge sig på tværs af workflows uden at miste kontekst.
For hver interaktion kører 15+ guardrail-systemer parallelt for at sikre, at samtaler holder sig inden for definerede procedurer og compliance-grænser, herunder registrering af finansiel rådgivning, sårbarhedssignaler, klager og forsøg på at omgå verifikation eller få adgang til følsomme data.
Finansielle institutioner implementerer ikke systemer som dette på tro alene. De har brug for at se trin for trin, at det opfører sig korrekt under virkelige forhold.
“Man er nødt til at udforme det helt fra bunden for at få nul hallucinationer,” siger Antoniou. “Det skal være det styrende princip, mens man bygger.”
For at evaluere både nye og eksisterende modeller genafspiller teamet rigtige kundesamtaler og sammenligner systemets adfærd med den forventede procedure. De genererer også kunstige samtaler for at teste edge cases og sjældne scenarier, før noget bliver implementeret.
Gradient Labs giver også teams kontrol over, hvordan systemet introduceres. De analyserer historiske supportdata for at kortlægge de typer kundeproblemer, en bank håndterer, og hvor ofte de forekommer. Teams kan derefter vælge, hvilke kategorier AI'en skal håndtere, begynde med workflows med lavere risiko og udvide over tid.

Før systemet går live, kan kunder simulere samtaler for at gennemgå, hvordan systemet reagerer i forskellige scenarier, hvilket skaber tillid til, at det opfører sig som forventet.
Implementeringen begynder typisk med en lille procentdel af trafikken, mens løbende overvågning og automatiserede kontroller markerer samtaler, der kan kræve menneskelig gennemgang. Over tid udvides dækningen, efterhånden som systemet demonstrerer stabil performance.
Gradient Labs’ kunder rapporterer CSAT-scorer på helt op til 98 % og overgår i nogle tilfælde deres bedste menneskelige agenter. De fleste implementeringer starter med løsningsrater på over 50 % fra dag ét, selv for komplekse workflows som tvister, kontoverifikation og svindel.
Den effekt afspejles i virksomhedens vækst. Gradient Labs har øget omsætningen med mere end 10x det seneste år og har udvidet fra indgående support til udgående og backoffice-processer.
Fremadrettet fokuserer Gradient Labs på systemer, der kan bevare kontekst på tværs af interaktioner: forstå en kundes historik, følge igangværende problemer og tage over, hvor tidligere samtaler sluttede. Denne retning stemmer tæt overens med, hvordan Gradient Labs ser på sit langsigtede partnerskab med OpenAI.
“Vi vælger ikke bare en model til i dag. Vi bygger på en platform, hvor vi ser, at udviklingen for ræsonneringsmodeller går i samme retning som vores produkt.”
Efterhånden som modellerne fortsætter med at blive bedre, udvides spektret af procedurer, der sikkert kan automatiseres. For Gradient Labs betyder det at komme tættere på et system, hvor hver kundeinteraktion håndteres med samme konsistens, dømmekraft og kontinuitet som af en menneskelig agent i topklasse.


