Gradient Labs gibt allen Bankkund:innen einen KI-Kundenberater
Gradient Labs nutzt GPT‑4.1 sowie GPT‑5.4 mini und nano, um komplexe Finanz-Support-Workflows mit hoher Genauigkeit und niedriger Latenz auszuführen.

Resultate
10x
Umsatzwachstum
Resultate
98%
Kundenzufriedenheit mit dem KI-Agenten-Erlebnis
Resultate
+11%
Höhere Genauigkeit mit GPT-4.1 im Vergleich zum nächstbesten Anbieter
Im Bankwesen ist die Lösung eines Kundenproblems nur selten einfach. Fälle wie Betrug oder blockierte Zahlungen erfordern die strikte Einhaltung komplexer Verfahren über mehrere Teams hinweg. Wenn Systeme versagen, werden Kund:innen zwischen Teams weitergereicht, müssen in Warteschlangen ausharren und erleben Verzögerungen – in Momenten, in denen besonders viel auf dem Spiel steht.
Gradient Labs(wird in einem neuen Fenster geöffnet) wurde entwickelt, um diese Komplexität zu bewältigen. Das in London ansässige Unternehmen entwickelt KI-Agenten, die allen Bankkund:innen die Erfahrung eines persönlichen Kundenberaters bieten. Das Unternehmen wurde von einem Team gegründet, das zuvor die KI- und Datenarbeit bei Monzo leitete. Seine Plattform basiert auf OpenAI-Modellen und verlagert derzeit den Produktionsdatenverkehr auf GPT‑5.4 mini und nano.
„Wir sehen mit GPT‑5.4 mini und nano eine Latenz von 500 Millisekunden – genau das, was wir für natürliche Sprachunterhaltungen brauchen“, sagt Danai Antoniou, Mitgründerin und Chief Scientist bei Gradient Labs. „Wir verlagern einen erheblichen Teil unserer Workloads dorthin.“
„Wir brauchten drei Dinge gleichzeitig: präzise Befolgung von Anweisungen, niedrige Halluzinationsraten und zuverlässige Funktionsaufrufe – und das alles unter Sprachlatenz-Beschränkungen. OpenAI war der einzige Anbieter, der bei allen drei Punkten bestand.“
Im Bankwesen werden Kundeninteraktionen durch Standard Operating Procedures (SOPs) geregelt, die definieren, was in jedem Schritt passieren soll.
Eine typische Kundeninteraktion könnte so aussehen:
- Ein:e Kund:in ruft an, um eine gestohlene Karte zu melden.
- Das System verifiziert seine/ihre Identität und bewältigt Korrekturen und Unterbrechungen in Echtzeit.
- Nach erfolgreicher Verifizierung sperrt es die Karte und veranlasst einen Ersatz.
- Es beantwortet Anschlussfragen, etwa zum Lieferzeitpunkt, und schlägt die nächsten Schritte vor.
Jeder Schritt folgt einem definierten Verfahren, wobei Entscheidungen in Echtzeit auf Basis von Nutzereingaben, Kontext, geltenden Sicherheitsvorkehrungen sowie der Antworten von Kund:in und Agent getroffen werden, um die Compliance sicherzustellen.
„Das Modell muss den Verfahrensstatus trotz Unterbrechungen, Backchannels und Themenwechseln aufrechterhalten und gleichzeitig die Antwortgenerierung schnell halten“, sagt Antoniou. „Die meisten Anbieter könnten das nicht einmal versuchen.“
Gradient Labs vergleicht Anbieter anhand seiner anspruchsvollsten Verfahren und bewertet sie anhand einer Metrik, die das Unternehmen als Trajectory Accuracy bezeichnet: ob das System von Anfang bis Ende dem korrekten Pfad (Trajectory) folgt.
In einer seiner ersten Evaluierungen war GPT‑4.1 das einzige Modell, das 97 % Trajectory Accuracy und Konsistenz erreichte. Der nächstbeste Anbieter lag bei 88 %.
„Im Finanzdienstleistungsbereich ist das der Unterschied zwischen dem Lösen eines Anrufs und dem Auslösen eines Compliance-Vorfalls“, so Antoniou.
Dieses Resultat hat geprägt, wie Gradient Labs sein System gestaltet hat. Das Team entwickelte eine hybride Architektur, die OpenAI-Modelle für Reasoning-intensive Schritte und kleinere Modelle für schnellere, deterministische Aufgaben nutzt – mit einem Routing, das sich an Komplexität und Latenzgrenzen anpasst.
Intern besteht das System aus spezialisierten Fähigkeiten, die von einem zentralen Reasoning-Agenten orchestriert werden, sodass komplexe Fälle durch die verschiedenen Arbeitsabläufe geleitet werden können, ohne dass der Kontext verloren geht.
Bei jeder Interaktion laufen mehr als 15 Schutzmaßnahmen-Systeme parallel, um sicherzustellen, dass Gespräche innerhalb definierter Verfahren und Compliance-Grenzen bleiben. Dazu gehören die Erkennung von Finanzberatung, Hinweise auf Schwachstellen, Beschwerden sowie Versuche, Verifizierungen zu umgehen oder auf sensible Daten zuzugreifen.
Finanzinstitute setzen Systeme wie dieses nicht einfach mit blindem Vertrauen ein. Sie müssen Schritt für Schritt sehen, dass es sich unter realen Bedingungen korrekt verhält.
„Die Architektur muss von Grund auf so geplant werden, dass es keine Halluzinationen gibt“, so Antoniou. „Das muss bei der Entwicklung das Leitprinzip sein.“
Um sowohl neue als auch bestehende Modelle zu bewerten, spielt das Team echte Kundengespräche erneut ab und vergleicht das Verhalten des Systems mit dem erwarteten Verfahren. Außerdem erzeugt es synthetische Gespräche, um Grenzfälle und seltene Szenarien zu testen, bevor überhaupt irgendetwas bereitgestellt wird.
Gradient Labs gibt Teams außerdem Kontrolle darüber, wie das System eingeführt wird. Das Unternehmen analysiert historische Supportdaten, um die Arten von Kundenanliegen zu erfassen, die eine Bank bearbeitet, und wie häufig sie auftreten. Teams können dann auswählen, welche Kategorien die KI übernehmen soll – angefangen mit Workflows mit geringerem Risiko, was im Laufe der Zeit ausgeweitet wird.

Bevor das System live geht, können Kund:innen Gespräche simulieren, um zu prüfen, wie das System in verschiedenen Szenarien reagiert, und so Vertrauen aufbauen, dass es sich wie erwartet verhält.
Die Bereitstellung beginnt typischerweise mit einem kleinen Prozentsatz des Traffics, wobei kontinuierliche Überwachung und automatisierte Prüfungen Gespräche melden, die möglicherweise eine menschliche Überprüfung erfordern. Mit der Zeit wird die Abdeckung erweitert, wenn das System eine konstant gute Leistung zeigt.
Die Kund:innen von Gradient Labs berichten von CSAT-Werten von bis zu 98 %, die in manchen Fällen ihre besten menschlichen Mitarbeiter:innen übertreffen. Die meisten Bereitstellungen starten bereits am ersten Tag mit Lösungsquoten von über 50 %, selbst bei komplexen Workflows wie Streitfällen, Kontoverifizierung und Betrug.
Dieser Impact zeigt sich auch im Wachstum des Unternehmens. Gradient Labs hat seinen Umsatz im vergangenen Jahr um mehr als das Zehnfache gesteigert und sein Geschäftsfeld vom Inbound-Support auf Outbound- und Backoffice-Prozesse ausgeweitet.
Mit Blick nach vorn konzentriert sich Gradient Labs auf Systeme, die den Kontext über verschiedene Interaktionen hinweg beibehalten können: die Historie eines Kunden verstehen, laufende Probleme nachverfolgen und dort anknüpfen, wo frühere Gespräche aufgehört haben. Diese Ausrichtung steht in engem Einklang damit, wie Gradient Labs seine langfristige Partnerschaft mit OpenAI sieht.
„Wir wählen nicht nur ein Modell für heute. Wir bauen auf einer Plattform auf, bei der wir sehen, dass sich die Entwicklung von Reasoning-Modellen in dieselbe Richtung bewegt wie unser Produkt.“
Mit der weiteren Verbesserung der Modelle erweitert sich das Spektrum der Verfahren, die sicher automatisiert werden können. Für Gradient Labs bedeutet das, einem System näherzukommen, in dem jede Kundeninteraktion mit derselben Konsistenz, Urteilskraft und Kontinuität bearbeitet wird wie von einem/einer erstklassigen menschlichen Mitarbeitenden.


