1. April 2026

Startup

Gradient Labs gibt allen Bankkund:innen einen KI-Kundenberater

Gradient Labs nutzt GPT‑4.1 sowie GPT‑5.4 mini und nano, um komplexe Finanz-Support-Workflows mit hoher Genauigkeit und niedriger Latenz auszuführen.

Projekt starten

Hintergrund mit Weichem, fließendem Farbverlauf in warmem Orange und Gelb, die in Türkis übergehen, mit einem weißen geometrischen Würfelsymbol neben dem Text „Gradient Labs“ zentriert auf dem Bild.

Unternehmensgröße: Startup

Region: Europa und das Vereinigte Königreich

Branche: Technologie, Finanzen

Produkte: API

Resultate

10x

Umsatzwachstum

Resultate

98%

Kundenzufriedenheit mit dem KI-Agenten-Erlebnis

Resultate

+11%

Höhere Genauigkeit mit GPT-4.1 im Vergleich zum nächstbesten Anbieter

Laden …

Im Bankwesen ist die Lösung eines Kundenproblems nur selten einfach. Fälle wie Betrug oder blockierte Zahlungen erfordern die strikte Einhaltung komplexer Verfahren über mehrere Teams hinweg. Wenn Systeme versagen, werden Kund:innen zwischen Teams weitergereicht, müssen in Warteschlangen ausharren und erleben Verzögerungen – in Momenten, in denen besonders viel auf dem Spiel steht.

Gradient Labs⁠(wird in einem neuen Fenster geöffnet) wurde entwickelt, um diese Komplexität zu bewältigen. Das in London ansässige Unternehmen entwickelt KI-Agenten, die allen Bankkund:innen die Erfahrung eines persönlichen Kundenberaters bieten. Das Unternehmen wurde von einem Team gegründet, das zuvor die KI- und Datenarbeit bei Monzo leitete. Seine Plattform basiert auf OpenAI-Modellen und verlagert derzeit den Produktionsdatenverkehr auf GPT‑5.4 mini und nano.

„Wir sehen mit GPT‑5.4 mini und nano eine Latenz von 500 Millisekunden – genau das, was wir für natürliche Sprachunterhaltungen brauchen“, sagt Danai Antoniou, Mitgründerin und Chief Scientist bei Gradient Labs. „Wir verlagern einen erheblichen Teil unserer Workloads dorthin.“

„Wir brauchten drei Dinge gleichzeitig: präzise Befolgung von Anweisungen, niedrige Halluzinationsraten und zuverlässige Funktionsaufrufe – und das alles unter Sprachlatenz-Beschränkungen. OpenAI war der einzige Anbieter, der bei allen drei Punkten bestand.“

Danai Antoniou, Mitgründerin und Chief Scientist bei Gradient Labs

Von SOPs zu Echtzeitsystemen

Im Bankwesen werden Kundeninteraktionen durch Standard Operating Procedures (SOPs) geregelt, die definieren, was in jedem Schritt passieren soll.

Eine typische Kundeninteraktion könnte so aussehen:

Ein:e Kund:in ruft an, um eine gestohlene Karte zu melden.
Das System verifiziert seine/ihre Identität und bewältigt Korrekturen und Unterbrechungen in Echtzeit.
Nach erfolgreicher Verifizierung sperrt es die Karte und veranlasst einen Ersatz.
Es beantwortet Anschlussfragen, etwa zum Lieferzeitpunkt, und schlägt die nächsten Schritte vor.

Jeder Schritt folgt einem definierten Verfahren, wobei Entscheidungen in Echtzeit auf Basis von Nutzereingaben, Kontext, geltenden Sicherheitsvorkehrungen sowie der Antworten von Kund:in und Agent getroffen werden, um die Compliance sicherzustellen.

„Das Modell muss den Verfahrensstatus trotz Unterbrechungen, Backchannels und Themenwechseln aufrechterhalten und gleichzeitig die Antwortgenerierung schnell halten“, sagt Antoniou. „Die meisten Anbieter könnten das nicht einmal versuchen.“

Gradient Labs vergleicht Anbieter anhand seiner anspruchsvollsten Verfahren und bewertet sie anhand einer Metrik, die das Unternehmen als Trajectory Accuracy bezeichnet: ob das System von Anfang bis Ende dem korrekten Pfad (Trajectory) folgt.

In einer seiner ersten Evaluierungen war GPT‑4.1 das einzige Modell, das 97 % Trajectory Accuracy und Konsistenz erreichte. Der nächstbeste Anbieter lag bei 88 %.

„Im Finanzdienstleistungsbereich ist das der Unterschied zwischen dem Lösen eines Anrufs und dem Auslösen eines Compliance-Vorfalls“, so Antoniou.

Dieses Resultat hat geprägt, wie Gradient Labs sein System gestaltet hat. Das Team entwickelte eine hybride Architektur, die OpenAI-Modelle für Reasoning-intensive Schritte und kleinere Modelle für schnellere, deterministische Aufgaben nutzt – mit einem Routing, das sich an Komplexität und Latenzgrenzen anpasst.

Intern besteht das System aus spezialisierten Fähigkeiten, die von einem zentralen Reasoning-Agenten orchestriert werden, sodass komplexe Fälle durch die verschiedenen Arbeitsabläufe geleitet werden können, ohne dass der Kontext verloren geht.

Bei jeder Interaktion laufen mehr als 15 Schutzmaßnahmen-Systeme parallel, um sicherzustellen, dass Gespräche innerhalb definierter Verfahren und Compliance-Grenzen bleiben. Dazu gehören die Erkennung von Finanzberatung, Hinweise auf Schwachstellen, Beschwerden sowie Versuche, Verifizierungen zu umgehen oder auf sensible Daten zuzugreifen.

Zuverlässigkeit in Hochrisikoumgebungen nachweisen

Finanzinstitute setzen Systeme wie dieses nicht einfach mit blindem Vertrauen ein. Sie müssen Schritt für Schritt sehen, dass es sich unter realen Bedingungen korrekt verhält.

„Die Architektur muss von Grund auf so geplant werden, dass es keine Halluzinationen gibt“, so Antoniou. „Das muss bei der Entwicklung das Leitprinzip sein.“

Um sowohl neue als auch bestehende Modelle zu bewerten, spielt das Team echte Kundengespräche erneut ab und vergleicht das Verhalten des Systems mit dem erwarteten Verfahren. Außerdem erzeugt es synthetische Gespräche, um Grenzfälle und seltene Szenarien zu testen, bevor überhaupt irgendetwas bereitgestellt wird.

Gradient Labs gibt Teams außerdem Kontrolle darüber, wie das System eingeführt wird. Das Unternehmen analysiert historische Supportdaten, um die Arten von Kundenanliegen zu erfassen, die eine Bank bearbeitet, und wie häufig sie auftreten. Teams können dann auswählen, welche Kategorien die KI übernehmen soll – angefangen mit Workflows mit geringerem Risiko, was im Laufe der Zeit ausgeweitet wird.

Dashboard-Oberfläche für ein Banking-Support-Tool mit einem Verfahren namens „Fraud impersonation callback“ und Schritt-für-Schritt-Anweisungen zur Verifizierung verdächtiger Zahlungen. Rechts erscheint ein Live-Anruftranskript mit Nachrichten zwischen einem KI-Agenten und einem Kunden, die die Identität bestätigen und einen Verifizierungscode zum Schutz des Kontos senden.

Bevor das System live geht, können Kund:innen Gespräche simulieren, um zu prüfen, wie das System in verschiedenen Szenarien reagiert, und so Vertrauen aufbauen, dass es sich wie erwartet verhält.

Die Bereitstellung beginnt typischerweise mit einem kleinen Prozentsatz des Traffics, wobei kontinuierliche Überwachung und automatisierte Prüfungen Gespräche melden, die möglicherweise eine menschliche Überprüfung erfordern. Mit der Zeit wird die Abdeckung erweitert, wenn das System eine konstant gute Leistung zeigt.

Impact vom ersten Tag an – und der Weg in die Zukunft

Die Kund:innen von Gradient Labs berichten von CSAT-Werten von bis zu 98 %, die in manchen Fällen ihre besten menschlichen Mitarbeiter:innen übertreffen. Die meisten Bereitstellungen starten bereits am ersten Tag mit Lösungsquoten von über 50 %, selbst bei komplexen Workflows wie Streitfällen, Kontoverifizierung und Betrug.

Dieser Impact zeigt sich auch im Wachstum des Unternehmens. Gradient Labs hat seinen Umsatz im vergangenen Jahr um mehr als das Zehnfache gesteigert und sein Geschäftsfeld vom Inbound-Support auf Outbound- und Backoffice-Prozesse ausgeweitet.

Mit Blick nach vorn konzentriert sich Gradient Labs auf Systeme, die den Kontext über verschiedene Interaktionen hinweg beibehalten können: die Historie eines Kunden verstehen, laufende Probleme nachverfolgen und dort anknüpfen, wo frühere Gespräche aufgehört haben. Diese Ausrichtung steht in engem Einklang damit, wie Gradient Labs seine langfristige Partnerschaft mit OpenAI sieht.

„Wir wählen nicht nur ein Modell für heute. Wir bauen auf einer Plattform auf, bei der wir sehen, dass sich die Entwicklung von Reasoning-Modellen in dieselbe Richtung bewegt wie unser Produkt.“

Danai Antoniou, Mitgründerin und Chief Scientist bei Gradient Labs

Mit der weiteren Verbesserung der Modelle erweitert sich das Spektrum der Verfahren, die sicher automatisiert werden können. Für Gradient Labs bedeutet das, einem System näherzukommen, in dem jede Kundeninteraktion mit derselben Konsistenz, Urteilskraft und Kontinuität bearbeitet wird wie von einem/einer erstklassigen menschlichen Mitarbeitenden.

OpenAI <3 Startups

Werde Teil der Community Jetzt loslegen

Mehr lesen

Alles anzeigen

Warps große Wette auf Open Source mit GPT-5.5

Startup27. Mai 2026

Parloa builds service agents customers want to talk to

Startup7. Mai 2026

How Descript engineers multilingual video dubbing at scale

Startup6. März 2026