Gradient Labs offre un conseiller IA à chaque client bancaire
Gradient Labs utilise GPT‑4.1 ainsi que GPT‑5.4 mini et nano pour exécuter des flux de travail complexes d’assistance financière avec une grande précision et une faible latence.

Résultats
10x
Croissance du chiffre d’affaires
Résultats
98%
Satisfaction client au regard de son expérience avec l’agent IA
Résultats
+11%
Une précision supérieure avec GPT-4.1 par rapport au deuxième meilleur fournisseur
Dans le secteur bancaire, résoudre un problème client est rarement simple. Des cas comme la fraude ou les paiements bloqués exigent le respect strict de procédures complexes impliquant plusieurs équipes. Lorsque les systèmes montrent leurs limites, les clients sont redirigés d’une équipe à l’autre, attendent en file et subissent des délais au moment où les enjeux sont les plus critiques.
Gradient Labs(ouverture dans une nouvelle fenêtre) est conçu pour gérer cette complexité. Basée à Londres, l’entreprise développe des agents IA qui offrent à chaque client bancaire l’expérience d’un conseiller dédié. Fondée par une équipe ayant auparavant dirigé les initiatives en IA et en données chez Monzo, sa plateforme repose sur les modèles OpenAI et oriente désormais son trafic de production vers GPT‑5.4 mini et nano.
« Nous observons une latence de 500 millisecondes avec GPT‑5.4 mini et nano, ce qui correspond exactement à nos besoins pour des conversations vocales naturelles », explique Danai Antoniou, cofondatrice et directrice scientifique de Gradient Labs. « Nous transférons une part importante de notre charge de travail vers ces modèles. »
« Nous avions besoin de trois choses simultanément : une grande précision dans le suivi des instructions, un faible taux d’hallucinations et une fiabilité des appels de fonctions, le tout avec des contraintes de latence en mode vocal. OpenAI était le seul fournisseur à répondre à ces trois critères. »
Dans le secteur bancaire, les interactions clients sont régies par des procédures opérationnelles standard (SOP) qui définissent ce qui doit se passer à chaque étape.
Une interaction client typique peut se dérouler ainsi :
- Un client appelle pour signaler le vol de sa carte.
- Le système vérifie son identité, en gérant corrections et interruptions en temps réel.
- Une fois l’identité confirmée, il bloque la carte et lance son remplacement.
- Il répond aux questions de suivi, comme le délai de livraison, et suggère les prochaines étapes.
Chaque étape suit une procédure définie, avec des décisions prises en temps réel selon les entrées utilisateur, le contexte, les mesures actives et les réponses du client comme de l’agent afin d’assurer la conformité.
« Le modèle doit maintenir l’état de la procédure malgré les interruptions, les backchannels et les changements de sujet, tout en gardant une génération de réponse rapide », explique Antoniou. « La plupart des fournisseurs n’étaient même pas capables de l’envisager. »
Gradient Labs compare les fournisseurs sur leurs procédures les plus difficiles et les évalue selon ce qu’ils appellent la précision de trajectoire : savoir si le système suit le bon chemin du début à la fin.
Lors d’une de leurs évaluations initiales, GPT‑4.1 a été le seul modèle à atteindre 97 % de précision et de cohérence de trajectoire. Le fournisseur le plus proche atteignait 88 %.
« Dans les services financiers, c’est la différence entre résoudre un appel et créer un incident de conformité », précise Antoniou.
Ce résultat a influencé la conception du système chez Gradient Labs. L’équipe a mis en place une architecture hybride qui utilise les modèles OpenAI pour les étapes nécessitant un raisonnement approfondi, et des modèles plus légers pour les tâches rapides et déterministes, avec un routage qui s’adapte en fonction de la complexité et des contraintes de latence.
En interne, le système se compose de compétences spécialisées orchestrées par un agent de raisonnement central, ce qui permet aux cas complexes de passer d’un flux de travail à l’autre sans perdre le contexte.
Pour chaque interaction, plus de 15 systèmes de mesures fonctionnent en parallèle afin de garantir que les conversations restent dans le cadre des procédures définies et des exigences de conformité, notamment la détection de conseils financiers, de signaux de vulnérabilité, de plaintes et de tentatives de contournement des vérifications ou d’accès à des données sensibles.
Les institutions financières ne déploient pas ce type de système sur un simple acte de confiance. Elles doivent pouvoir vérifier, étape par étape, qu’il se comporte correctement dans des conditions réelles.
« Il faut concevoir l’architecture dès le départ pour qu’il n’y ait aucune hallucination », explique Antoniou. « Cela doit être le principe directeur tout au long de la construction. »
Pour évaluer les modèles, nouveaux comme existants, l’équipe rejoue de véritables conversations clients et compare le comportement du système aux procédures attendues. Elle génère également des conversations synthétiques afin de tester des cas limites et des scénarios rares avant tout déploiement.
Gradient Labs permet également aux équipes de maîtriser le déploiement du système. Elles analysent les données historiques du support afin de cartographier les types de demandes clients traitées par la banque et leur fréquence. Les équipes peuvent ensuite définir les catégories que l’IA doit prendre en charge, en commençant par des flux à faible risque puis en élargissant progressivement.

Avant la mise en production, les clients peuvent simuler des conversations afin d’évaluer les réponses du système dans différents scénarios, et s’assurer qu’il se comporte comme attendu.
Le déploiement commence généralement avec un faible pourcentage du trafic, avec une surveillance continue et des contrôles automatisés signalant les conversations pouvant nécessiter une revue humaine. Avec le temps, la couverture s’étend alors que le système démontre des performances constantes.
Les clients de Gradient Labs enregistrent des scores de satisfaction (CSAT) pouvant atteindre 98 %, dépassant dans certains cas les performances de leurs meilleurs agents humains. La plupart des déploiements démarrent avec des taux de résolution supérieurs à 50 % dès le premier jour, y compris pour des flux complexes comme les litiges, la vérification de compte et la fraude.
Ces résultats se reflètent dans la croissance de l’entreprise. Gradient Labs a multiplié son chiffre d’affaires par plus de 10 au cours de l’année écoulée, en s’étendant du support entrant vers les processus sortants et les opérations back-office.
Pour la suite, Gradient Labs se concentre sur des systèmes capables de conserver le contexte d’une interaction à l’autre : comprendre l’historique d’un client, suivre les problèmes en cours et reprendre là où les conversations précédentes se sont arrêtées. Cette orientation est étroitement alignée sur la façon dont Gradient Labs envisage son partenariat de long terme avec OpenAI.
« Il ne s’agit pas simplement d’un choix à court terme. Nous construisons sur une plateforme dont l’évolution des modèles de raisonnement va dans le même sens que notre produit. »
Alors que les modèles continuent de s’améliorer, l’éventail des procédures pouvant être automatisées en toute sécurité s’élargit. Pour Gradient Labs, cela signifie se rapprocher d’un système où chaque interaction client est gérée avec la même cohérence, le même jugement et la même continuité qu’un agent humain de premier plan.


