1 de abril de 2026

Empresas emergentes

Gradient Labs da a cada cliente bancario un gestor con IA

Gradient Labs utiliza GPT‑4.1 y GPT‑5.4 mini y nano para ejecutar flujos complejos de soporte financiero con gran precisión y baja latencia.

Empezar a crear

Fondo degradado suave y fluido en tonos naranja cálido y amarillo que se funden con verde azulado, con un icono geométrico blanco en forma de cubo junto al texto «Gradient Labs», centrado en la imagen.

Tamaño de la empresa: Empresa emergente

Región: Europa y Reino Unido

Sector: Tecnología, Contabilidad

Productos: API

Resultados

10x

Crecimiento de ingresos

Resultados

98%

Satisfacción del cliente con la experiencia del agente de IA

Resultados

+11%

Mayor precisión con GPT-4.1 frente al siguiente mejor proveedor

Cargando…

En banca, resolver el problema de un cliente rara vez es sencillo. Casos como el fraude o los pagos bloqueados exigen cumplir procedimientos complejos en varios equipos. Cuando los sistemas no están a la altura, los clientes pasan de un equipo a otro, esperan en cola y sufren retrasos en momentos en los que hay mucho en juego.

La empresa Gradient Labs⁠(se abre en una ventana nueva) está diseñada para gestionar esta complejidad. Con sede en Londres, desarrolla agentes de IA que ofrecen a cada cliente bancario una experiencia similar a la de contar con un gestor personal. Fundada por un equipo que anteriormente lideró iniciativas de IA y datos en Monzo, su plataforma se basa en modelos de OpenAI y ahora está trasladando tráfico de producción a GPT‑5.4 mini y nano.

«Estamos viendo una latencia de 500 milisegundos con GPT‑5.4 mini y nano, que es exactamente lo que necesitamos para conversaciones de voz naturales», afirma Danai Antoniou, cofundadora y directora científica de Gradient Labs. «Estamos trasladando una parte importante de nuestra carga de trabajo».

«Necesitábamos tres cosas a la vez: precisión al seguir instrucciones, bajas tasas de alucinación y fiabilidad en la llamada a funciones, todo ello con restricciones de latencia de voz. OpenAI fue el único proveedor que cumplió en las tres».

Danai Antoniou, cofundadora y directora científica de Gradient Labs

Pasar de procesos operativos estándar (SOP) a sistemas en tiempo real

En banca, las interacciones con clientes se rigen por procedimientos operativos estándar (SOP) que definen lo que debe ocurrir en cada paso.

Una interacción típica con un cliente podría ser así:

Un cliente llama para informar de que le han robado la tarjeta.
El sistema verifica su identidad, gestionando correcciones e interrupciones en tiempo real.
Una vez verificada, bloquea la tarjeta e inicia una reposición.
Responde a preguntas de seguimiento, como los plazos de entrega, y sugiere los siguientes pasos.

Cada paso sigue un procedimiento definido, con decisiones que se toman en tiempo real según la información del usuario, el contexto, las barreras de protección activas y las respuestas tanto del cliente como del agente para garantizar el cumplimiento.

«El modelo debe mantener el estado del procedimiento a lo largo de interrupciones, turnos de conversación y cambios de tema, al tiempo que ofrece respuestas rápidas», afirma Antoniou. «La mayoría de los proveedores ni siquiera podían hacerlo».

Gradient Labs compara proveedores en sus procedimientos más exigentes y los evalúa según lo que llaman precisión de trayectoria: la capacidad del sistema para seguir el proceso de principio a fin.

En una de sus evaluaciones iniciales, GPT‑4.1 fue el único modelo que alcanzó un 97 % de precisión y consistencia de trayectoria. El proveedor más cercano se quedó en el 88 %.

«En servicios financieros, esa es la diferencia entre resolver una llamada y crear un incidente de cumplimiento», dice Antoniou.

Este resultado marcó la forma en que Gradient Labs diseñó su sistema. El equipo creó una arquitectura híbrida que utiliza modelos de OpenAI para los pasos que requieren un razonamiento intensivo y modelos más pequeños para tareas más rápidas y deterministas, con un sistema de enrutamiento que se adapta según la complejidad y las restricciones de latencia.

Internamente, el sistema está compuesto por capacidades especializadas orquestadas por un agente central de razonamiento, lo que permite que los casos complejos avancen entre flujos de trabajo sin perder contexto.

En cada interacción, más de 15 sistemas de salvaguardas se ejecutan en paralelo para garantizar que las conversaciones se mantengan dentro de los procedimientos definidos y los requisitos de cumplimiento, incluida la detección de asesoramiento financiero, señales de vulnerabilidad, reclamaciones e intentos de eludir la verificación o acceder a datos sensibles.

Demostrar fiabilidad en entornos de alto riesgo

Las entidades financieras no despliegan sistemas como este por fe. Necesitan ver, paso a paso, que se comporta correctamente en condiciones reales.

«Hay que diseñar desde cero para que no haya alucinaciones», afirma Antoniou. «Ese tiene que ser el principio rector durante el desarrollo».

Para evaluar tanto modelos nuevos como existentes, el equipo reproduce conversaciones reales con clientes y compara el comportamiento del sistema con el procedimiento esperado. También generan conversaciones sintéticas para probar casos límite y escenarios poco frecuentes antes de desplegar nada.

Gradient Labs también da a los equipos control sobre la implantación del sistema. Para ello, los equipos analizan datos históricos de soporte para identificar los tipos de incidencias de clientes que gestiona un banco y su frecuencia. Después, pueden decidir qué categorías debe asumir la IA, empezando por los flujos de trabajo de menor riesgo y ampliando progresivamente su alcance.

Interfaz de panel para una herramienta de soporte bancario que muestra un procedimiento titulado Fraud impersonation callback con instrucciones paso a paso para verificar pagos sospechosos. A la derecha aparece la transcripción de una llamada en directo con mensajes entre un agente de IA y un cliente que confirman la identidad y envían un código de verificación para proteger la cuenta.

Antes de pasar a producción, los clientes pueden simular conversaciones para evaluar cómo responde el sistema en distintos escenarios y ganar confianza en que se comporta como se espera.

El despliegue suele comenzar con un pequeño porcentaje del tráfico, con monitorización continua y comprobaciones automatizadas que detectan conversaciones que pueden requerir revisión humana. Con el tiempo, la cobertura se amplía a medida que el sistema mantiene un rendimiento constante.

Generar impacto desde el primer día y mantenerlo

Los clientes de Gradient Labs informan de puntuaciones de CSAT de hasta el 98 %, en algunos casos por encima de las de sus mejores agentes humanos. La mayoría de los despliegues comienzan con tasas de resolución superiores al 50 % desde el primer día, incluso en flujos complejos como disputas, verificación de cuentas y fraude.

Ese impacto se refleja en el crecimiento de la empresa. En el último año, Gradient Labs ha multiplicado sus ingresos por más de diez y ha ampliado su actividad del soporte entrante a procesos salientes y de back office.

Gradient Labs se centrará en sistemas capaces de mantener el contexto entre interacciones: comprender el historial de un cliente, hacer seguimiento de incidencias en curso y retomar las conversaciones donde se quedaron. Esta dirección está muy alineada con la forma en que Gradient Labs concibe su colaboración a largo plazo con OpenAI.

«No se trata solo de elegir un modelo para hoy. Estamos construyendo sobre una plataforma en la que la evolución de los modelos de razonamiento avanza en la misma dirección que nuestro producto».

Danai Antoniou, cofundadora y directora científica de Gradient Labs

A medida que mejoran los modelos, se amplía el abanico de procedimientos que pueden automatizarse de forma segura. Para Gradient Labs, esto supone avanzar hacia un sistema en el que cada interacción con el cliente se gestione con la misma consistencia, criterio y continuidad que la de un agente humano de primer nivel.

OpenAI <3 startups

Unirse a la comunidad Empezar a crear

Sigue leyendo

Ver todo

La gran apuesta de Warp por crear código abierto con GPT-5.5

Empresas emergentes27 may 2026

Parloa builds service agents customers want to talk to

Empresas emergentes7 may 2026

How Descript engineers multilingual video dubbing at scale

Empresas emergentes6 mar 2026