Gradient Labs даёт всем клиентам банка персонального ИИ-менеджера
Gradient Labs использует GPT‑4.1 и GPT‑5.4 mini и nano для выполнения сложных сценариев финансовой поддержки с высокой точностью и низкой задержкой.

Результаты
10x
Рост выручки
Результаты
98%
Удовлетворённость клиентов работой AI-агента
Результаты
+11%
Более высокая точность у GPT-4.1 по сравнению со следующим лучшим провайдером
В банковской сфере решение проблемы клиента редко бывает простым. Случаи вроде мошенничества или заблокированных платежей требуют строгого соблюдения сложных процедур с участием нескольких команд. Когда системы не справляются, клиентов передают от одной команды к другой, они ждут в очередях и сталкиваются с задержками именно в те моменты, когда цена ошибки особенно высока.
Gradient Labs(открывается в новом окне) создана, чтобы справляться с такими сложностями. Компания, базирующаяся в Лондоне, создает ИИ-агентов, которые дают каждому клиенту банка опыт персонального менеджера. Основанная командой, которая ранее руководила направлениями ИИ и работы с данными в Monzo, Gradient Labs построила свою платформу на моделях OpenAI и сейчас переводит производственный трафик на GPT‑5.4 mini и nano
«Мы видим задержку в 500 миллисекунд с GPT‑5.4 mini и nano, а это именно то, что нам нужно для естественных голосовых разговоров», — говорит Данай Антониу, сооснователь и главный научный сотрудник Gradient Labs. «Мы переводим на них значительную часть нашей нагрузки».
«Нам одновременно были нужны три вещи: точность в следовании инструкциям, низкий уровень галлюцинаций и надёжность вызова функций — и всё это в условиях ограничений по голосовой задержке. OpenAI был единственным провайдером, который прошёл по всем трём пунктам».
В банковской сфере взаимодействие с клиентами регулируется стандартными операционными процедурами (SOP), которые определяют, что должно происходить на каждом этапе.
Типичное взаимодействие с клиентом может выглядеть так:
- Клиент звонит, чтобы сообщить о краже карты.
- Система проверяет личность клиента, обрабатывая исправления и прерывания в реальном времени.
- После проверки она блокирует карту и инициирует выпуск новой.
- Она отвечает на уточняющие вопросы, например о сроках доставки, и предлагает следующие шаги.
Каждый этап следует определённой процедуре, а решения принимаются в реальном времени на основе ввода пользователя, контекста, действующих защитных ограничений, а также ответов клиента и агента для обеспечения соответствия требованиям.
«Модель должна сохранять состояние процедуры при прерываниях, коротких репликах-подтверждениях и переключениях темы, при этом быстро генерируя ответы», — говорит Антониу. «Большинство провайдеров даже не могли за это взяться».
Gradient Labs сравнивает провайдеров на самых сложных процедурах и оценивает их по тому, что они называют точностью траектории: следует ли система правильному пути от начала до конца.
В одной из их первых систем оценки (evals) GPT‑4.1 была единственной моделью, достигшей 97% точности прохождения траектории. Следующий ближайший провайдер показал 88%.
«В финансовых услугах это разница между успешно решённым звонком и инцидентом, связанным с соблюдением требований», — говорит Антониу.
Этот результат определил подход Gradient Labs к проектированию системы. Команда создала гибридную архитектуру, которая использует модели OpenAI для шагов, интенсивных по рассуждениям, и более компактные модели для быстрых детерминированных задач, с маршрутизацией, адаптирующейся к сложности и ограничениям по задержке.
Внутри система состоит из специализированных навыков, оркестрируемых центральным агентом рассуждений, что позволяет сложным случаям переходить между рабочими процессами без потери контекста.
Для каждого взаимодействия параллельно работают более 15 защитных механизмов, чтобы разговоры оставались в рамках заданных процедур и соответствия требованиям, включая выявление финансовых советов, сигналов уязвимости, жалоб и попыток обойти проверку или получить доступ к персональным данным.
Финансовые организации не внедряют такие системы на веру. Им нужно шаг за шагом видеть, что система ведёт себя корректно в реальных условиях.
«Архитектуру нужно изначально строить так, чтобы исключить галлюцинации», — говорит Антониу. «Это должно быть руководящим принципом на всём этапе разработки».
Чтобы оценивать как новые, так и существующие модели, команда воспроизводит реальные разговоры с клиентами и сравнивает поведение системы с ожидаемой процедурой. Кроме того, до развертывания команда генерирует синтетические диалоги, чтобы проверять пограничные случаи и редкие сценарии.
Gradient Labs также даёт командам контроль над тем, как именно внедряется система. Они анализируют исторические данные поддержки, чтобы определить типы клиентских обращений, с которыми работает банк, и частоту их возникновения. Затем команды могут выбрать, какие категории должен обрабатывать ИИ, начиная с менее рискованных процессов и постепенно расширяя охват.

Перед запуском клиенты могут моделировать разговоры, чтобы проверить, как система отвечает в разных сценариях, и убедиться, что она ведёт себя ожидаемым образом.
Развёртывание обычно начинается с небольшой доли трафика, при этом непрерывный мониторинг и автоматические проверки помечают разговоры, которые могут потребовать проверки человеком. Со временем охват расширяется, когда система демонстрирует стабильно высокие результаты.
Клиенты Gradient Labs сообщают о показателях CSAT до 98%, в некоторых случаях превосходящих их лучших операторов-людей. Большинство внедрений стартуют с уровня решения обращений свыше 50% уже в первый день, даже для сложных процессов вроде оспаривания операций, верификации аккаунта и мошенничества.
Этот эффект отражается и в росте компании. За последний год Gradient Labs увеличила выручку более чем в 10 раз, выйдя за пределы входящей поддержки и расширив охват до исходящих и бэк-офисных процессов.
Смотря вперёд, Gradient Labs сосредоточена на системах, способных сохранять контекст между взаимодействиями: понимать историю клиента, отслеживать текущие проблемы и продолжать с того места, где закончились предыдущие разговоры. Это направление тесно соответствует тому, как Gradient Labs видит своё долгосрочное партнёрство с OpenAI.
«Мы не просто выбираем модель на сегодня. Мы строим на платформе, где, как мы видим, развитие моделей рассуждений идёт в том же направлении, что и наш продукт».
По мере того как модели продолжают улучшаться, расширяется и спектр процедур, которые можно безопасно автоматизировать. Для Gradient Labs это означает приближение к системе, в которой каждое взаимодействие с клиентом обрабатывается с той же последовательностью, взвешенностью и непрерывностью, что и у первоклассного агента-человека.


