1 aprile 2026

Startup

Gradient Labs offre a ogni cliente bancario un account manager IA

Gradient Labs usa GPT‑4.1 e GPT‑5.4 mini e nano per gestire workflow complessi di supporto finanziario con alta accuratezza e bassa latenza.

Inizia a creare

Sfondo con gradiente morbido e fluido nei toni caldi dell’arancione e del giallo che sfuma nel verde acqua, con un’icona geometrica bianca a forma di cubo accanto al testo “Gradient Labs” centrato nell’immagine.

Dimensioni azienda: Startup

Regione: Europa e Regno Unito

Settore: Tecnologia, Contabilità

Prodotti: API

Risultati

10x

Crescita dei ricavi

Risultati

98%

Soddisfazione dei clienti nell’esperienza con l’agente IA

Risultati

+11%

Maggiore accuratezza con GPT-4.1 rispetto al secondo miglior provider

Caricamento in corso...

Nel settore bancario, risolvere il problema di un cliente è raramente semplice. Casi come frodi o pagamenti bloccati richiedono il rigoroso rispetto di procedure complesse che coinvolgono più team. Quando i sistemi non sono all’altezza, i clienti vengono rimbalzati da un team all’altro, aspettano in coda e subiscono ritardi proprio nei momenti in cui la posta in gioco è più alta.

Gradient Labs⁠(si apre in una nuova finestra) è progettata per gestire questa complessità. L’azienda londinese sviluppa agenti IA che offrono a ogni cliente bancario l’esperienza di un account manager dedicato. Fondata da un team che in precedenza ha guidato iniziative di IA e dati in Monzo, la piattaforma si basa sui modelli OpenAI e sta ora spostando il traffico di produzione su GPT‑5.4 mini e nano.

"Con GPT‑5.4 mini e nano registriamo una latenza di 500 millisecondi, esattamente ciò di cui abbiamo bisogno per conversazioni vocali naturali", afferma Danai Antoniou, cofondatrice e Chief Scientist di Gradient Labs. "Stiamo spostando una parte significativa del nostro carico di lavoro."

"Avevamo bisogno di tre elementi contemporaneamente: precisione nell’esecuzione delle istruzioni, bassi tassi di allucinazione e affidabilità nelle chiamate di funzione, il tutto entro vincoli di latenza vocale. OpenAI è stato l’unico provider a soddisfarli tutti e tre."

Danai Antoniou, cofondatrice e Chief Scientist di Gradient Labs

Dalle SOP ai sistemi in tempo reale

Nel settore bancario, le interazioni con i clienti sono regolate da procedure operative standard (SOP) che definiscono cosa deve accadere in ogni fase.

Una tipica interazione con un cliente può essere così:

Un cliente chiama per segnalare il furto della carta.
Il sistema verifica la sua identità, gestendo correzioni e interruzioni in tempo reale.
Una volta verificata l’identità, blocca la carta e avvia la sostituzione.
Risponde alle domande successive, come i tempi di consegna, e suggerisce i passaggi successivi.

Ogni fase segue una procedura definita, con decisioni prese in tempo reale in base all’input dell’utente, al contesto, ai guardrail attivi e alle risposte sia del cliente sia dell’agente, per garantire la conformità.

"Il modello deve mantenere lo stato della procedura tra interruzioni, backchannel e cambi di argomento, continuando a generare risposte rapidamente", afferma Antoniou. "La maggior parte dei provider non riusciva nemmeno a provarci."

Gradient Labs confronta i provider sulle loro procedure più impegnative e li valuta in base a ciò che chiamano accuratezza della traiettoria: se il sistema segue il percorso corretto dall’inizio alla fine.

In una delle loro valutazioni iniziali, GPT‑4.1 è stato l’unico modello a raggiungere il 97% di accuratezza e coerenza della traiettoria. Il provider più vicino si è fermato all’88%.

"Nei servizi finanziari, è la differenza tra risolvere una chiamata e creare un incidente di conformità", dice Antoniou.

Questo risultato ha influenzato il modo in cui Gradient Labs ha progettato il suo sistema. Il team ha creato un’architettura ibrida che usa i modelli OpenAI per i passaggi ad alta intensità di ragionamento e modelli più piccoli per compiti più rapidi e deterministici, con un instradamento che si adatta in base alla complessità e ai vincoli di latenza.

Internamente, il sistema è composto da competenze specializzate orchestrate da un agente di ragionamento centrale, consentendo ai casi complessi di passare tra workflow diversi senza perdere contesto.

Per ogni interazione, più di 15 sistemi di guardrail operano in parallelo per garantire che le conversazioni restino entro procedure definite e limiti di conformità, inclusi il rilevamento di consulenza finanziaria, segnali di vulnerabilità, reclami e tentativi di aggirare la verifica o accedere a dati sensibili.

Dimostrare affidabilità in ambienti ad alto rischio

Le istituzioni finanziarie non implementano sistemi come questo sulla fiducia. Devono poter verificare, passo dopo passo, che si comporti correttamente in condizioni reali.

"Bisogna progettare fin dalle fondamenta per non avere allucinazioni", afferma Antoniou. "Questo deve essere il principio guida durante la costruzione."

Per valutare modelli nuovi ed esistenti, il team riproduce conversazioni reali con i clienti e confronta il comportamento del sistema con la procedura prevista. Genera anche conversazioni sintetiche per testare casi limite e scenari rari prima di qualsiasi rilascio.

Gradient Labs offre inoltre ai team il controllo su come introdurre il sistema. Analizza i dati storici di supporto per mappare i tipi di problemi dei clienti che una banca gestisce e la loro frequenza. I team possono quindi scegliere quali categorie l’IA debba gestire, iniziando dai workflow a rischio più basso e ampliando gradualmente.

Interfaccia dashboard per uno strumento di supporto bancario che mostra una procedura intitolata Fraud impersonation callback con istruzioni passo passo per verificare pagamenti sospetti. A destra compare la trascrizione di una chiamata in diretta con messaggi tra un agente IA e un cliente che confermano l’identità e inviano un codice di verifica per proteggere il conto.

Prima della messa in produzione, i clienti possono simulare conversazioni per verificare come il sistema risponde nei diversi scenari, rafforzando la fiducia che si comporti come previsto.

Il deployment inizia in genere con una piccola percentuale di traffico, con monitoraggio continuo e controlli automatici che segnalano le conversazioni che potrebbero richiedere una revisione umana. Nel tempo, la copertura si espande man mano che il sistema dimostra prestazioni costanti.

Mostrare l’impatto fin dal primo giorno e il percorso futuro

I clienti di Gradient Labs riportano punteggi CSAT fino al 98%, in alcuni casi superiori a quelli dei loro migliori agenti umani. La maggior parte delle implementazioni parte con tassi di risoluzione superiori al 50% fin dal primo giorno, anche per workflow complessi come contestazioni, verifica dell’account e frodi.

Questo impatto si riflette nella crescita dell’azienda. Gradient Labs ha aumentato i ricavi di oltre 10 volte nell’ultimo anno, espandendosi dal supporto in entrata ai processi outbound e di back office.

Guardando al futuro, Gradient Labs è focalizzata su sistemi in grado di mantenere il contesto tra le interazioni: comprendere la cronologia di un cliente, monitorare problemi in corso e riprendere da dove si erano interrotte le conversazioni precedenti. Questa direzione è strettamente allineata al modo in cui Gradient Labs concepisce la sua partnership a lungo termine con OpenAI.

"Non stiamo solo scegliendo un modello per oggi. Stiamo costruendo su una piattaforma in cui vediamo che la traiettoria dei modelli di ragionamento va nella stessa direzione del nostro prodotto."

Danai Antoniou, cofondatrice e Chief Scientist di Gradient Labs

Man mano che i modelli continuano a migliorare, si amplia la gamma di procedure che possono essere automatizzate in sicurezza. Per Gradient Labs, questo significa avvicinarsi a un sistema in cui ogni interazione con il cliente viene gestita con la stessa coerenza, capacità di giudizio e continuità di un agente umano di altissimo livello.

OpenAI <3 startup

Unisciti alla community Inizia a creare

Continua a leggere

Visualizza tutto

La grande scommessa di Warp sull’open source con GPT-5.5

Startup27 mag 2026

Parloa builds service agents customers want to talk to

Startup7 mag 2026

How Descript engineers multilingual video dubbing at scale

Startup6 mar 2026