Il sistema di difesa IA di Doppel blocca gli attacchi sul nascere
Grazie a GPT‑5 e al fine-tuning con apprendimento per rinforzo (RFT), Doppel ha ridotto dell’80% il carico di lavoro degli analisti e ora mitiga le minacce in pochi minuti anziché in ore.

Risultati
80%
flussi di lavoro degli analisti ridotti
Risultati
3x
capacità di gestione delle minacce
Un singolo sito di furto d’identità può essere lanciato, colpire migliaia di utenti e scomparire in meno di un’ora. È un tempo più che sufficiente per consentire a un hacker di causare danni reali. E con gli strumenti generativi, possono crearne centinaia di altri simili.
Doppel è stato creato per difendere le organizzazioni dai deepfake e dalle usurpazioni di identità online, ma si è presto reso conto che l’intelligenza artificiale permetteva alle minacce di scalare all’infinito. Gli hacker non avevano più bisogno di creare truffe manualmente; potevano generare infinite varianti di kit di phishing, domini contraffatti e account di impersonificazione in pochi secondi.
“I danni causati dagli attacchi di phishing possono verificarsi in pochi minuti mentre si diffondono sui social media e nei canali di messaggistica. La possibilità di generare persuasione illimitata a costi quasi nulli ha cambiato tutto”.
Nel cuore del lancio
Per restare all’avanguardia, Doppel ha sviluppato un nuovo tipo di sistema di difesa dall’ingegneria sociale basato sui modelli OpenAI GPT‑5 e o4-mini. La piattaforma di Doppel rileva, classifica ed elimina le minacce in modo autonomo, riducendo dell’80% il carico di lavoro degli analisti, triplicando la capacità di gestione delle minacce e riducendo i tempi di risposta da ore a minuti.
Restare al passo con minacce sempre più rapide
La protezione tradizionale dai rischi digitali si basava sulla revisione manuale da parte di esseri umani di siti di impersonificazione, domini di phishing e profili e post sui social media. Doppel ha visto quel modello cedere quando gli aggressori hanno iniziato ad automatizzare, lanciando minacce più velocemente e su più superfici di quanto gli esseri umani potessero valutarle.
“Il nostro sistema elabora un flusso costante di segnali per individuare le minacce reali nel rumore di fondo. Una volta rilevata una minaccia, il tempo per intervenire prima che si verifichino danni è molto limitato. Usare l’IA per automatizzare il processo decisionale è una delle opportunità più importanti per l’azienda e ci permette di contrastare gli attacchi con la velocità e la scala di Internet”.
Questa velocità è fondamentale per i clienti di Doppel, organizzazioni che non possono permettersi di attendere ore per confermare una minaccia. Il sistema di Doppel classifica automaticamente la maggior parte delle minacce, utilizzando modelli OpenAI per il ragionamento e un ciclo di feedback strutturato noto come fine-tuning con apprendimento per rinforzo (RFT) per migliorare il modello nel tempo. Nel RFT, il feedback umano viene utilizzato come esempio graduato, aiutando i modelli ad apprendere come prendere decisioni coerenti e spiegabili in autonomia.
Orchestrazione del rilevamento delle minacce basato su LLM
La pipeline basata su LLM di Doppel è al centro del suo stack di rilevamento. Dopo che i segnali sono stati raccolti e filtrati, il sistema esegue una serie di attività di ragionamento mirate: analizza le potenziali minacce, conferma le intenzioni e guida le decisioni di classificazione. Ogni fase è progettata per bilanciare velocità, precisione e coerenza, mantenendo gli analisti concentrati sui casi limite che richiedono il giudizio umano.

Ecco come funziona:
- Filtraggio dei segnali ed estrazione delle caratteristiche: i sistemi di Doppel acquisiscono ogni giorno milioni di domini, URL e account. Una combinazione di euristiche e OpenAI o4-mini filtra il rumore ed estrae caratteristiche strutturate per guidare le valutazioni dei modelli a valle.
- Conferma parallela delle minacce: ogni segnale viene elaborato tramite più prompt GPT‑5 progettati per diversi tipi di analisi delle minacce. Questi prompt valutano fattori come il rischio di furto d’identità, l’uso improprio del marchio o schemi di ingegneria sociale.
- Classificazione delle minacce: la versione RFT di o4-mini sintetizza le precedenti conferme e assegna un’etichetta strutturata (maligna, benigna o ambigua) con una coerenza di livello produttivo.
- Verifica finale: un secondo passaggio GPT‑5 convalida la decisione del modello e genera una giustificazione in linguaggio naturale. Se il livello di confidenza supera la soglia, il sistema avvia automaticamente l’azione.
- Revisione umana: i risultati con bassa confidenza o in conflitto vengono inoltrati agli analisti umani. Le loro decisioni vengono registrate e reinserite nel ciclo RFT per migliorare continuamente la coerenza del modello.
Addestramento dei modelli tramite fine-tuning con apprendimento per rinforzo (RFT)
Doppel aveva già ottenuto risultati significativi dalla pipeline di rilevamento potenziata con LLM, ma nei casi in cui la stessa minaccia poteva essere valutata in modo diverso a seconda dell’analista, la coerenza è diventata il fattore limitante.
“Uno dei principali vantaggi del RFT è rendere più coerenti le decisioni del modello.”
Per ottenere questa coerenza, Doppel ha applicato il RFT utilizzando i propri dati degli analisti come fonte di feedback. Ogni decisione di classificare un dominio come dannoso, innocuo o incerto è diventata un esempio valutato. Questi esempi etichettati hanno addestrato il modello a replicare il giudizio degli esperti, anche nei casi limite ambigui.

Collaborando a stretto contatto con il team di ingegneria applicata di OpenAI, Doppel ha progettato funzioni di valutazione che misurano non solo l’accuratezza ma anche la qualità delle spiegazioni, premiando i modelli che ragionano in modo chiaro, non solo corretto. Trasformando il feedback degli analisti in dati di addestramento strutturati, Doppel ha dimostrato come il RFT possa rendere il rilevamento automatico più coerente e affidabile.
Rendere operativa la fiducia attraverso la trasparenza
La regolazione degli iperparametri e le valutazioni iterative hanno avvicinato il modello a una coerenza di livello umano. Per Doppel, però, completare l’ultima fase dell’automazione significava anche rendere le decisioni immediatamente comprensibili.
Ogni rimozione automatizzata include ora una giustificazione generata dall’IA che spiega perché una minaccia è stata rimossa, offrendo ai clienti visibilità immediata sul motivo dell’azione, cosa che prima richiedeva l’intervento di un analista.

Questa visibilità rafforza la fiducia, un fattore fondamentale per gli utenti di Doppel. Vedere non solo quale azione è stata intrapresa, ma anche perché, dà ai team la sicurezza per reagire rapidamente e il contesto per spiegare tali decisioni internamente o agli stakeholder.
Uno sguardo ai risultati
- Riduzione dell’80% del carico di lavoro degli analisti
- Riduzione dei tempi di risposta alle minacce da ore a minuti
- Capacità di gestione delle minacce triplicata
- La maggior parte delle minacce viene classificata automaticamente
Prossimi passi
Dopo aver raggiunto un livello di automazione quasi totale per i domini di phishing e impersonificazione, Doppel applica ora lo stesso framework basato su modelli ad altri canali ad alta variabilità.
“I domini sono probabilmente il canale più difficile che gestiamo”, ha dichiarato Madduluri. “I segnali sono disordinati, i contenuti cambiano continuamente e le minacce evolvono rapidamente su più superfici contemporaneamente. Se riusciamo ad automatizzare tutto da capo a fondo, possiamo farlo per qualsiasi cosa: social media, annunci a pagamento, qualsiasi cosa”.
Le prossime tappe includono l’espansione del dataset RFT di un ordine di grandezza, la sperimentazione di nuove strategie di valutazione e l’uso di GPT‑5 per l’estrazione delle caratteristiche a monte. Questi cambiamenti consentiranno a Doppel di consolidare le fasi della pipeline e analizzare indicatori di minaccia più complessi già nelle fasi iniziali del processo.
Con ogni iterazione, Doppel costruisce un sistema che difende ciò che è reale su ogni superficie in cui la fiducia è sotto attacco.


