Doppels AI-försvarssystem stoppar attacker innan de sprider sig
Med GPT‑5 och finjustering av förstärkning (RFT) minskade Doppel analytikers arbetsbelastning med 80 % och åtgärdar nu hot på några minuter istället för timmar.

Resultat
80%
förenklade arbetsflöden för analytiker
Resultat
3x
kapacitet för hothantering
En enda webbplats för identitetsstöld kan lanseras, rikta in sig på tusentals användare och försvinna på mindre än en timme. Det är mer än tillräckligt med tid för att en angripare ska göra verklig skada. Och med generativa verktyg kan de skapa hundratals sådana webbplatser.
Doppel byggdes för att skydda organisationer från deepfakes och identitetsstöld online, men man insåg snart att AI innebar att hot kunde skalas upp oändligt. Angripare behöver inte längre producera bedrägerier för hand – de kan generera oändliga varianter av nätfiskepaket, förfalskade domäner och konton för identitetsstöld på några sekunder.
”Skador från nätfiskeattacker kan inträffa på några få minuter när de sprider sig på sociala medier och meddelandekanaler. Förmågan att generera oändlig övertalning nästan utan kostnad förändrade allt.”
Lanseringen
För att ligga steget före utvecklade Doppel ett nytt försvarssystem mot social manipulation byggt på OpenAI:s modeller GPT‑5 och o4-mini. Doppels plattform upptäcker, klassificerar och eliminerar hot självständigt, vilket minskar analytikers arbetsbelastning med 80 %, tredubblar kapaciteten för hothantering och reducerar svarstiderna från timmar till minuter.
Ligga steget före oändligt snabbare hot
Traditionellt riskskydd förlitade sig på människor som gjorde manuell granskning av webbplatser där identitetsstöld förekom, nätfiskedomäner samt profiler och inlägg på sociala medier. Doppel såg att modellen var ohållbar i takt med att angripare började använda sig av automatisering och lanserade hot snabbare och på fler ytor än vad människor kunde hinna med.
”Vårt system bearbetar en ständig flod av signaler för att identifiera de verkliga hoten i bruset. När ett hot upptäcks är det knappt om tid att agera innan skadan är skedd”, säger Rahul. ”Att använda AI för att automatisera beslutsfattande är en av de största fördelarna för företaget, eftersom det gör att vi kan bekämpa attacker i en omfattande skala och hastighet.”
Den hastigheten är avgörande för Doppels kunder – organisationer som inte har råd att vänta i flera timmar på att bekräfta ett hot. Doppels system klassificerar de flesta hot automatiskt med hjälp av OpenAI-modeller för resonemang och en strukturerad feedbackslinga som kallas finjustering av förstärkning (RFT) för att förbättra modellen över tid. I RFT används mänsklig feedback som graderade exempel, vilket hjälper modeller att på egen hand lära sig att fatta enhetliga beslut med förklarbarhet.
Orkestrera LLM-driven hotdetektering
Doppels LLM-drivna pipeline finns i centrum av dess detektionsstack. Efter att signaler har hämtats och filtrerats utför systemet en serie riktade resonemangsuppgifter: resonemang via potentiella hot, bekräftelse av avsikt och beslut om klassificering. Varje steg är utformat för att balansera hastighet, riktighet och konsekvens, samtidigt som analytikerna fokuserar på de gränsfall som kräver mänsklig bedömning.

Så här fungerar det:
- Signalfiltrering och egenskapsextraktion: Doppels system tar dagligen in miljontals domäner, URL:er och konton. En kombination av heuristik och OpenAI o4-mini filtrerar bort brus och extraherar strukturerade funktioner för att göra utvärderingar av modeller nedströms.
- Parallell bekräftelse av hot: Varje signal skickas genom flera GPT‑5-prompter som är specialbyggda för olika typer av hotanalys. Dessa prompter bedömer faktorer som risk för identitetsstöld, missbruk av varumärke eller mönster för social manipulation.
- Hotklassificering: RFT-versionen av o4-mini syntetiserar de tidigare bekräftelserna för att tilldela en strukturerad etikett – skadlig, ofarlig eller tvetydig – med produktionsklassad enhetlighet.
- Slutlig verifiering: En andra GPT‑5-genomgång validerar modellens beslut och genererar en motivering på naturligt språk. Om tillförlitligheten överstiger tröskelvärdet initierar systemet automatiskt tillämpning.
- Mänsklig granskning: Resultat som är motstridiga eller har låg tillförlitlighet skickas till mänskliga analytiker. Deras beslut loggas och matas tillbaka till RFT-slingan för att kontinuerligt förbättra modellens enhetlighet.
Träna modeller genom finjustering av förstärkning (RFT)
Doppel hade redan sett betydande vinster från sin ursprungliga LLM-förbättrade upptäcktspipeline, men när det gällde fall där samma hot kunde bedömas olika beroende på analytiker, blev enhetlighet den begränsande faktorn.
”En verklig fördel med RFT är att man gör modellens beslut mer enhetliga.”
För att skapa den enhetligheten tillämpade Doppel RFT med sina egna analysdata som feedbackkälla. Varje beslut att klassificera en domän som skadlig, ofarlig eller otydlig blev ett graderat exempel. Med hjälp av dessa exempel tränades modellen att replikera expertbedömningar, även i tvetydiga gränsfall.

I nära samarbete med OpenAI:s tekniska team utformade Doppel graderingsfunktioner som inte bara utvärderade riktighet utan även förklarande kvalitet, och belönade modeller som resonerade tydligt, inte bara korrekt. Genom att omvandla analytikerfeedback till strukturerade träningsdata hjälpte Doppel att visa hur RFT kunde göra automatiserad upptäckt mer enhetlig och tillförlitlig.
Operationalisera förtroende genom transparens
Justering av hyperparametrar och iterativa utvärderingar förde modellen närmare en enhetlighet på mänsklig nivå. Men för Doppel innebar optimeringen av det slutliga automatiseringsarbetet även att besluten omedelbart kunde förstås.
Varje automatisk borttagning inkluderar nu en AI-genererad motivering som förklarar varför ett hot togs bort, vilket ger kunderna omedelbar insikt i varför en åtgärd vidtogs – något som tidigare krävde analytikeringripande.

Den här synligheten ökar förtroendet, vilket är en avgörande faktor för Doppels användare. Att inte bara se vilka åtgärder som vidtogs, utan även förstå varför de vidtogs, ger teamen förtroendet att reagera snabbt och kontexten för att förklara dessa beslut internt eller till intressenter.
Resultat i korthet
- Minska analytikers arbetsbelastning med 80 %
- Minskade svarstiderna för hot från timmar till minuter
- Tredubblad kapacitet för hothantering
- De flesta hot klassificeras automatiskt
Vad händer härnäst?
Efter att ha uppnått en nästan fullständig automatisering för domäner där nätfiske och identitetsstöld sker tillämpar Doppel nu samma modelldrivna ramverk på andra kanaler med hög varians.
”Domäner är förmodligen den svåraste kanalen vi hanterar”, säger Madduluri. ”Signalerna är röriga, innehållet ändras ständigt och hoten utvecklas snabbt över flera ytor samtidigt. Om vi kan automatisera det från början till slut, kan vi göra det för vad som helst: sociala medier, betald reklam, vad du än kan tänka dig.”
Kommande milstolpar inkluderar att skala upp deras RFT-datamängd i storleksordning, experimentera med nya graderingsstrategier och använda GPT‑5 för funktionsutvinning uppströms. Dessa ändringar kommer att göra det möjligt för Doppel att konsolidera pipeline-steg och resonera kring mer komplexa hotindikatorer tidigare i processen.
Med varje iteration bygger Doppel mot ett system som försvarar det som är verkligt på alla ytor där förtroende attackeras.


