Gå direkt till huvudinnehåll
OpenAI

28 oktober 2025

Doppels AI-försvarssystem stoppar attacker innan de sprider sig

Med GPT‑5 och finjustering av förstärkning (RFT) minskade Doppel analytikers arbetsbelastning med 80 % och åtgärdar nu hot på några minuter istället för timmar.

En Doppel-logotyp i vitt mitt på en mörk metallisk bakgrund med böjda linjer och nitar.
Företagets storlek: Startupföretag
Region: Nordamerika
Bransch: Teknik
Produkter: API

Resultat

80%

förenklade arbetsflöden för analytiker

Resultat

3x

kapacitet för hothantering

Laddar …

En enda webbplats för identitetsstöld kan lanseras, rikta in sig på tusentals användare och försvinna på mindre än en timme. Det är mer än tillräckligt med tid för att en angripare ska göra verklig skada. Och med generativa verktyg kan de skapa hundratals sådana webbplatser.

Doppel byggdes för att skydda organisationer från deepfakes och identitetsstöld online, men man insåg snart att AI innebar att hot kunde skalas upp oändligt. Angripare behöver inte längre producera bedrägerier för hand – de kan generera oändliga varianter av nätfiskepaket, förfalskade domäner och konton för identitetsstöld på några sekunder.

”Skador från nätfiskeattacker kan inträffa på några få minuter när de sprider sig på sociala medier och meddelandekanaler. Förmågan att generera oändlig övertalning nästan utan kostnad förändrade allt.”
– Rahul Madduluri, medgrundare och CTO, Doppel

Lanseringen

För att ligga steget före utvecklade Doppel ett nytt försvarssystem mot social manipulation byggt på OpenAI:s modeller GPT‑5 och o4-mini. Doppels plattform upptäcker, klassificerar och eliminerar hot självständigt, vilket minskar analytikers arbetsbelastning med 80 %, tredubblar kapaciteten för hothantering och reducerar svarstiderna från timmar till minuter.

Ligga steget före oändligt snabbare hot

Traditionellt riskskydd förlitade sig på människor som gjorde manuell granskning av webbplatser där identitetsstöld förekom, nätfiskedomäner samt profiler och inlägg på sociala medier. Doppel såg att modellen var ohållbar i takt med att angripare började använda sig av automatisering och lanserade hot snabbare och på fler ytor än vad människor kunde hinna med.

”Vårt system bearbetar en ständig flod av signaler för att identifiera de verkliga hoten i bruset. När ett hot upptäcks är det knappt om tid att agera innan skadan är skedd”, säger Rahul. ”Att använda AI för att automatisera beslutsfattande är en av de största fördelarna för företaget, eftersom det gör att vi kan bekämpa attacker i en omfattande skala och hastighet.”
– Rahul Madduluri, medgrundare och CTO, Doppel

Den hastigheten är avgörande för Doppels kunder – organisationer som inte har råd att vänta i flera timmar på att bekräfta ett hot. Doppels system klassificerar de flesta hot automatiskt med hjälp av OpenAI-modeller för resonemang och en strukturerad feedbackslinga som kallas finjustering av förstärkning (RFT) för att förbättra modellen över tid. I RFT används mänsklig feedback som graderade exempel, vilket hjälper modeller att på egen hand lära sig att fatta enhetliga beslut med förklarbarhet.

Orkestrera LLM-driven hotdetektering

Doppels LLM-drivna pipeline finns i centrum av dess detektionsstack. Efter att signaler har hämtats och filtrerats utför systemet en serie riktade resonemangsuppgifter: resonemang via potentiella hot, bekräftelse av avsikt och beslut om klassificering. Varje steg är utformat för att balansera hastighet, riktighet och konsekvens, samtidigt som analytikerna fokuserar på de gränsfall som kräver mänsklig bedömning.

Ett flödesschema visar en pipeline för hotdetektering med hjälp av LLM:er, från inhämtning och filtrering, via funktionsutvinning och klassificering, till slutlig verifiering och borttagning. Modeller som GPT-5 och o4-mini används i viktiga skeden.

Så här fungerar det:

  • Signalfiltrering och egenskapsextraktion: Doppels system tar dagligen in miljontals domäner, URL:er och konton. En kombination av heuristik och OpenAI o4-mini filtrerar bort brus och extraherar strukturerade funktioner för att göra utvärderingar av modeller nedströms.
  • Parallell bekräftelse av hot: Varje signal skickas genom flera GPT‑5-prompter som är specialbyggda för olika typer av hotanalys. Dessa prompter bedömer faktorer som risk för identitetsstöld, missbruk av varumärke eller mönster för social manipulation.
  • Hotklassificering: RFT-versionen av o4-mini syntetiserar de tidigare bekräftelserna för att tilldela en strukturerad etikett – skadlig, ofarlig eller tvetydig – med produktionsklassad enhetlighet.
  • Slutlig verifiering: En andra GPT‑5-genomgång validerar modellens beslut och genererar en motivering på naturligt språk. Om tillförlitligheten överstiger tröskelvärdet initierar systemet automatiskt tillämpning.
  • Mänsklig granskning: Resultat som är motstridiga eller har låg tillförlitlighet skickas till mänskliga analytiker. Deras beslut loggas och matas tillbaka till RFT-slingan för att kontinuerligt förbättra modellens enhetlighet.

Träna modeller genom finjustering av förstärkning (RFT)

Doppel hade redan sett betydande vinster från sin ursprungliga LLM-förbättrade upptäcktspipeline, men när det gällde fall där samma hot kunde bedömas olika beroende på analytiker, blev enhetlighet den begränsande faktorn.

”En verklig fördel med RFT är att man gör modellens beslut mer enhetliga.”
– Kiran Arimilli, programvaruingenjör, Doppel

För att skapa den enhetligheten tillämpade Doppel RFT med sina egna analysdata som feedbackkälla. Varje beslut att klassificera en domän som skadlig, ofarlig eller otydlig blev ett graderat exempel. Med hjälp av dessa exempel tränades modellen att replikera expertbedömningar, även i tvetydiga gränsfall.

Ett runt diagram visar arbetsflödet för Doppel-hotklassificering: produktions-LLM:er fattar beslut → mänskliga granskare gör korrigeringar → modellträning uppdaterar modeller → distribution skickar uppdaterade modeller till produktion.

I nära samarbete med OpenAI:s tekniska team utformade Doppel graderingsfunktioner som inte bara utvärderade riktighet utan även förklarande kvalitet, och belönade modeller som resonerade tydligt, inte bara korrekt. Genom att omvandla analytikerfeedback till strukturerade träningsdata hjälpte Doppel att visa hur RFT kunde göra automatiserad upptäckt mer enhetlig och tillförlitlig.

Operationalisera förtroende genom transparens

Justering av hyperparametrar och iterativa utvärderingar förde modellen närmare en enhetlighet på mänsklig nivå. Men för Doppel innebar optimeringen av det slutliga automatiseringsarbetet även att besluten omedelbart kunde förstås.

Varje automatisk borttagning inkluderar nu en AI-genererad motivering som förklarar varför ett hot togs bort, vilket ger kunderna omedelbar insikt i varför en åtgärd vidtogs – något som tidigare krävde analytikeringripande.

En instrumentpanelvy visar en borttagningsvarning för domänen "d0ppel.click", flaggad att försöka stjäla Doppels identitet. Sammanfattningen citerar nätfiske och stöld av autentiseringsuppgifter, med en tidslinje till höger som visar statusuppdateringar från skapande till lösning den 10 oktober 2025.

Den här synligheten ökar förtroendet, vilket är en avgörande faktor för Doppels användare. Att inte bara se vilka åtgärder som vidtogs, utan även förstå varför de vidtogs, ger teamen förtroendet att reagera snabbt och kontexten för att förklara dessa beslut internt eller till intressenter.

Resultat i korthet

  • Minska analytikers arbetsbelastning med 80 %
  • Minskade svarstiderna för hot från timmar till minuter
  • Tredubblad kapacitet för hothantering
  • De flesta hot klassificeras automatiskt

Vad händer härnäst?

Efter att ha uppnått en nästan fullständig automatisering för domäner där nätfiske och identitetsstöld sker tillämpar Doppel nu samma modelldrivna ramverk på andra kanaler med hög varians.

”Domäner är förmodligen den svåraste kanalen vi hanterar”, säger Madduluri. ”Signalerna är röriga, innehållet ändras ständigt och hoten utvecklas snabbt över flera ytor samtidigt. Om vi kan automatisera det från början till slut, kan vi göra det för vad som helst: sociala medier, betald reklam, vad du än kan tänka dig.”

Kommande milstolpar inkluderar att skala upp deras RFT-datamängd i storleksordning, experimentera med nya graderingsstrategier och använda GPT‑5 för funktionsutvinning uppströms. Dessa ändringar kommer att göra det möjligt för Doppel att konsolidera pipeline-steg och resonera kring mer komplexa hotindikatorer tidigare i processen.

Med varje iteration bygger Doppel mot ett system som försvarar det som är verkligt på alla ytor där förtroende attackeras.