Gå til hovedindhold
OpenAI

28. oktober 2025

Doppels AI-forsvarssystem stopper angreb, før de spredes

Med GPT‑5 og finjusteret forstærket finjustering (RFT) mindsker Doppel analysebyrden med 80 % og afbøder nu trusler på få minutter i stedet for flere timer.

Doppels logo i hvidt centreret på en stoflig mørk metallisk baggrund med buede linjer og nitter.
Virksomhedsstørrelse: Nystartet virksomhed
Region: Nordamerika
Branche: Teknologi
Produkter: API

Resultater

80%

forenklede arbejdsgange for analytikere

Resultater

3x

kapacitet til håndtering af trusler

Indlæser ...

Et enkelt imitationswebsted kan opstå, være målrettet mod tusindvis af brugere og forsvinde på under en time. Det er tilstrækkelig tid for en angriber til at forvolde reel skade. Og med generative værktøjer kan de starte flere hundrede tilsvarende.

Doppel blev bygget til at forsvare organisationer mod deepfakes og imitationer online, men indså hurtigt, at AI betød, at trusler kunne skaleres op i det uendelige. Angribere havde ikke længere behov for manuelt at udtænke scams. De kunne generere uendelige varianter af phishing-sæt, spoofede domæner og imiterede konti på få sekunder.

“Skader fra phishing-angreb kan ske på få minutter, mens de spredes over sociale medier og chatkanaler. Evnen til at generere uendelig overtalelse næsten uden omkostninger ændrede alt.”
– Rahul Madduluri, medstifter og CTO, Doppel

Inden for udrulningen

For at være et skridt foran udviklede Doppel en ny type forsvarssystem mod social engineering bygget på OpenAI GPT‑5‑ og o4-mini-modeller. Doppels platform registrerer, klassificerer og fjerner trusler autonomt og mindsker analysebyrden med 80 %, tredobler kapaciteten til trusselshåndtering og reducerer responstiderne fra flere timer til minutter.

På forkant med uendeligt hurtigere trusler

Traditionel beskyttelse med digitale risici var baseret på mennesker, der manuelt skulle gennemgå imiterende websteder, phishing-domæner og profiler og opslag på sociale medier. Doppel så den model blive udvandet, da angribere begyndte at automatisere og lancere trusler hurtigere og på flere områder, end mennesker kunne evaluere dem.

“Vores system behandler en konstant strøm af signaler for at identificere ægte trusler blandt støjen. Når en trussel er registreret, er der et meget smalt tidsrum til at agere i, før skaden er sket. Brug af AI til at automatisere beslutninger er en af de største fordele for virksomheden, og vi kan nedkæmpe angreb med internethastighed og på internetskala.”
– Rahul Madduluri, medstifter og CTO, Doppel

Den hastighed er afgørende for Doppels kunder – organisationer der ikke har råd til at vente timer på at få en trussel bekræftet. Doppels system klassificerer de fleste trusler automatisk og bruger OpenAI-modeller til avanceret tænkning og en struktureret feedback-løkke kendt som forstærket finjustering (RFT) for at forbedre modellen over tid. I RFT anvendes menneskelig feedback som bedømmelseseksempler, der hjælper modellerne med at lære at træffe konsistente, forklarlige beslutninger på egen hånd.

Orkestrering af LLM-drevet trusselsregistrering

Doppels LLM-drevne pipeline sidder i centrum for registreringsstakken. Efter at signalerne er fundet og filtreret, udfører systemet en række målrettede opgaver: avanceret overvejelse om potentielle trusler, bekræftelse af hensigt og beslutning om klassificering. Hvert trin er konstrueret til at balancere hastighed, præcision og konsistens, og lade analytikere fokusere på ydertilfælde, der kræver menneskelig vurdering.

Et flowdiagram viser en pipeline for registrering af trusler ved hjælp af LLM'er fra registrering og filtrering over funktionsudtrækning og klassificering og til endelig verificering og systemnedtagning. Modeller som GPT-5 og o4-mini bruges på vigtige trin.

Sådan fungerer det:

  • Signalfiltrering og funktionsudtræk: Doppels systemer behandler millioner af domæner, URL'er og konti hver dag. En kombination af heuristik og OpenAI o4-mini filtrerer støj fra og udtrækker strukturerede funktioner, der skal guide efterfølgende modelevalueringer.
  • Parallel bekræftelse af trusler: Hvert signal passerer gennem flere GPT‑5-specialbyggede prompter til forskellige typer trusselsanalyser. Disse forespørgsler vurderer faktorer som f.eks. imitationsrisiko, misbrug af brands eller mønstre for social engineering.
  • Klassificering af trusler: RFT-versionen af o4-mini kombinerer de tidligere bekræftelser for at tildele en struktureret mærkat – ondsindet, godartet eller tvivlsom – med konsistens i produktionskvalitet.
  • Endelig verificering: En anden gennemgang med GPT‑5 bekræfter modellens beslutning og genererer en begrundelse på naturligt sprog. Hvis pålideligheden overstiger grænseværdien, indleder systemet automatisk en håndhævelse.
  • Menneskelig gennemgang: Resultater med lav pålidelighed eller modstridende resultater videresendes til menneskelige analytikere. Deres beslutninger registreres og indgår i RFT-loopet for løbende at forbedre modellens konsistens.

Træning af modeller via finjustering ved hjælp af forstærkning (RFT)

Doppel har allerede opnået meningsfyldte gevinster fra sin oprindelige LLM-forstærkede registrerings-pipeline, men da det gjaldt tilfælde, hvor samme trussel kunne vurderes forskelligt afhængigt af analytikeren, blev konsistens den begrænsende faktor.

“En reel fordel, der kom ud af RFT, er, at modellens beslutninger bliver mere konsistente.”
—Kiran Arimilli, softwareingeniør, Doppel

For at opbygge den konsistens anvendte Doppel RFT og sine egne analysedata som kilde til feedback. Hver beslutning om at klassificere et domæne som ondsindet, godartet eller tvivlsom blev et bedømt eksempel. De markerede eksempler trænede modellen til at replikere ekspertvurderinger selv for tvetydige ydertilfælde.

Et cirkeldiagram, der viser Doppels arbejdsgang til klassificering af trusler: produktions-LLM'er træffer beslutninger → menneskelige vurderinger laver korrektioner → modeltræning opdaterer modeller → udrulning sender opdaterede modeller til produktion.

Ved at arbejde tæt sammen med OpenAI's applied enginering-team konstruerede Doppel bedømmelsesfunktioner, der ikke blot evaluerede præcisionen men også forklaringskvaliteten og belønnede modeller, der ræsonnerede klart og ikke blot korrekt. Ved at forvandle analytiker-feedback til strukturerede træningsdata hjalp Doppel med at vise, hvordan RFT kunne gøre automatiseret registrering mere konsistent og pålidelig.

Operationalisering af tillid via transparens

Justering af hyperparametre og iterative evalueringer bragte modellen tættere på konsistens på menneskeligt niveau. Men for Doppel betød færdiggørelse af det sidste stykke automatisering, at beslutningstagning med det samme blev gjort forståelig.

Hver automatiseret nedtagning omfatter nu en AI-genereret begrundelse, der forklarer, hvorfor en trussel blev fjernet, så kunderne med det samme får indblik i, hvorfor handlingen blev foretaget – noget der tidligere krævede hjælp fra en analytiker.

I et dashboard vises en advarsel om nedtagning for domænet "d0ppel.click", markeret for at have udgivet sig for at være Doppel. Opsummeringen angiver phishing og oplysningstyveri med en tidslinje til højre, der viser statusopdateringer fra oprettelse til løsning 10. oktober 2025.

Den synlighed øger tilliden, som er en afgørende faktor for Doppels brugere. At se mere end blot, hvilke handlinger der blev foretaget, men også hvorfor, giver teams tillid til at kunne handle hurtigt og konteksten til at kunne forklare beslutningerne internt eller for interessenter.

Overblik over resultaterne

  • Reducer analytikernes arbejdsbyrde med 80 %
  • Reaktionstiden ved trusler er reduceret fra timer til minutter
  • Tredoblet kapacitet til håndtering af trusler
  • De fleste trusler klassificeres automatisk

Kommende tiltag

Efter at have nået en næsten total automatisering for phishing- og imitationsdomæner anvender Doppel nu samme modeldrevne konstruktion på andre kanaler med høj varians.

“Domæner er nok den sværeste kanal, vi håndterer”, siger Madduluri. "Signalerne er rodede, indholdet ændrer sig konstant, og trusler udvikler sig hurtigt på tværs af flere overflader på én gang." Hvis vi kan automatisere det fra ende til anden, kan vi gøre det for alt: sociale medier, betalte annoncer, hvad som helst.”

Den næste milepæl omfatter opskalering af deres RFT-datasæt med flere længder, eksperimentering med nye bedømmelsesstrategier og brug af GPT‑5 til foranstående ekstrahering af funktioner. Disse ændringer vil gøre det muligt for Doppel at konsolidere pipeline-trin og avanceret tænkning på mere komplekse trusselsindikatorer tidligere i processen.

Med hver iteration opbygger Doppel et system, der forsvarer ægte trusler på tværs af alle angrebsvektorer, hvor tilliden er under angreb.