Hopp til hovedinnhold
OpenAI

28. oktober 2025

Doppels AI-forsvarssystem stopper angrep før de sprer seg

Med GPT‑5 og finjustering av forsterkning (RFT) reduserte Doppel arbeidsbyrden til analytikere med 80 % og reduserer nå trusler på minutter i stedet for timer.

Doppel-logo i hvitt sentrert på en teksturert mørk metallisk bakgrunn med kurvede linjer og nagler.
Bedriftsstørrelse: Oppstartsbedrift
Region: Nord-Amerika
Bransje: Teknologi
Produkter: API

Resultater

80%

reduserte analytikeres arbeidsflyter

Resultater

3x

kapasitet til å håndtere trusler

Laster inn …

Et enkelt nettsted for etterligning kan lanseres, sikte seg inn på tusenvis av brukere og forsvinne på under en time. Det er mer enn nok tid for en angriper til å gjøre virkelig skade. Og med generative verktøy kan de lage hundrevis av lignende nettsteder.

Doppel ble bygget for å forsvare organisasjoner mot deepfakes og etterligninger på nettet, men oppdaget raskt at AI gjorde at trusler kunne skaleres uendelig. Angripere trengte ikke lenger lage svindelinnhold for hånd, de kunne generere uendelige varianter av sett for phishing, forfalskede domener og etterligningskontoer på sekunder.

«Skader fra phishing-angrep kan oppstå i løpet av minutter når de sprer seg på sosiale medier og meldingskanaler. Evnen til å skape uendelig overtalelse til nesten ingen kostnad forandret alt.»
-Rahul Madduluri, medgrunnlegger og CTO, Doppel

Inne i lanseringen

For å være i forkant utviklet Doppel et nytt forsvarssystem mot sosial manipulering basert på OpenAI GPT‑5‑ og o4-mini-modell. Doppels plattform oppdager, klassifiserer og tar ned trusler autonomt, noe som reduserer arbeidsbyrden til analytikere med 80 %, tredobler evnen til å håndtere trusler og reduserer responstid fra timer til minutter.

Være i forkant av uendelig raskere trusler

Tradisjonell digital risikobeskyttelse stolte på folk som manuelt sjekket nettsteder for etterligning, nettfiskingsdomener og profiler og innlegg på sosiale medier. Doppel så at modellen brøt sammen da angripere begynte å automatisere og lansere trusler raskere og på flere flater enn folk kunne vurdere.

«Systemet vårt håndterer en konstant strøm av signaler for å finne de virkelige truslene blant all støyen. Når en trussel oppdages, har man et veldig kort tidsrom til å handle før skaden skjer. Å bruke AI for å automatisere beslutningstaking er en av de største mulighetene for selskapet, og lar oss bekjempe angrep i internettskala og -hastighet.»
-Rahul Madduluri, medgrunnlegger og CTO, Doppel

Den hastigheten er kritisk for Doppels kunder – organisasjoner som ikke kan vente i timer for å bekrefte en trussel. Doppels system klassifiserer de fleste trusler automatisk med OpenAI-modeller for resonnering og en strukturert tilbakemeldingssløyfe som kalles finjustering av forsterkning (RFT) for å forbedre modellen over tid. I RFT brukes menneskelige tilbakemeldinger som graderte eksempler, noe som hjelper modellene med å lære å ta konsekvente, forklarbare avgjørelser på egen hånd.

Orkestrerer LLM-basert trusseloppdagelse

Doppels LLM-drevne prosesskjede står i sentrum av oppdagelsesstakken. Når signaler er hentet og filtrert, utfører systemet en serie målrettede resonneringsoppgaver: resonnering gjennom potensielle trusler, bekreftelse av hensikt og fatte klassifiseringsbeslutninger. Hvert trinn er utformet for å balansere hastighet, nøyaktighet og konsistens, mens analytikere fokuserer på grensetilfeller som trenger menneskelig dømmekraft.

Et flytdiagram viser en prosess for trusseloppdagelse med LLM-er og går fra henting og filtrering, via uthenting av kjennetegn og klassifisering, til endelig bekreftelse og systemer for fjerning. Modell som GPT-5 og o4-mini brukes i nøkkeltrinn.

Slik fungerer det:

  • Signalfiltrering og funksjonsuttrekking: Doppels systemer inntar flere millioner domener, URL-er og kontoer daglig. En kombinasjon av heuristikk og OpenAI o4-mini filtrerer ut støy og henter ut strukturerte funksjoner for å veilede etterfølgende modellevalueringer.
  • Parallell trusselbekreftelse: Hvert signal går gjennom flere GPT‑5-prompter som er laget spesielt for ulike typer trusselanalyse. Disse promptene vurderer faktorer som etterligningsrisiko, misbruk av merkevarer og mønstre for sosial manipulering.
  • Trusselklassifisering: RFT-versjonen av o4-mini syntetiserer de tidligere bekreftelsene for å tilordne en strukturert etikett – skadelig, godartet eller tvetydig – med konsistens av produksjonsgrad.
  • Endelig bekreftelse: En andre GPT‑5-gjennomgang bekrefter modellens avgjørelse og genererer en begrunnelse på naturlig språk. Hvis konfidensen overstiger terskelen, starter systemet håndheving automatisk.
  • Menneskelig gjennomgang: Resultater med lav tillit eller motstridende resultater sendes til menneskelige analytikere. Avgjørelsene deres loggføres og mates tilbake til RFT-sløyfen for å forbedre modellkonsistensen kontinuerlig.

Opplæring av modeller gjennom finjustering av forsterkning (RFT)

Doppel hadde allerede sett betydelige gevinster fra sin opprinnelige LLM-forsterkede deteksjonsprosess, men når det gjaldt saker der den samme trusselen kunne vurderes forskjellig avhengig av analytikeren, ble konsistens den begrensende faktoren.

«En reell fordel som kom ut av RFT, er at du gjør modellens avgjørelser mer konsistente.»
—Kiran Arimilli, Programvareingeniør, Doppel

For å bygge opp den konsistensen brukte Doppel RFT med sine egne analytikerdata som tilbakemeldingskilde. Hver avgjørelse for å klassifisere et domene som skadelig, godartet eller uklart ble et gradert eksempel. Disse merkede eksemplene trente opp modellen til å gjenskape ekspertvurderinger, selv for tvetydige grensetilfeller.

Et rundt diagram viser Doppel-arbeidsflyten for trusselklassifikasjon: produksjons-LLM-er tar avgjørelser → menneskelige evaluerere gir korrigeringer → modellopplæring oppdaterer modeller → utrulling sender oppdaterte modeller til produksjon.

I nært samarbeid med OpenAIs team for praktisk teknisk arbeid designet Doppel graderingsfunksjoner som ikke bare evaluerte nøyaktighet, men også kvaliteten på forklaringene, og belønnet modeller som resonnerte tydelig, ikke bare riktig. Ved å gjøre analytikertilbakemeldinger til strukturerte opplæringsdata bidro Doppel til å vise hvordan RFT kunne gjøre automatisert registrering mer konsistent og pålitelig.

Operasjonalisering av tillit gjennom åpenhet

Finjustering av hyperparametre og gjentatte evalueringer brakte modellen nærmere menneskelig konsistens. Men for Doppel betydde å fullføre den siste delen av automatiseringen også å gjøre avgjørelser lett forståelige med en gang.

Hver automatiserte fjerning inkluderer nå en AI-generert begrunnelse som forklarer hvorfor en trussel ble fjernet, noe som gir kunder umiddelbar innsikt i hvorfor handlinger ble tatt – noe som tidligere krevde innblanding av analytiker.

Et dashbord viser et fjerningsvarsel for domenet «d0ppel.click», markert for å utgi seg for å være Doppel. Sammendraget nevner phishing og tyveri av legitimasjon, med en tidslinje til høyre som viser statusoppdateringer fra opprettelse til løsning 10. oktober 2025.

Den synligheten øker tilliten, noe som er en viktig faktor for Doppels brukere. Å se ikke bare hvilken handling som ble tatt, men også hvorfor, gir teamene trygghet til å svare raskt og konteksten til å forklare disse avgjørelsene internt eller til interessenter.

Kort sagt om resultatene

  • Reduser arbeidsbyrden til analytikere med 80 %
  • Reduserte responstiden for trusler fra timer til minutter
  • Tredoblet kapasitet til å håndtere trusler
  • De fleste trusler klassifiseres automatisk

Hva skjer videre?

Etter å ha nådd nesten fullstendig automatisering for domener med phishing og etterligning, bruker Doppel nå samme modellbaserte rammeverk på andre kanaler med høy varians.

«Domener er antageligvis den vanskeligste kanalen vi håndterer», sa Madduluri. «Signalene er rotete, innhold endres konstant, og trusler utvikler seg raskt på flere flater samtidig.» Hvis vi kan automatisere det fra ende til annen, kan vi gjøre det for hva som helst: sosiale medier, betalte annonser, og alt mulig annet.»

De neste milepælene inkluderer å skalere RFT-datasettet deres med en størrelsesorden, teste ut nye graderingsstrategier og bruke GPT‑5 for å hente ut funksjoner oppstrøms. Disse endringene gjør at Doppel kan slå sammen prosesstrinn og tenke gjennom mer komplekse trusselindikatorer tidligere i prosessen.

Med hver iterasjon bygger Doppel mot et system som beskytter det ekte på alle flater der tillit er truet.