Preskočiť na hlavný obsah
OpenAI

28. októbra 2025

Systém obrany UI od Doppel zastaví útoky skôr, než sa rozšíria

Vďaka GPT‑5 a dolaďovaniu posilňovaním (RFT) Doppel znížil pracovné zaťaženie analytikov o 80 % a teraz zmierňuje hrozby v priebehu minút namiesto hodín.

Logo Doppel v bielej farbe uprostred tmavého kovového pozadia s textúrou, krivkami a nitmi.
Veľkosť spoločnosti: Startup
Región: Severná Amerika
Odvetvie: Technológia
Produkty: API

Výsledky

80%

redukcia analytických pracovných postupov

Výsledky

3x

kapacita na zvládanie hrozieb

Načítava sa…

Jedna stránka na zosobnenie môže vzniknúť, zacieliť na tisíce používateľov a zmiznúť za menej než hodinu. To je viac než dosť času na to, aby útočník spôsobil skutočné škody. A pomocou generatívnych nástrojov môžu rýchlo vytvoriť stovky ďalších podobných.

Doppel bol vytvorený na ochranu organizácií pred deepfakmi a online vydávaniami sa za iné osoby, no rýchlo si uvedomil, že umelá inteligencia znamená, že hrozby sa môžu škálovať donekonečna. Útočníci už nemuseli ručne vytvárať podvody. V priebehu niekoľkých sekúnd mohli generovať nekonečné varianty phishingových súprav, sfalšovaných domén a účtov vydávajúcich sa za niekoho iného.

„Škody z phishingových útokov môžu vzniknúť už v priebehu pár minút, keď sa šíria cez sociálne siete a správy. Schopnosť vytvárať nekonečné presviedčanie takmer zadarmo zmenila všetko.“
– Rahul Madduluri, spoluzakladateľ a CTO, Doppel

Počas zavádzania

Aby si Doppel udržal náskok, vyvinul nový druh systému obrany proti sociálnemu inžinierstvu postavený na modeloch OpenAI GPT‑5 a o4-mini. Platforma spoločnosti Doppel autonómne deteguje, klasifikuje a odstraňuje hrozby, čím znižuje pracovné zaťaženie analytikov o 80 %, strojnásobuje kapacitu spracovania hrozieb a skracuje reakčný čas z hodín na minúty.

Buďte o krok vpred pred nekonečne rýchlejšími hrozbami

Tradičná ochrana pred digitálnymi rizikami sa spoliehala na manuálnu kontrolu stránok vydávajúcich sa za niekoho iného, phishingových domén a profilov a príspevkov na sociálnych sieťach. V spoločnosti Doppel si všimli, že sa tento model rozpadá, keď útočníci začali automatizovať a spúšťali hrozby rýchlejšie a naprieč väčším počtom oblastí útoku ako ľudia dokázali vyhodnotiť.

„Náš systém spracúva neustály príval signálov, aby identifikoval skutočné hrozby v šume. Keď sa zistí hrozba, existuje len veľmi krátke časové okno na konanie predtým, než dôjde ku škode. Využívanie umelej inteligencie na automatizáciu rozhodovania je pre spoločnosť jedným z najväčších prínosov, pretože nám umožňuje bojovať proti útokom v rozsahu a rýchlosti internetu.“
– Rahul Madduluri, spoluzakladateľ a technický riaditeľ spoločnosti Doppel

Táto rýchlosť je pre zákazníkov spoločnosti Doppel rozhodujúca. Organizácie si nemôžu dovoliť čakať celé hodiny na potvrdenie hrozby. Systém spoločnosti Doppel automaticky klasifikuje väčšinu hrozieb pomocou modelov OpenAI na uvažovanie a štruktúrovanej spätnej väzbovej slučky známej ako dolaďovanie posilňovaním (RFT) na priebežné zlepšovanie modelu. V RFT sa ľudská spätná väzba používa ako hodnotené príklady, ktoré pomáhajú modelom učiť sa samostatne prijímať konzistentné a vysvetliteľné rozhodnutia.

Orchestrácia detekcie hrozieb riadenej LLM

Kanál riadený LLM od spoločnosti Doppel je v jadre jeho detekčného stacku. Po získaní a filtrovaní signálov systém vykonáva sériu cielených úloh uvažovania: vyhodnocuje potenciálne hrozby, potvrdzuje zámer a riadi rozhodnutia o klasifikácii. Každá fáza je navrhnutá tak, aby vyvažovala rýchlosť, presnosť a konzistentnosť, a zároveň udržiavala analytikov sústredených na okrajové prípady, ktoré si vyžadujú ľudský úsudok.

Vývojový diagram zobrazuje proces detekcie hrozieb pomocou LLM, ktorý zahŕňa získavanie a filtrovanie, extrakciu príznakov, klasifikáciu a finálne overovanie a systémy odstraňovania. Modely ako GPT-5 a o4-mini sa používajú v kľúčových fázach.

Takto to funguje:

  • Filtrovanie signálov a extrakcia príznakov: Systémy spoločnosti Doppel denne spracúvajú milióny domén, URL adries a účtov. Kombinácia heuristík a OpenAI o4-mini odfiltruje šum a extrahuje štruktúrované funkcie, ktoré usmerňujú následné hodnotenia modelu.
  • Súbežné potvrdzovanie hrozieb: Každý signál sa spracúva pomocou viacerých príkazov GPT‑5, ktoré sú špeciálne vytvorené pre rôzne typy analýzy hrozieb. Tieto príkazy posudzujú faktory, ako sú riziko zosobnenia, zneužitie značky alebo vzorce sociálneho inžinierstva.
  • Klasifikácia hrozieb: RFT verzia modelu o4-mini syntetizuje predchádzajúce potvrdenia, aby priradila štruktúrované označenie – škodlivé, neškodné alebo nejednoznačné – s konzistentnosťou na úrovni produkcie.
  • Záverečné overenie: Druhý chod GPT‑5 overuje rozhodnutie modelu a generuje zdôvodnenie v prirodzenom jazyku. Ak dôvera prekročí prahovú hodnotu, systém automaticky spustí vynucovanie.
  • Ľudská kontrola: Výsledky s nízkou mierou spoľahlivosti alebo konfliktné výsledky sa postupujú ľudským analytikom. Ich rozhodnutia sa zaznamenávajú a vracajú späť do slučky RFT, aby sa priebežne zlepšovala konzistentnosť modelu.

Trénovanie modelov pomocou dolaďovania posilňovaním (RFT)

Spoločnosť Doppel už zaznamenala výrazné prínosy zo svojho pôvodného kanála detekcie vylepšeného pomocou LLM, no pri prípadoch, keď tú istú hrozbu môžu analytici posúdiť rôzne, sa limitom stala konzistentnosť.

„Jednou zo skutočných výhod, ktoré prinieslo RFT, je, že tento model robí rozhodnutia konzistentnejšie.“
– Kiran Arimilli, softvérový inžinier, Doppel

Na vybudovanie tejto konzistentnosti Doppel použil RFT, pričom ako zdroj spätnej väzby použil vlastné analytické údaje. Každé rozhodnutie klasifikovať doménu ako škodlivú, neškodnú alebo nejasnú sa stalo ohodnoteným príkladom. Tieto označené príklady naučili model napodobňovať úsudok expertov, a to aj pri nejednoznačných okrajových prípadoch.

Kruhový diagram zobrazuje pracovný postup klasifikácie hrozieb Doppel: produkčné LLM prijímajú rozhodnutia → ľudskí hodnotitelia poskytujú opravy → trénovanie modelov aktualizuje modely → nasadenie posiela aktualizované modely do produkcie.

V úzkej spolupráci s aplikačným inžinierskym tímom OpenAI spoločnosť Doppel navrhla hodnotiace funkcie (grader), ktoré posudzovali nielen presnosť, ale aj kvalitu vysvetlenia, a odmeňovali modely, ktoré uvažovali jasne, nielen správne. Tým, že Doppel premenil spätnú väzbu analytikov na štruktúrované tréningové údaje, pomohol ukázať, ako môže RFT spraviť automatizovanú detekciu konzistentnejšou a spoľahlivejšou.

Uvádzanie dôvery do praxe prostredníctvom transparentnosti

Ladenie hyperparametrov a iteratívne hodnotenia priblížili model ku konzistencii na ľudskej úrovni. Pre spoločnosť Doppel však dokončenie „poslednej míle“ automatizácie znamenalo aj zabezpečiť, aby boli rozhodnutia okamžite zrozumiteľné.

Každé automatizované odstránenie teraz zahŕňa odôvodnenie vygenerované umelou inteligenciou, ktoré vysvetľuje, prečo bola hrozba odstránená, a zákazníkom okamžite poskytuje prehľad o dôvodoch prijatia opatrenia. Kedysi si to vyžadovalo zásah analytika.

Zobrazenie hlavného panela zobrazuje upozornenie na stiahnutie pre doménu „d0ppel.click“, označené za vydávanie sa za spoločnosť Doppel. Súhrn uvádza phishing a krádež prihlasovacích údajov, pričom časová os vpravo zobrazuje aktualizácie stavu od vytvorenia po vyriešenie 10. októbra 2025.

Táto viditeľnosť posilňuje dôveru, čo je pre používateľov spoločnosti Doppel rozhodujúci faktor. Keď tímy vidia nielen to, aké opatrenie bolo prijaté, ale aj prečo, dodáva im to istotu rýchlo reagovať a poskytuje im to aj kontext na vysvetlenie týchto rozhodnutí interne alebo zainteresovaným stranám.

Prehľad výsledkov

  • Znižuje pracovné zaťaženie analytikov o 80 %
  • Skrátenie časov reakcie na hrozby z hodín na minúty
  • Strojnásobená kapacita na zvládanie hrozieb
  • Automatická klasifikácia väčšiny hrozieb

Čo bude ďalej

Doppel po dosiahnutí takmer úplnnej automatizácie pri phishingu a impersonácii teraz rovnaký rámec postavený na modeloch nasadzuje aj na ďalšie kanály s vysokou variabilitou.

„Domény sú pravdepodobne najťažším kanálom, s ktorým pracujeme,“ povedal Madduluri. „Signály sú neprehľadné, obsah sa neustále mení a hrozby sa rýchlo vyvíjajú naprieč viacerými oblasťami naraz.“ Ak to dokážeme automatizovať od začiatku do konca, dokážeme to urobiť pre čokoľvek: sociálne médiá, platené reklamy, čokoľvek vás napadne.

Ďalšie míľniky zahŕňajú rozšírenie ich dátovej množiny RFT o rádovú hodnotu, experimentovanie s novými stratégiami hodnotenia a používanie GPT‑5 na extrakciu prvkov v skorších fázach. Tieto zmeny umožnia systému Doppel konsolidovať fázy procesu a analyzovať zložitejšie indikátory hrozieb už v skorších fázach.

S každou iteráciou Doppel buduje systém, ktorý chráni to, čo je skutočné, na každej úrovni, kde je dôvera ohrozená.