Pāriet uz galveno saturu
OpenAI

2025. gada 28. oktobris

Doppel MI aizsargsistēma aptur uzbrukumus, pirms tie izplatās

Ar GPT‑5 un stimulēšanas pielāgošanu (RFT) Doppel samazināja analītiķu darba slodzi par 80% un tagad novērš draudus dažu minūšu, nevis stundu laikā.

Doppel logotips baltā krāsā, novietots centrā uz teksturēta, tumša metāliska fona ar izliektām līnijām un kniedēm.
Uzņēmuma lielums: Jaunuzņēmums
Reģions: Ziemeļamerika
Nozare: Tehnoloģija
Produkti: API

Rezultāti

80%

samazinātas analītiķu darbplūsmas

Rezultāti

3x

draudu apstrādes spēja

Notiek ielāde…

Viena viltus vietne var tikt palaista, vērsties pret tūkstošiem lietotāju un pazust mazāk nekā stundas laikā. Tas ir vairāk nekā pietiekami ilgs laiks, lai uzbrucējs varētu nodarīt reālu kaitējumu. Un ar ģeneratīvajiem rīkiem viņi var izveidot vēl simtiem līdzīgu vietņu.

Doppel tika izveidots, lai aizsargātu organizācijas no dziļviltojumiem un identitātes viltošanas tiešsaistē, taču ātri saprata, ka MI nozīmē, ka draudi var pieaugt bezgalīgā apjomā. Uzbrucējiem vairs nebija nepieciešams manuāli izstrādāt krāpnieciskas shēmas; tie dažu sekunžu laikā varēja ģenerēt bezgalīgi daudz pikšķerēšanas rīku, viltotu domēnu un viltus kontu.

“Pikšķerēšanas uzbrukumu radītais kaitējums var rasties dažu minūšu laikā, tiem izplatoties sociālajos medijos un ziņapmaiņas kanālos. Spēja ģenerēt bezgalīgu pārliecināšanu gandrīz bez izmaksām mainīja visu.”
—Rahuls Maduluri, Doppel līdzdibinātājs un tehnoloģiju direktors

Ieviešanas procesā

Lai saglabātu pārsvaru, uzņēmums Doppel izstrādāja jauna veida sociālās inženierijas aizsardzības sistēmu, kas balstīta uz OpenAI GPT‑5 un o4-mini modeļiem. Doppel platforma autonomi atklāj, klasificē un neitralizē draudus, samazinot analītiķu darba slodzi par 80%, trīskāršojot draudu apstrādes kapacitāti un samazinot reaģēšanas laiku no stundām līdz minūtēm.

Soli priekšā bezgalīgi ātriem draudiem

Tradicionālā digitālo risku aizsardzība balstījās uz viltus vietņu, pikšķerēšanas domēnu un sociālo tīklu profilu un ierakstu manuālu pārskatīšanu, ko veica cilvēki. Doppel novēroja, ka šis modelis sāka nedarboties, kad uzbrucēji sāka automatizēt uzbrukumus, izvēršot apdraudējumus ātrāk un plašāk, nekā cilvēki spēja tos izvērtēt.

“Mūsu sistēma apstrādā nepārtrauktu signālu plūsmu, lai identificētu īstos draudus trokšņa vidū. Kad draudi ir konstatēti, rīcībai ir atlicis ļoti maz laika, pirms ir nodarīts kaitējums. Mākslīgā intelekta izmantošana lēmumu pieņemšanas automatizācijai ir viens no lielākajiem izrāvieniem mūsu uzņēmumam, ļaujot cīnīties pret uzbrukumiem Interneta mērogā un ātrumā.”
—Rahuls Maduluri, Doppel līdzdibinātājs un tehnoloģiju direktors

Šis ātrums ir izšķirošs Doppel klientiem – organizācijām, kas nevar atļauties gaidīt stundām ilgi, lai apstiprinātu draudus. Doppel sistēma automātiski klasificē lielāko daļu apdraudējumu, izmantojot OpenAI spriestspējas modeļus un strukturētu atgriezeniskās saites ciklu, kas pazīstams kā stimulēšanas pielāgošana (RFT), lai laika gaitā uzlabotu modeli. RFT izmanto cilvēka atgriezenisko saiti kā vērtētus piemērus, palīdzot modeļiem iemācīties pieņemt konsekventus, izskaidrojamus lēmumus.

LVM vadītas draudu noteikšanas organizēšana

Doppel process, ko virza LVM (lielie valodu modeļi), ir atklāšanas sistēmas pamatā. Pēc tam, kad signāli ir iegūti un filtrēti, sistēma veic virkni mērķtiecīgu spriestspējas uzdevumu – izvērtējot iespējamos draudus, apstiprinot nolūku un virzot klasifikācijas lēmumus. Katrs posms ir izstrādāts tā, lai līdzsvarotu ātrumu, precizitāti un konsekvenci, vienlaikus ļaujot analītiķiem koncentrēties uz robežgadījumiem, kuros nepieciešama cilvēka spriestspēja.

Plūsmas diagramma parāda draudu noteikšanas procesu, izmantojot lielos valodas modeļus (LVM), sākot no datu avotu iegūšanas un filtrēšanas, līdz pazīmju izguvei un klasifikācijai, un visbeidzot līdz galīgajai pārbaudei un izņemšanas sistēmām. Galvenajos posmos tiek izmantoti tādi modeļi kā OpenAI GPT-5 un o4-mini.

Lūk, kā tas darbojas:

  • Signālu filtrēšana un pazīmju izgūšana: Doppel sistēmas katru dienu apstrādā miljoniem domēnu, URL un kontu. Heiristikas un OpenAI o4-mini kombinācija filtrē troksni un izgūst strukturētas iezīmes, lai virzītu turpmākos modeļu novērtējumus.
  • Paralēla draudu apstiprināšana: katrs signāls tiek apstrādāts ar vairākām GPT‑5 uzvednēm, kas ir īpaši izstrādātas dažādiem draudu analīzes veidiem. Šīs uzvednes novērtē tādus faktorus kā uzdošanās par kādu citu risks, zīmola ļaunprātīga izmantošana vai sociālās inženierijas modeļi.
  • Draudu klasifikācija: OpenAI o4-mini RFT versija apkopo iepriekšējos apstiprinājumus, lai piešķirtu strukturētu apzīmējumu – ļaunprātīgs, nekaitīgs vai neskaidrs – ar ražošanas līmeņa konsekvenci.
  • Galīgā verifikācija: otrā GPT‑5 pārbaude apstiprina modeļa lēmumu un ģenerē dabiskā valodā formulētu pamatojumu. Ja pārliecības rādītājs pārsniedz slieksni, sistēma automātiski uzsāk darbības.
  • Cilvēka pārskatīšana: zemas ticamības vai pretrunīgi rezultāti tiek novirzīti cilvēku analītiķiem. To lēmumi tiek reģistrēti un atgriezti RFT ciklā, lai pastāvīgi uzlabotu modeļa konsekvenci.

Modeļu apmācība ar stimulēšanas pielāgošanu (RFT)

Doppel jau bija novērojis būtiskus uzlabojumus savā sākotnējā uz LVM (lieliem valodu modeļiem) balstītajā noteikšanas procesu kopumā, taču gadījumos, kad viens un tas pats apdraudējums atkarībā no analītiķa var tikt novērtēts atšķirīgi, konsekvence kļūva par noteicošo ierobežojošo faktoru.

“Viens reāls ieguvums no RFT ir tas, ka modeļa lēmumi kļūst konsekventāki.”
—Kirans Arimilli, Doppel programmatūras inženieris

Lai veidotu šo konsekvenci, Doppel izmantoja RFT, par atgriezeniskās saites avotu izmantojot savus analītiķu datus. Katrs lēmums klasificēt domēnu kā ļaunprātīgu, labdabīgu vai neskaidru kļuva par novērtētu piemēru. Šie marķētie piemēri apmācīja modeli atdarināt ekspertu spriedumu pat neskaidros robežgadījumos.

Apļveida diagramma parāda Doppel draudu klasifikācijas darbplūsmu: ražošanas LVM pieņem lēmumus → cilvēki pārskatītāji sniedz labojumus → modeļa apmācība atjaunina modeļus → izvietošana nosūta atjauninātos modeļus uz ražošanu.

Cieši sadarbojoties ar OpenAI lietišķās inženierijas komandu, Doppel izstrādāja vērtēšanas funkcijas, kas novērtēja ne tikai precizitāti, bet arī skaidrojumu kvalitāti, apbalvojot modeļus, kas sprieda skaidri un loģiski, nevis tikai pareizi. Pārvēršot analītiķu atsauksmes strukturētos apmācības datos, Doppel palīdzēja parādīt, kā RFT var padarīt automatizēto noteikšanu konsekventāku un uzticamāku.

Uzticības veidošana ar pārredzamības palīdzību

Hiperparametru regulēšana un iteratīvi novērtējumi pietuvināja modeli cilvēka līmeņa konsekvencei. Taču Doppel gadījumā pēdējā automatizācijas posma pabeigšana nozīmēja arī panākt, lai lēmumi būtu uzreiz saprotami.

Katrs automatizētais noņemšanas gadījums tagad ietver mākslīgā intelekta ģenerētu pamatojumu, kurā skaidrots, kāpēc apdraudējums tika noņemts, sniedzot klientiem tūlītēju ieskatu tajā, kāpēc tika veikta šī darbība – agrāk tam bija nepieciešama analītiķa iesaiste.

Informācijas panelī redzams brīdinājums par domēna „d0ppel.click“ noņemšanu, jo tas atzīmēts kā Doppel viltojums. Kopsavilkumā ir minēta pikšķerēšana un akreditācijas datu zādzība, un labajā pusē esošajā laika skalā ir redzami statusa atjauninājumi no izveides līdz atrisināšanai 2025. gada 10. oktobrī.

Šī pārredzamība veicina uzticēšanos, kas ir izšķirošs faktors Doppel lietotājiem. Redzot ne tikai to, kāda darbība tika veikta, bet arī kāpēc, komandām tiek dota pārliecība ātri reaģēt un konteksts, lai izskaidrotu šos lēmumus iekšēji vai citām ieinteresētajām personām.

Rezultāti īsumā

  • Analītiķu darba slodzes samazināšana par 80%
  • Samazināts reaģēšanas laiks uz draudiem no stundām līdz minūtēm
  • Trīskāršota draudu apstrādes kapacitāte
  • Lielākā daļa draudu klasificēti automātiski

Kas būs tālāk?

Tagad, kad Doppel ir panācis gandrīz pilnīgu automatizāciju attiecībā uz pikšķerēšanas un identitātes viltošanas domēniem, uzņēmums piemēro to pašu uz modeļiem balstīto sistēmu arī citiem kanāliem ar lielu variāciju.

“Domēni, visticamāk, ir grūtākais kanāls, ar ko mēs strādājam,” saka Maduluri. “Signāli ir haotiski, saturs pastāvīgi mainās, un draudi strauji attīstās vienlaikus vairākās virsmās. Ja mēs varam pilnīgi automatizēt šo procesu, mēs to varam darīt jebkurā jomā: sociālajos tīklos, apmaksātās reklāmās un visur citur.”

Nākamie mērķi ir RFT datu kopas palielināšana par veselu kārtu, eksperimentēšana ar jaunām klasifikācijas stratēģijām un GPT‑5 izmantošana iepriekšējas pakāpes pazīmju ieguvei. Šīs izmaiņas ļaus Doppel apvienot procesa posmus un analizēt sarežģītākus draudu indikatorus agrāk procesā.

Ar katru iterāciju Doppel virzās uz sistēmu, kas aizsargā patiesību visās jomās, kur uzticība tiek apdraudēta.