Sari la conținutul principal
OpenAI

28 octombrie 2025

Apărarea IA de la Doppel oprește atacurile înainte de propagare

Cu GPT‑5 și reglarea fină prin consolidare (RFT), Doppel a redus volumul de muncă al analiștilor cu 80% și acum atenuează amenințările în câteva minute în loc de câteva ore.

Sigla Doppel albă, centrată pe un fundal metalic închis texturat, cu linii curbe și nituri.
Dimensiunea companiei: Startup
Regiune: America de Nord
Sector de activitate: Tehnologie
Produse: API

Rezultate

80%

fluxuri de lucru reduse pentru analiști

Rezultate

3x

capacitate de gestionare a amenințărilor

Se încarcă…

Un singur site de substituire a identității unei alte persoane poate fi lansat, poate viza mii de utilizatori și poate dispărea în mai puțin de o oră. Este mai mult decât suficient timp pentru ca un atacator să provoace daune reale. Iar cu instrumente generative, poate crea sute de alte site-uri similare.

Doppel a fost creat pentru a proteja organizațiile împotriva deepfake-urilor și a substituirii identității online, dar a realizat rapid că, odată cu dezvoltarea IA, amenințările pot crește la infinit. Atacatorii nu mai erau nevoiți să creeze manual escrocherii; puteau genera în câteva secunde variante nelimitate de kituri de phishing, domenii falsificate și conturi cu identitate substituită.

„Daunele provocate de atacurile de phishing se pot produce în doar câteva minute, pe măsură ce acestea se răspândesc pe rețelele sociale și canalele de mesagerie. Capacitatea de a genera persuasiune infinită la un cost aproape nul a schimbat totul.”
—Rahul Madduluri, Cofondator și director tehnic, Doppel

În cadrul lansării

Pentru a-și menține avantajul, Doppel a dezvoltat un nou tip de sistem de apărare împotriva ingineriei sociale, bazat pe modelele OpenAI GPT‑5 și o4-mini. Platforma Doppel detectează, clasifică și elimină amenințările în mod autonom, reducând volumul de muncă al analiștilor cu 80%, triplând capacitatea de gestionare a amenințărilor și reducând timpii de răspuns de la ore la minute.

Cu un pas înaintea amenințărilor infinit mai rapide

Protecția tradițională împotriva riscurilor digitale se baza pe verificarea manuală a site-urilor de substituire a identității, a domeniilor de phishing și a profilurilor și postărilor de pe rețelele sociale de către oameni. Doppel a observat că acel model începea să cedeze pe măsură ce atacatorii au început să automatizeze, lansând amenințări mai rapid și pe o suprafață de atac mai extinsă decât puteau evalua oamenii.

„Sistemul nostru procesează un flux constant de semnale pentru a identifica amenințările reale din multitudinea de semnale aleatorii. Odată ce se detectează o amenințare, există un interval de timp foarte scurt în care se poate acționa pentru a preveni daunele. Folosirea IA pentru automatizarea procesului decizional reprezintă unul dintre cele mai importante avantaje pentru companie, permițându-ne să combatem atacurile la scara și viteza internetului.”
—Rahul Madduluri, Cofondator și director tehnic, Doppel

Acea viteză este esențială pentru clienții Doppel, organizații care nu își permit să aștepte ore întregi pentru a confirma o amenințare. Sistemul Doppel clasifică automat majoritatea amenințărilor, folosind modele OpenAI pentru raţionament și o buclă structurată de feedback, cunoscută ca reglare fină prin consolidare (RFT), pentru a îmbunătăți modelul în timp. În RFT, feedbackul uman este folosit ca exemple evaluate, ajutând modelele să învețe să ia singure decizii consecvente și explicabile.

Orchestrarea detectării amenințărilor bazate pe LLM

Canalul bazat pe LLM al Doppel reprezintă nucleul sistemului său de detectare. După ce semnalele sunt colectate și filtrate, sistemul efectuează o serie de sarcini de raţionament țintite: analizează amenințările potențiale, confirmă intenția și sprijină luarea deciziilor de clasificare. Fiecare etapă este concepută pentru a echilibra viteza, acuratețea și consecvența, menținând în același timp analiștii concentrați pe cazurile atipice care necesită judecată umană.

O diagramă de flux arată un canal pentru detectarea amenințărilor folosind LLM-uri, trecând de la colectare și filtrare, prin extragerea caracteristicilor și clasificare, până la sistemele finale de verificare și eliminare. Modele precum GPT-5 și o4-mini sunt utilizate în etape cheie.

Iată cum funcționează:

  • Filtrarea semnalelor și extragerea caracteristicilor: sistemele Doppel procesează zilnic milioane de domenii, URL-uri și conturi. O combinație de metode euristice și filtrele OpenAI o4-mini elimină bruiajul și extrage caracteristici structurate pentru a ghida evaluările ulterioare ale modelului.
  • Confirmare paralelă a amenințărilor: fiecare semnal este trecut prin mai multe solicitări GPT‑5 concepute special pentru diferite tipuri de analiză a amenințărilor. Aceste solicitări evaluează factori precum riscul de substituire a identității unei alte persoane, utilizarea abuzivă a mărcilor sau modele de inginerie socială.
  • Clasificarea amenințărilor: versiunea RFT a o4-mini sintetizează confirmările anterioare pentru a atribui o etichetă structurată — rău intenționat, benign sau ambiguu — cu consecvență de nivel de producție.
  • Verificare finală: o a doua trecere cu GPT‑5 validează decizia modelului și generează o justificare în limbaj natural. Dacă nivelul de încredere depășește pragul, sistemul inițiază automat aplicarea măsurilor.
  • Revizuire umană: rezultatele cu nivel scăzut de încredere sau contradictorii sunt direcționate către analiști umani. Deciziile lor sunt înregistrate și reintroduse în bucla RFT pentru a îmbunătăți continuu consecvența modelului.

Instruirea modelelor prin reglarea fină prin consolidare (RFT)

Doppel observase deja câștiguri semnificative din canalul de detectare original, îmbunătățit cu LLM, dar când a venit vorba de cazuri în care aceeași amenințare putea fi evaluată diferit în funcție de analist, consecvența a devenit factorul limitativ.

„Un avantaj real al RFT este că deciziile acelui model devin mai consecvente.”
—Kiran Arimilli, inginer software, Doppel

Pentru a asigura această consecvență, Doppel a aplicat tehnologia RFT folosind propriile date de analiză ca sursă de feedback. Fiecare decizie de a clasifica un domeniu ca rău intenționat, benign sau neclar devenea un exemplu evaluat. Acele exemple etichetate au instruit modelul să reproducă judecata experților, chiar și în cazuri limită ambigue.

O diagramă circulară prezintă fluxul de lucru pentru clasificarea amenințărilor Doppel: modelele lingvistice mari din producție iau decizii → evaluatorii umani oferă corecții → instruirea modelelor actualizează modelele → implementarea trimite modelele actualizate în producție.

Lucrând îndeaproape cu echipa de inginerie aplicată a OpenAI, Doppel a conceput funcții de evaluare care evaluau nu doar acuratețea, ci și calitatea explicațiilor, recompensând modelele care raționau clar, nu doar corect. Transformând feedbackul analiștilor în date de instruire structurate, Doppel a contribuit la demonstrarea modului în care RFT ar putea face detectarea automată mai consecventă și mai fiabilă.

Operaționalizarea încrederii prin transparență

Reglarea hiperparametrilor și evaluările iterative au adus modelul mai aproape de un nivel de consecvență comparabil cu cel uman. Însă pentru Doppel, parcurgerea ultimei etape a automatizării a însemnat și ca deciziile să devină imediat ușor de înțeles.

Fiecare eliminare automată include acum o justificare generată de IA, care explică de ce a fost eliminată o amenințare, oferind imediat o imagine clară asupra motivului pentru care s-a luat măsura — ceea ce înainte necesita intervenția unui analist.

O vizualizare a tabloului de bord afișează o alertă de eliminare pentru domeniul „d0ppel.click,” semnalat pentru substituirea identității Doppel. Rezumatul menționează phishingul și furtul datelor de autentificare, iar în partea dreaptă este prezentată o cronologie care arată evoluția situației, de la crearea sesizării până la rezolvarea acesteia, pe 10 octombrie 2025.

Acea vizibilitate sporește încrederea, un factor esențial pentru utilizatorii Doppel. Faptul că pot vedea nu doar ce acțiune a fost întreprinsă, ci și de ce, le oferă echipelor încrederea de a răspunde rapid și contextul necesar pentru a explica acele decizii la nivel intern sau părților interesate.

Rezultate dintr-o privire

  • Reduce volumul de muncă al analiștilor cu 80%
  • Timpi de răspuns la amenințări reduși de la ore la minute
  • Capacitate triplată de gestionare a amenințărilor
  • Majoritatea amenințărilor sunt clasificate automat

Ce urmează

După ce a atins o automatizare aproape completă pentru domeniile de phishing și substituire a identității, Doppel aplică acum același cadru bazat pe model și altor canale cu variabilitate ridicată.

„Domeniile sunt probabil cel mai dificil canal de care ne ocupăm”, a declarat Madduluri. „Semnalele sunt dezordonate, conținutul se schimbă constant, iar amenințările evoluează rapid pe mai multe suprafețe simultan. Dacă putem automatiza acest lucru de la un capăt la altul, o vom putea face pentru orice: rețele sociale, reclame plătite, orice.”

Următoarele etape includ scalarea setului de date RFT cu un ordin de mărime, experimentarea cu noi strategii de evaluare și utilizarea GPT‑5 pentru extragerea caracteristicilor în etapa inițială. Aceste modificări vor permite companiei Doppel să consolideze etapele din fluxul de lucru și să analizeze indicatorii de amenințare mai complecși mai devreme în cadrul procesului.

Cu fiecare iterație, Doppel se îndreaptă spre un sistem care protejează realitatea în toate domeniile în care încrederea este pusă la încercare.