跳至主要內容
OpenAI

2025年10月28日

Doppel 的人工智慧防禦系統能預先防止攻擊擴散。

Doppel 利用 GPT‑5 和強化微調 (RFT) 技術將分析師的工作量減少 80%,現在只需要幾分鐘而非幾小時即可緩解威脅。

白色 Doppel 標誌位於帶有曲線和鉚點紋理的深色金屬背景中央。
公司規模: 新創公司
地區: 北美
產業: 科技
產品: API

成果

80%

簡化分析師的工作流程

成果

3x

威脅處理能力

載入中…

單一冒充網站可以用不到一個小時的時間上線,針對數千名使用者,然後消失不見。這已經給攻擊者足夠的時間造成實際損害。而且他們可以借助生成式工具,瞬間創造出數百個類似網站。

Doppel 建立的初衷是保護組織免受深度偽造和線上冒充侵害,但很快就意識到人工智慧意味著威脅可以無限擴展。攻擊者不再需要動手製作詐騙手段,他們可以在幾秒鐘內就產生無數種網路釣魚工具套件、偽造網域及冒充帳戶。

「網路釣魚攻擊透過社群媒體與即時通訊平台迅速擴散,往往在幾分鐘內就造成損害。」幾乎零成本就能大量製造具說服力內容的能力,徹底改變了一切。」
— Rahul Madduluri,Doppel 共同創辦人暨技術長

推行內幕

為了搶佔先機,Doppel 以 OpenAI GPT‑5 和 o4-mini 模型為基礎,開發新型社交工程防禦系統。Doppel 的平台能夠自主偵測、分類與清除威脅,進而將分析師的工作量減少 80%,將威脅處理能力提高三倍,並將回應時間從數小時縮短為數分鐘。

面對不斷加速的威脅,持續搶得先機

傳統的數位風險防護依賴人工審查冒充網站、釣魚網域以及社交媒體的設定檔和貼文。Doppel 發現這套模型正在瓦解。攻擊者開始自動化作業,發動威脅的速度與規模早已超出人力所能評估的範圍。

「我們的系統處理源源不斷的訊號,希望能從雜訊中識別出真正的威脅。一旦偵測到威脅,必須在損害造成之前的極短時間內採取行動。運用人工智慧自動做出決策,是公司的一大突破,使我們能以網際網路等級的規模與速度對抗攻擊。」
— Rahul Madduluri,Doppel 共同創辦人暨技術長

這樣的速度對 Doppel 的客戶非常關鍵。這些組織無法等上幾個小時才確認威脅。Doppel 的系統會自動分類大多數威脅,並透過 OpenAI 模型進行推理,同時運用稱為強化微調 (RFT) 的結構化回饋機制,持續改善模型表現。在 RFT 中,人類回饋會作為分級範例,協助模型學會自行做出一致且可解釋的決策。

整合 LLM 驅動的威脅偵測流程

Doppel 的 LLM 驅動流程位於整體偵測架構的核心。訊號完成收集與過濾後,系統會執行一系列針對性的推理任務,包括分析潛在威脅、確認意圖,以及做出分類判斷。每個階段都兼顧速度、準確性與一致性,同時讓分析師專注處理需要人類判斷的少數特殊案例。

流程圖顯示使用 LLM 偵測威脅的處理管道,從收集和過濾開始,經過特徵擷取與分類,最終進入驗證與下架處理流程。關鍵階段使用 GPT-5 和 o4-mini 等模型。

運作方式如下:

  • 訊號過濾與特徵擷取:Doppel 的系統每天會接收數百萬筆網域、URL 和帳戶資料。系統結合啟發式方法與 OpenAI o4-mini,過濾雜訊並擷取結構化特徵,提供後續模型評估使用。
  • 平行威脅確認:每筆訊號都會經過多個 GPT‑5 提示,分別針對不同類型的威脅分析進行設計。這些提示詞會評估冒充風險、品牌濫用或社交工程模式等因素。
  • 威脅分類:RFT 版本的 o4-mini 會整合前面的確認結果,為威脅加上結構化標籤,例如惡意、良性或不明,並維持可在正式環境使用的一致性。
  • 最終驗證:系統會再透過 GPT‑5 執行一次檢查,確認模型的決策,並產出自然語言說明。如果信心分數超過門檻,系統會自動啟動處置流程。
  • 人工審查:信心分數較低或結果出現衝突時,會交由人類分析師處理。分析師的決策會記錄下來,回饋至 RFT 迴圈,持續提升模型的一致性。

透過強化微調 (RFT) 訓練模型

Doppel 早已從原本的 LLM 強化偵測流程中看到明顯成效,但當同一個威脅可能因分析師不同而出現不同判斷時,一致性就成了主要限制。

「RFT 帶來的一個重要優勢,是能讓模型的決策更一致。」
—Kiran Arimilli,Doppel 軟體工程師

為了提升一致性,Doppel 以自家分析師的資料作為回饋來源,導入 RFT。每一次將網域判定為惡意、良性或不明的決策,都會轉為分級範例。這些標註過的範例能訓練模型複製專家的判斷,即使面對模糊不清的邊緣案例也能做出一致決策。

圓形圖呈現 Doppel 的威脅分類流程:生產環境中的 LLM 負責決策 → 人工審核提供修正 → 模型訓練更新模型 → 部署將更新後的模型送回生產環境。

Doppel 與 OpenAI 應用工程團隊密切合作,設計評分函數,不只評估準確性,也檢視解釋品質,優先獎勵推理清楚、而不只是結果正確的模型。Doppel 將分析師回饋轉為結構化訓練資料,進一步驗證 RFT 能讓自動化偵測更一致、更可靠。

透過透明化建立信任

透過超參數調整與反覆評估,模型逐步接近人類水準的一致性。對 Doppel 來說,完成自動化的最後一哩路,也代表決策必須一看就懂。

現在,每次自動下架威脅都會附上 AI 生成的說明,交代移除原因,讓客戶立即掌握採取行動的依據;過去這類說明通常需要分析師介入。

資訊主頁顯示網域「d0ppel.click」的下架警示,因冒充 Doppel 而被標記。摘要標明為網路釣魚與憑證竊取攻擊,右側的時間軸顯示攻擊從建立到 2025 年 10 月 10 日完成處理的狀態更新。

這種透明度能提升信任,也是 Doppel 使用者的重要考量。團隊不只知道採取了哪些行動,也清楚原因,因而更有信心快速回應,並能向內部或利害關係人說明決策依據。

結果一覽

  • 分析師工作量降低 80%
  • 威脅回應時間從數小時縮短至數分鐘
  • 威脅處理能力提升至 3 倍
  • 多數威脅可自動完成分類

未來規畫

在網路釣魚與冒充網域幾乎全面自動化後,Doppel 開始將這套模型驅動架構延伸到其他變化幅度較高的管道。

Madduluri 表示:「網域大概是我們處理過最棘手的管道。訊號來源混雜,內容持續變動,威脅也會同時在多個面向快速演變。如果能把整個流程做到端對端自動化,其他領域也都辦得到,例如社群媒體、付費廣告等等。」

接下來的里程碑包括將 RFT 資料集擴大至原本的 10 倍、嘗試新的評分策略,以及使用 GPT‑5 進行上游特徵擷取。上述調整將讓 Doppel 能整合流程中的不同階段,並在更早期就處理更複雜的威脅指標。

每一次迭代,Doppel 都讓這套系統更完善,在信任遭受攻擊的每個戰線上守住真實資訊。