跳到主要內容
OpenAI

2025年10月28日

Doppel 的 AI 防衛系統能搶先阻截攻擊,防止攻擊擴散

透過 GPT‑5 和強化微調 (RFT),Doppel 令分析師的工作量減少達 80%,並將緩解威脅的所需時間從以往的數小時縮減至現在的數分鐘。

白色 Doppel 標誌置中,背景為帶有曲線和鉚釘紋理的深色金屬表面。
公司規模: 初創公司
地區: 北美洲
行業: 科技
產品: API

成效

80%

分析員工作流程減少幅度

成效

3x

威脅處理能力

正在載入...

單一的假冒他人網站可以針對數以千計的用戶發動攻擊,並在一小時內消失得無影無蹤。這段短短時間,足以讓攻擊者造成實際破壞。而借助生成式工具,攻擊者更可隨手創造出數以百計類似的攻擊。

Doppel 的設計旨在保護組織免受深度偽造和網絡假冒的侵害,但很快便意識到隨著 AI 的出現,攻擊威脅可以無限擴張。攻擊者無需再人手製作騙局;而是可以在數秒之間生成無數不同版本的網絡釣魚陷阱、偽造的網域和假冒的帳戶。

「網絡釣魚攻擊一旦在社交媒體和通訊渠道擴散,短短幾分鐘內就可能造成損害。現在幾乎不費吹灰之力,就能產生無窮的說服力,這種突破徹底改變了一切。」
—Doppel 聯合創辦人兼技術總監 Rahul Madduluri

推行過程

為了搶先防範,Doppel 開發了一套新型的社交工程防衛系統,並以 OpenAI GPT‑5 和 o4-mini 模型作為基礎。Doppel 的平台可以自動偵測威脅,然後加以分類和刪除,令分析師的工作量減少 80%、威脅處理能力是之前的三倍,更可將回應時間從以往的數小時縮減至數分鐘。

搶先阻截無限加速的威脅

傳統數碼風險保護措施依賴審核員對假冒網站、釣魚網域、以及社交媒體個人檔案和貼文進行人手審核。Doppel 發現當攻擊者開始以自動化方式發動攻擊,這個審查模型就逐漸瓦解;隨著攻擊者更快並在更多不同渠道發動威脅,人手審核已無法追上評估速度。

「我們的系統會持續處理海量訊號,從眾多雜亂干擾的資訊中識別真正的威脅。一旦偵測到威脅,便需要把握攻擊造成破壞前的極短時間採取行動。運用 AI 把決策自動化,是公司其中一個最重要的突破,讓我們能以互聯網級別的規模和速度對抗攻擊。」
—Doppel 聯合創辦人兼技術總監 Rahul Madduluri

速度對 Doppel 的顧客尤其關鍵,因為組織無法浪費數小時來確認威脅。Doppel 的系統可以自動將大部分威脅分類;這套系統利用 OpenAI 模型進行推理,同時執行稱為強化微調 (RFT) 的結構性反饋循環,令模型可以隨時日不斷改進。RFT 利用人工反饋作為評分例子,協助模型學習自行作出一致而又可解釋的決策。

協調由大語言模型 (LLM) 推動的威脅偵測

Doppel 的大語言模型 (LLM) 流程是其偵測架構的核心。系統會先蒐集和過濾各種訊號,然後進行一連串有針對性的推理任務:對潛在威脅進行推理、確認意圖,並推動分類決策。每個階段的設計都旨在平衡速度、準確性和一致性,同時由分析師重點處理需要人工判斷的邊緣個案。

流程圖展示利用大語言模式進行威脅偵測的流程,從蒐集和過濾訊號、至特徵提取和分類,到最終驗證和刪除機制。在各個關鍵階段均採用 GPT-5 和 o4-mini 等模型。

運作方式:

  • 訊號篩選和特徵提取:Doppel 的系統每日需要消化數百萬計的網域、網址和帳戶。結合啟發式演算法和 OpenAI o4-mini,就能過濾雜亂資訊並提取結構化特徵,從而引導後續模型評估。
  • 平行威脅確認:為了進行不同類型的威脅分析,每個訊號都需要通過多個專門設計的 GPT‑5 提示詞。這些提示詞會評估假冒風險、品牌濫用或社交工程模式等因素。
  • 威脅分類:經 RFT 訓練的 o4-mini 會整合前期驗證結果以分配具結構性的標籤(惡意、良性或含糊),而分類可達至生產級別的一致性。
  • 最終驗證:系統會再透過 GPT‑5 進行第二次檢查,以驗證模型決策,並生成自然語言說明。如果信賴度超過門檻,系統就會自動啟動執行機制。
  • 人工審核:對於信心水平偏低或結果互相矛盾的個案,系統會轉交人工分析員處理。他們的決策會被記錄,並再次投入至 RFT 循環,持續提升模型一致性。

透過強化微調 (RFT) 訓練模型

雖然 Doppel 原有採用大語言模型的偵測流程已帶來有意義的成效,但在部分個案中,相同的威脅可能視乎分析員而出現不同判斷,令一致性成為偵測工作的限制。

「RFT 的其中一個真正優勢,是你可以令模型決策更加一致。」
—Doppel 軟件工程師 Kiran Arimilli

為了確立一致性,Doppel 利用自家分析員數據作為 RFT 的反饋來源。每一個將網域分類為惡意、良性或不明確的決策,都成為一個分級例子。這些標籤例子訓練模型模仿專家判斷,即使對含糊的邊緣個案亦有穩定分析。

一個圓形示意圖顯示 Doppel 的威脅分類工作流程:生產環境中的 LLM 作出決策 → 人工審核人員提供修正 → 模型訓練更新模型 → 部署把更新後的模型送回生產環境。

Doppel 與 OpenAI 的應用工程團隊緊密合作,設計出全新評分功能,不但可評估準確性,同時亦著重解釋的質素,獎勵模型不只要作出正確推理,同時亦要解釋清晰。透過將分析員的反饋轉化成具結構性的訓練數據,Doppel 協助展示 RFT 可以更穩定可靠地作出自動化決策。

以透明度落實可信任的系統

透過超參數微調和反覆評估,模型就能更趨近於人類級別的穩定性表現。但對於 Doppel 而言,完成最終自動化,亦意味著令決策變得即時可以理解。

每當模型自動刪除威脅內容,都會附上 AI 生成的理據以解釋移除威脅的原因,讓顧客可以即時了解採取行動的依據,這些工作以往都需要分析員的介入。

資訊主頁檢視顯示刪除警報,並說明網域「d0ppel.click」被標籤為假冒 Doppel。摘要提及釣魚和憑證盜用,右側的時間線顯示 2025 年 10 月 10 日由產生至解決的狀況更新。

這些清晰說明有助提升信任,這對 Doppel 的用戶尤其關鍵。團隊不只可看到所採取的行動,更可了解行動背後的理據,就能令團隊對迅速應對更有信心,同時可以有充分資料向內部或持分者解釋這些決定。

成效一覽

  • 令分析員工作量減少 80%
  • 把威脅回應時間由數小時縮短至幾分鐘
  • 把威脅處理能力提升至三倍
  • 大部分威脅可自動完成分類

展望將來

Doppel 在釣魚網站和假冒網域等範疇上已達至幾乎完全自動化,現在更將相同的模型架構應用到其他高度變化的渠道。

Madduluri 表示:「在我們處理的眾多渠道之中,網域可算是最難的一個。當中的訊號異常雜亂、內容不斷變化,而且威脅可以同時在數個平台之間快速演變。如果我們能將這個範疇全面自動化,其他範疇也絕無問題;無論是社交媒體、付費廣告,你數得出的都能處理。」

下一個里程碑將會包括大幅擴展 RFT 數據集、試驗新的評分策略,以及利用 GPT‑5 進行上流特徵提取。這些改善將有助 Doppel 鞏固流程的不同階段,並可及早對較複雜的威脅進行推理。

隨著每次反覆改善,Doppel 正致力建造一套系統,在信任遭受攻擊的不同層面中捍衛真相。