SafetyKit 借助 OpenAI 最強大的模型擴展風險智能代理
從利用早期視覺模型預覽版進行原型開發,到以 GPT‑5 擴大規模,SafetyKit 的多模態智能代理正拓展至更多新領域,並進一步提升準確度。

成效
95%+
審核 100% 客戶內容的準確度(SafetyKit 評估)
成效
16B
每日處理的 Token 數量,比六個月前的 2 億大幅上升
成效
10+
使用 GPT-5 後,在最困難的視覺任務上效能提升的百分點
SafetyKit(在新視窗中開啟) 建立多模態 AI 智能代理,協助網上市場、支付平台和金融科技公司,偵測並處理文字、圖片、金融交易、商品列表等內容中的欺詐和違禁活動。近來模型推理和多模態理解能力的突破,令這項工作變得更有效,並為風險、合規和安全營運樹立新標準。
SafetyKit 的智能代理運用 GPT‑5、GPT‑4.1、深度研究,以及電腦操作智能代理 (CUA) 審核 100% 的客戶內容;按 SafetyKit 的評估,準確度超過 95%。這些智能代理可協助平台保護用戶、防止詐騙、避免監管罰款,並執行傳統系統可能遺漏的複雜政策,例如因地區而異的規則、隱藏在詐騙圖片中的電話號碼,或露骨內容。自動化亦可保護人工審核人員,避免接觸冒犯性內容,並讓他們騰出時間處理更細緻的政策判斷。
「OpenAI 讓我們用到市場上最先進的推理和多模態模型。這讓我們可以更快調整、更快推出新的智能代理,並處理其他方案甚至無法解析的內容類型。」
先按任務所需設計智能代理,再選擇合適模型
SafetyKit 的每個智能代理都專為處理特定風險類別而設,涵蓋從詐騙到非法產品。每一項內容都會分派到最適合處理該類違規的智能代理,並使用最合適的 OpenAI 模型:
- GPT‑5 會結合文字、圖片和介面進行多模態推理,找出隱藏風險,並支援分層而精準的決策
- GPT‑4.1 能可靠地遵循詳細的內容政策指示,並有效管理大量內容審核工作流程
- 強化微調 (RFT) 可以在預設模型基礎上進一步提升召回率和精確率,在複雜安全政策方面達到前沿表現
- 深度研究可把即時網上調查整合到商戶審核和驗證流程之中
- 電腦操作智能代理 (CUA) 可以將複雜的政策工作自動化,減少對高成本人手審核的依賴
這種模型配對方式,讓 SafetyKit 能以比傳統方案更細緻、更準確的方式,在不同模態之間擴展內容審核。
以詐騙偵測智能代理為例,它不只是掃描文字;而是會分析商品圖片中的 QR 碼或內嵌電話號碼等視覺元素。GPT‑4.1 協助詐騙偵測智能代理解析圖片、理解版面,並判斷是否屬違反政策的情況。
政策披露智能代理會檢查商品列表或到達頁面,確認是否包含所需字眼,例如法律免責聲明或特定地區要求的合規警告。GPT‑4.1 會擷取相關段落,GPT‑5 則評估是否合規,而智能代理會將違規情況標示出來。
Graunke 表示:「我們把智能代理視為針對特定用途而設的工作流程。有些任務需要深入推理,有些則需要多模態上下文。OpenAI 是唯一一套能在兩方面都穩定提供可靠表現的技術。」
借助 GPT‑5 處理灰色地帶和高風險決策
政策判斷往往取決於細微差別。例如某個網上市場要求賣家在保健產品中加入免責聲明,而相關要求會因產品宣稱和地區規則而有所不同。傳統供應商通常依賴關鍵字觸發或僵化的規則集,但這些方法往往無法處理所需的深層判斷,因而導致執行遺漏或錯誤判斷。
SafetyKit 的政策披露智能代理會先參考 SafetyKit 內部資料庫中的政策,再由 GPT‑5 評估內容:是否提及治療或預防?是否在必須披露相關資訊的地區銷售?如果是,商品資料頁面中是否已包含所需字眼?只要有任何一項未達要求,GPT‑5 就會提供結構化輸出內容,供智能代理將問題標示出來。
Graunke 指出:「GPT‑5 的強大之處,在於它能在以真實政策為依據的情況下作出非常精準的推理。這讓我們即使面對其他系統無法正確處理的邊緣個案,仍然可以作出準確而有理可據的決定。」
把每次模型發佈轉化為產品優勢
SafetyKit 會以最困難的案例,為每一款新的 OpenAI 模型進行基準測試,而且往往會在同一天部署表現最佳的模型。透過嚴謹的內部評估,團隊可以迅速找出新模型如何提升表現,並無縫整合到核心基礎設施之中。
當 OpenAI o3 推出時,SafetyKit 利用它提升多個關鍵政策範疇中的邊緣個案表現。其後 GPT‑5 推出,SafetyKit 在數日內便把它部署到最具挑戰性的智能代理之中,令最困難的視覺任務基準分數提升超過 10 個百分點。
「OpenAI 發展迅速,而我們的系統正是為了跟上這個步伐而設。每一次新版本發佈,都為我們帶來營運上的優勢,讓我們能支援以往未能涵蓋的新能力和新領域,同時提升我們為客戶提供的覆蓋範圍和準確度。」
SafetyKit 亦會把改進成果再度投入至整個生態系統,直接與 OpenAI 分享評估結果、邊緣個案失敗情況,以及特定政策的相關見解,協助塑造未來模型在安全關鍵工作上的表現。
以最佳 OpenAI 技術支援客戶和處理量增長
SafetyKit 的架構可大規模執行政策,同時帶來速度、精準度和全面的風險覆蓋。在幕後,系統現時每日處理超過 160 億 Token,較六個月前的 2 億大幅上升,同時能分析更多內容而不犧牲準確度。
在同一段時間內,SafetyKit 已擴展至支付風險、詐騙、打擊兒童剝削、反洗黑錢等領域,並新增多個客戶;現時已有數以億計終端用戶受到 SafetyKit 保護。這個基礎讓客戶能更迅速、更有信心地應對新出現的風險。
Graunke 表示:「我們建立了一個循環,讓 OpenAI 每次發佈都能直接加強我們的能力。這正是系統能夠持續改進、始終領先不斷演變風險的原因。」
成效一覽
- 以超過 95% 準確度審核 100% 客戶內容
- 每日處理 160 億 Token,比六個月前的 2 億大幅上升
- 在最困難的視覺任務上,基準分數提升超過 10 個百分點


