2025年9月9日

SafetyKit 借助 OpenAI 最強大的模型擴展風險智能代理

從利用早期視覺模型預覽版進行原型開發，到以 GPT‑5 擴大規模，SafetyKit 的多模態智能代理正拓展至更多新領域，並進一步提升準確度。

聯絡銷售團隊

SafetyKit 白色標誌置中於深色、帶有垂直紋理的背景上，並配以橙色、黃色和青綠色的暖色漸層光線。

公司規模: 初創公司

地區: 北美洲

行業: 科技, 服務

產品: API

成效

95%+

審核 100% 客戶內容的準確度（SafetyKit 評估）

成效

16B

每日處理的 Token 數量，比六個月前的 2 億大幅上升

成效

10+

使用 GPT-5 後，在最困難的視覺任務上效能提升的百分點

正在載入...

SafetyKit⁠（在新視窗中開啟）建立多模態 AI 智能代理，協助網上市場、支付平台和金融科技公司，偵測並處理文字、圖片、金融交易、商品列表等內容中的欺詐和違禁活動。近來模型推理和多模態理解能力的突破，令這項工作變得更有效，並為風險、合規和安全營運樹立新標準。

SafetyKit 的智能代理運用 GPT‑5、GPT‑4.1、深度研究，以及電腦操作智能代理 (CUA) 審核 100% 的客戶內容；按 SafetyKit 的評估，準確度超過 95%。這些智能代理可協助平台保護用戶、防止詐騙、避免監管罰款，並執行傳統系統可能遺漏的複雜政策，例如因地區而異的規則、隱藏在詐騙圖片中的電話號碼，或露骨內容。自動化亦可保護人工審核人員，避免接觸冒犯性內容，並讓他們騰出時間處理更細緻的政策判斷。

「OpenAI 讓我們用到市場上最先進的推理和多模態模型。這讓我們可以更快調整、更快推出新的智能代理，並處理其他方案甚至無法解析的內容類型。」

SafetyKit 創辦人兼行政總裁 David Graunke

先按任務所需設計智能代理，再選擇合適模型

SafetyKit 的每個智能代理都專為處理特定風險類別而設，涵蓋從詐騙到非法產品。每一項內容都會分派到最適合處理該類違規的智能代理，並使用最合適的 OpenAI 模型：

GPT‑5 會結合文字、圖片和介面進行多模態推理，找出隱藏風險，並支援分層而精準的決策
GPT‑4.1 能可靠地遵循詳細的內容政策指示，並有效管理大量內容審核工作流程
強化微調 (RFT) 可以在預設模型基礎上進一步提升召回率和精確率，在複雜安全政策方面達到前沿表現
深度研究可把即時網上調查整合到商戶審核和驗證流程之中
電腦操作智能代理 (CUA) 可以將複雜的政策工作自動化，減少對高成本人手審核的依賴

這種模型配對方式，讓 SafetyKit 能以比傳統方案更細緻、更準確的方式，在不同模態之間擴展內容審核。

以詐騙偵測智能代理為例，它不只是掃描文字；而是會分析商品圖片中的 QR 碼或內嵌電話號碼等視覺元素。GPT‑4.1 協助詐騙偵測智能代理解析圖片、理解版面，並判斷是否屬違反政策的情況。

政策披露智能代理會檢查商品列表或到達頁面，確認是否包含所需字眼，例如法律免責聲明或特定地區要求的合規警告。GPT‑4.1 會擷取相關段落，GPT‑5 則評估是否合規，而智能代理會將違規情況標示出來。

Graunke 表示：「我們把智能代理視為針對特定用途而設的工作流程。有些任務需要深入推理，有些則需要多模態上下文。OpenAI 是唯一一套能在兩方面都穩定提供可靠表現的技術。」

借助 GPT‑5 處理灰色地帶和高風險決策

政策判斷往往取決於細微差別。例如某個網上市場要求賣家在保健產品中加入免責聲明，而相關要求會因產品宣稱和地區規則而有所不同。傳統供應商通常依賴關鍵字觸發或僵化的規則集，但這些方法往往無法處理所需的深層判斷，因而導致執行遺漏或錯誤判斷。

SafetyKit 的政策披露智能代理會先參考 SafetyKit 內部資料庫中的政策，再由 GPT‑5 評估內容：是否提及治療或預防？是否在必須披露相關資訊的地區銷售？如果是，商品資料頁面中是否已包含所需字眼？只要有任何一項未達要求，GPT‑5 就會提供結構化輸出內容，供智能代理將問題標示出來。

Graunke 指出：「GPT‑5 的強大之處，在於它能在以真實政策為依據的情況下作出非常精準的推理。這讓我們即使面對其他系統無法正確處理的邊緣個案，仍然可以作出準確而有理可據的決定。」

把每次模型發佈轉化為產品優勢

SafetyKit 會以最困難的案例，為每一款新的 OpenAI 模型進行基準測試，而且往往會在同一天部署表現最佳的模型。透過嚴謹的內部評估，團隊可以迅速找出新模型如何提升表現，並無縫整合到核心基礎設施之中。

當 OpenAI o3 推出時，SafetyKit 利用它提升多個關鍵政策範疇中的邊緣個案表現。其後 GPT‑5 推出，SafetyKit 在數日內便把它部署到最具挑戰性的智能代理之中，令最困難的視覺任務基準分數提升超過 10 個百分點。

「OpenAI 發展迅速，而我們的系統正是為了跟上這個步伐而設。每一次新版本發佈，都為我們帶來營運上的優勢，讓我們能支援以往未能涵蓋的新能力和新領域，同時提升我們為客戶提供的覆蓋範圍和準確度。」

—SafetyKit 創辦人兼行政總裁 David Graunke

SafetyKit 亦會把改進成果再度投入至整個生態系統，直接與 OpenAI 分享評估結果、邊緣個案失敗情況，以及特定政策的相關見解，協助塑造未來模型在安全關鍵工作上的表現。

以最佳 OpenAI 技術支援客戶和處理量增長

SafetyKit 的架構可大規模執行政策，同時帶來速度、精準度和全面的風險覆蓋。在幕後，系統現時每日處理超過 160 億 Token，較六個月前的 2 億大幅上升，同時能分析更多內容而不犧牲準確度。

在同一段時間內，SafetyKit 已擴展至支付風險、詐騙、打擊兒童剝削、反洗黑錢等領域，並新增多個客戶；現時已有數以億計終端用戶受到 SafetyKit 保護。這個基礎讓客戶能更迅速、更有信心地應對新出現的風險。

Graunke 表示：「我們建立了一個循環，讓 OpenAI 每次發佈都能直接加強我們的能力。這正是系統能夠持續改進、始終領先不斷演變風險的原因。」

成效一覽

以超過 95% 準確度審核 100% 客戶內容
每日處理 160 億 Token，比六個月前的 2 億大幅上升
在最困難的視覺任務上，基準分數提升超過 10 個百分點

迎接全新工作時代

全球已有超過 100 萬家企業透過 OpenAI 取得實際成果。

聯絡銷售團隊

繼續閲讀

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

刊物2026年8月1日

Advancing responsible AI across Europe — card

在歐洲推動負責任的 AI 發展

全球事務2026年7月31日

Building abundant intelligence

公司2026年7月31日