SafetyKit 運用 OpenAI 最強大的模型,擴展風險智慧體的規模
從早期視覺模型預覽的原型開發,到導入 GPT‑5 擴大規模,SafetyKit 的多模態智慧體持續拓展應用領域,同時提升判斷準確度。

成果
95%+
審核 100% 客戶內容的準確度(SafetyKit 評估)
成果
16B
每日處理的 Token 數量,比六個月前的 2 億大幅上升
成果
10+
使用 GPT-5,在最具挑戰性的視覺任務上顯著提升效能
SafetyKit(在新視窗中開啟) 打造多模態 AI 智慧體,協助市集平台、支付平台與金融科技公司偵測並處理詐欺與違規行為,涵蓋文字、圖片、金融交易、商品刊登內容等多種資料類型。近期在模型推理與多模態理解上的突破,讓這類應用更有效率,也為風險管理、合規與安全營運立下新標準。
SafetyKit 的智慧體結合 GPT‑5、GPT‑4.1、深度研究,以及電腦操作智慧體 (CUA),可全面審核 100% 客戶內容;根據 SafetyKit 評估,整體準確率超過 95%。這些智慧體可協助平台保護使用者、防止詐欺、避免監管罰款,並執行舊有系統可能忽略的複雜政策,例如地區特定規則、詐騙圖片中嵌入的電話號碼,或露骨內容。自動化也能保護人工審核人員,避免接觸冒犯性內容,並讓他們專注處理需要細膩判斷的政策決策。
「OpenAI 讓我們能使用市面上最先進的推理與多模態模型。這讓團隊能快速調整策略、更快推出新的智慧體,也能處理其他解決方案連解析都做不到的內容類型。」
先依任務需求設計智慧體,再選擇合適的模型
SafetyKit 的智慧體各自負責特定風險類別,涵蓋詐騙到非法商品等情境。每一則內容都會分派給最適合處理該違規情況的智慧體,並搭配最佳的 OpenAI 模型:
- GPT‑5 透過多模態推理分析文字、圖像與 UI,找出隱藏風險,並支援分層且精準的決策
- GPT‑4.1 能穩定遵循詳細的內容政策指令,並有效處理高量的審核工作流程
- 強化微調 (RFT) 可提升召回率與精確率,表現超越預設模型,在處理複雜安全政策時達到業界領先成績。
- 深度研究整合即時線上調查,用於查證商家評論與驗證資訊。
- 電腦操作智慧體 (CUA) 可自動處理複雜的政策任務,降低對高成本人工審核的依賴。
這種模型配對方式讓 SafetyKit 能將內容審查擴展至不同模態,細緻度與準確性都優於傳統解決方案。
例如,「詐騙偵測」智慧體不只會掃描文字。該智慧體也會分析產品圖片中的 QR 碼或嵌入的電話號碼等視覺內容。GPT‑4.1 協助解析影像、理解版面配置,並判斷是否違反政策。
「政策揭露」智慧體會檢查商品頁面或著陸頁是否包含必要文字,例如法律免責聲明或特定地區的合規警告。GPT‑4.1 會擷取相關段落,GPT‑5 負責評估是否符合規範,最後由智慧體標示違規項目。
Graunke 表示:「我們將智慧體視為為特定任務打造的工作流程,有些任務需要深入推理,其他任務則需要多模態脈絡。OpenAI 是唯一能在這兩方面都提供穩定效能的整體技術堆疊。」
運用 GPT‑5,處理灰色地帶與高風險決策
政策判斷往往取決於細微差異。以某個要求賣家為保健產品附上免責聲明的市集為例,實際要求會依產品宣稱內容與地區規範而有所不同。傳統供應商多半依賴關鍵字觸發或僵化規則,難以支援這類需要深入判斷的情境,因而容易出現判定遺漏或錯誤。
SafetyKit 的政策揭露智慧體會先參照內部政策資料庫,再由 GPT‑5 評估內容:是否提及治療或預防?是否在必須揭露的地區銷售?若是,頁面中是否確實包含規定用語?只要有任何不符合之處,GPT‑5 會輸出結構化結果,供智慧體標示問題。
Graunke 指出:「GPT‑5 的優勢在於,當以真實政策為依據時,仍能維持高度精準的推理能力,即使在其他系統容易失準的邊緣情境中,也能做出準確且有依據的判斷。」
讓每次模型發布都轉化為產品優勢
SafetyKit 會用最具挑戰性的案例測試每一款新的 OpenAI 模型,並經常在當天就部署表現最佳的模型。透過嚴謹的內部評估,團隊能快速看出新模型帶來的效能提升,並順利整合進核心基礎架構。
當 OpenAI 推出 o3 時,SafetyKit 便用它提升各項關鍵政策領域中邊緣案例的判斷表現。隨後推出的 GPT‑5 在短短幾天內就部署到最複雜的智慧體中,讓最具挑戰性的視覺任務基準測試分數提升超過 10 分。
「OpenAI 發展迅速,我們的系統也從一開始就設計為能跟上這樣的節奏。每次推出新版本,都帶來實質的營運優勢:不只補上過去無法支援的能力與應用場景,也進一步擴大服務涵蓋範圍,同時提升提供給客戶的準確度。」
SafetyKit 也會將改進成果回饋至整個生態系,直接與 OpenAI 分享評估結果、邊緣案例失敗紀錄,以及各項政策面的具體發現,協助改善未來模型在安全關鍵任務中的表現。
運用最佳 OpenAI 技術堆疊,帶動客戶數與處理量成長
SafetyKit 的架構能在大規模下落實政策執行,同時兼顧速度、精準度與完整的風險涵蓋。在幕後,系統現時每日處理超過 160 億 Token,較六個月前的 2 億大幅上升,同時能分析更多內容而不犧牲準確度。
與此同時,SafetyKit 已將業務拓展至支付風險、詐欺、防制兒童剝削、反洗錢等領域,並新增多家客戶;目前已有數以億計的終端使用者受到 SafetyKit 保護。這項基礎讓客戶能迅速且有把握地應對新興風險。
Graunke 解釋:「我們建立了一套機制,讓 OpenAI 每次推出新版本都能直接強化我們的能力,也因此,這套系統會持續進步,始終領先不斷演變的風險。」
結果一覽
- 以超過 95% 的準確率審查 100% 客戶內容
- 每日處理 160 億 Token,較六個月前的 2 億大幅成長
- 在最具挑戰性的視覺任務上,基準測試提升超過 10 分


