2025年9月9日

SafetyKit 運用 OpenAI 最強大的模型，擴展風險智慧體的規模

從早期視覺模型預覽的原型開發，到導入 GPT‑5 擴大規模，SafetyKit 的多模態智慧體持續拓展應用領域，同時提升判斷準確度。

聯絡銷售人員

白色 SafetyKit 標誌置中於深色垂直紋理背景上，背景呈橘、黃與藍綠光交織的暖色漸層。

公司規模: 新創公司

地區: 北美洲

產業: 科技, 服務

產品: API

成果

95%+

審核 100% 客戶內容的準確度（SafetyKit 評估）

成果

16B

每日處理的 Token 數量，比六個月前的 2 億大幅上升

成果

10+

使用 GPT-5，在最具挑戰性的視覺任務上顯著提升效能

載入中…

SafetyKit⁠(在新視窗中開啟) 打造多模態 AI 智慧體，協助市集平台、支付平台與金融科技公司偵測並處理詐欺與違規行為，涵蓋文字、圖片、金融交易、商品刊登內容等多種資料類型。近期在模型推理與多模態理解上的突破，讓這類應用更有效率，也為風險管理、合規與安全營運立下新標準。

SafetyKit 的智慧體結合 GPT‑5、GPT‑4.1、深度研究，以及電腦操作智慧體 (CUA)，可全面審核 100% 客戶內容；根據 SafetyKit 評估，整體準確率超過 95%。這些智慧體可協助平台保護使用者、防止詐欺、避免監管罰款，並執行舊有系統可能忽略的複雜政策，例如地區特定規則、詐騙圖片中嵌入的電話號碼，或露骨內容。自動化也能保護人工審核人員，避免接觸冒犯性內容，並讓他們專注處理需要細膩判斷的政策決策。

「OpenAI 讓我們能使用市面上最先進的推理與多模態模型。這讓團隊能快速調整策略、更快推出新的智慧體，也能處理其他解決方案連解析都做不到的內容類型。」

David Graunke，SafetyKit 創辦人暨執行長

先依任務需求設計智慧體，再選擇合適的模型

SafetyKit 的智慧體各自負責特定風險類別，涵蓋詐騙到非法商品等情境。每一則內容都會分派給最適合處理該違規情況的智慧體，並搭配最佳的 OpenAI 模型：

GPT‑5 透過多模態推理分析文字、圖像與 UI，找出隱藏風險，並支援分層且精準的決策
GPT‑4.1 能穩定遵循詳細的內容政策指令，並有效處理高量的審核工作流程
強化微調 (RFT) 可提升召回率與精確率，表現超越預設模型，在處理複雜安全政策時達到業界領先成績。
深度研究整合即時線上調查，用於查證商家評論與驗證資訊。
電腦操作智慧體 (CUA) 可自動處理複雜的政策任務，降低對高成本人工審核的依賴。

這種模型配對方式讓 SafetyKit 能將內容審查擴展至不同模態，細緻度與準確性都優於傳統解決方案。

例如，「詐騙偵測」智慧體不只會掃描文字。該智慧體也會分析產品圖片中的 QR 碼或嵌入的電話號碼等視覺內容。GPT‑4.1 協助解析影像、理解版面配置，並判斷是否違反政策。

「政策揭露」智慧體會檢查商品頁面或著陸頁是否包含必要文字，例如法律免責聲明或特定地區的合規警告。GPT‑4.1 會擷取相關段落，GPT‑5 負責評估是否符合規範，最後由智慧體標示違規項目。

Graunke 表示：「我們將智慧體視為為特定任務打造的工作流程，有些任務需要深入推理，其他任務則需要多模態脈絡。OpenAI 是唯一能在這兩方面都提供穩定效能的整體技術堆疊。」

淺色背景上的「SafetyKit」折線圖和長條圖，展示多個類別的資料趨勢和比較。

運用 GPT‑5，處理灰色地帶與高風險決策

政策判斷往往取決於細微差異。以某個要求賣家為保健產品附上免責聲明的市集為例，實際要求會依產品宣稱內容與地區規範而有所不同。傳統供應商多半依賴關鍵字觸發或僵化規則，難以支援這類需要深入判斷的情境，因而容易出現判定遺漏或錯誤。

SafetyKit 的政策揭露智慧體會先參照內部政策資料庫，再由 GPT‑5 評估內容：是否提及治療或預防？是否在必須揭露的地區銷售？若是，頁面中是否確實包含規定用語？只要有任何不符合之處，GPT‑5 會輸出結構化結果，供智慧體標示問題。

Graunke 指出：「GPT‑5 的優勢在於，當以真實政策為依據時，仍能維持高度精準的推理能力，即使在其他系統容易失準的邊緣情境中，也能做出準確且有依據的判斷。」

讓每次模型發布都轉化為產品優勢

SafetyKit 會用最具挑戰性的案例測試每一款新的 OpenAI 模型，並經常在當天就部署表現最佳的模型。透過嚴謹的內部評估，團隊能快速看出新模型帶來的效能提升，並順利整合進核心基礎架構。

當 OpenAI 推出 o3 時，SafetyKit 便用它提升各項關鍵政策領域中邊緣案例的判斷表現。隨後推出的 GPT‑5 在短短幾天內就部署到最複雜的智慧體中，讓最具挑戰性的視覺任務基準測試分數提升超過 10 分。

「OpenAI 發展迅速，我們的系統也從一開始就設計為能跟上這樣的節奏。每次推出新版本，都帶來實質的營運優勢：不只補上過去無法支援的能力與應用場景，也進一步擴大服務涵蓋範圍，同時提升提供給客戶的準確度。」

— David Graunke，SafetyKit 創辦人暨執行長

SafetyKit 也會將改進成果回饋至整個生態系，直接與 OpenAI 分享評估結果、邊緣案例失敗紀錄，以及各項政策面的具體發現，協助改善未來模型在安全關鍵任務中的表現。

運用最佳 OpenAI 技術堆疊，帶動客戶數與處理量成長

SafetyKit 的架構能在大規模下落實政策執行，同時兼顧速度、精準度與完整的風險涵蓋。在幕後，系統現時每日處理超過 160 億 Token，較六個月前的 2 億大幅上升，同時能分析更多內容而不犧牲準確度。

與此同時，SafetyKit 已將業務拓展至支付風險、詐欺、防制兒童剝削、反洗錢等領域，並新增多家客戶；目前已有數以億計的終端使用者受到 SafetyKit 保護。這項基礎讓客戶能迅速且有把握地應對新興風險。

Graunke 解釋：「我們建立了一套機制，讓 OpenAI 每次推出新版本都能直接強化我們的能力，也因此，這套系統會持續進步，始終領先不斷演變的風險。」

結果一覽

以超過 95% 的準確率審查 100% 客戶內容
每日處理 160 億 Token，較六個月前的 2 億大幅成長
在最具挑戰性的視覺任務上，基準測試提升超過 10 分

邁入工作新時代

全球超過 100 萬家企業正透過 OpenAI 創造實質成果。

聯絡銷售人員

繼續閱讀

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

研究發表2026年8月1日

Advancing responsible AI across Europe — card

在全歐洲推動負責任的 AI

國際事務2026年7月31日

Building abundant intelligence

公司2026年7月31日