跳至主要内容
OpenAI

2025年9月9日

SafetyKit 借助 OpenAI 顶级模型,全面拓展风险防控智能体能力

从利用早期视觉模型预览版进行原型设计,到如今依托 GPT‑5 实现全面扩展,SafetyKit 的多模态智能体正不断向新领域迈进,并持续刷新审核准确率上限

白色的 SafetyKit 徽标位于深色纵向纹理背景的中央,背景带有橙色、黄色和蓝绿色光线形成的暖色渐变。
公司规模: 初创企业
区域: 北美
行业: 技术, 服务
产品: API

成效

95%+

审核准确率 (实现了对客户内容的 100% 全量覆盖,基于 SafetyKit 评测)

成效

16B

当前日处理量(半年前为 2 亿 Token)

成效

10+

在最棘手的视觉任务中实现的性能分数提升

正在加载…

SafetyKit(在新窗口中打开) 致力于构建多模态 AI 智能体,赋能电商平台、支付机构及金融科技公司,精准识别并打击跨维度的欺诈与违规行为 — 涵盖文本、图像、交易记录、商品列表等多个领域。得益于模型推理与多模态理解技术的突破性进展,如今的风险防控、合规审查及安全运营已迈入更高标准。

SafetyKit 的智能体充分发挥了 GPT‑5、GPT‑4.1、深度研究能力以及使用计算机的智能体 (Computer Using Agent, CUA) 等优势。基于 SafetyKit 的评测,该系统能以超过 95% 的准确率对客户内容进行全量审核。通过该方案,平台不仅能有效保护用户安全、降低欺诈风险、规避监管罚单,还能强制执行传统系统遗漏的复杂政策,例如:特定地区的细分规则,诈骗图片中嵌入的手机号码,或露骨内容。此外,高度自动化的流程能保护人工审核员免于接触有害素材,让他们能抽身投入到更需人类权衡的复杂政策决策中。

“OpenAI 为我们提供了市面上最先进的推理与多模态模型。这使我们能够快速响应、以更短的周期发布新智能体,并处理那些其他解决方案甚至无法解析的内容类型。”
David Graunke,SafetyKit 创始人兼 CEO

按需设计智能体,匹配最优模型

SafetyKit 为每一类风险场景(从诈骗手段到违禁物品)量身定制了专属智能体。系统会将每一项待审内容精准分发给最擅长处理该违规类型的智能体,并调用最合适的 OpenAI 模型进行处理:

  • GPT‑5:跨越文本、图像与 UI 界面进行多模态推理,识别潜藏风险,为多层级的精准决策提供支撑
  • GPT‑4.1:以极高的可靠性执行详细的内容政策指令,高效应对海量审核工作流
  • 强化微调 (RFT):通过针对性优化,使查全率 (Recall) 与查准率 (Precision) 超越通用模型,在处理复杂安全政策时展现出顶尖性能
  • 深度研究 (Deep Research):将实时在线调查集成到商户审核与验证流程中,确保信息准确可靠
  • 使用计算机的智能体 (CUA):实现复杂政策任务的自动化执行,大幅降低对高昂人工审核的依赖

这种“模型匹配”策略使 SafetyKit 能够跨越多种媒介维度,实现比传统方案更具深度、更为精准的内容审核规模化。

以诈骗检测 (Scam Detection) 智能体为例,它的能力远不止于文本扫描。它能深入分析产品图片中嵌入的 QR 码或手机号码等视觉信息。在 GPT‑4.1 的支持下,该智能体可以解析图像、理解排版布局,并最终判定其是否违反政策。

政策披露 (Policy Disclosure) 智能体则专注于检查商品列表或落地页是否包含必要的合规用语,如法律免责声明或特定地区的合规警告。在此流程中,GPT‑4.1 负责提取相关章节,GPT‑5 负责评估合规性,最后由智能体精准标记违规项。

“我们将智能体视为‘针对特定目标构建的工作流’,”Graunke 表示,“有些任务需要深度推理,而另一些则需要多模态上下文。在可靠性方面,OpenAI 是唯一能同时满足这两项需求的方案。”

浅色背景上有一张标注为“SafetyKit”的折线图和柱状图,显示多个类别的数据趋势和对比。

依托 GPT‑5,攻克复杂地带与高风险决策

政策判定往往取决于极其细微的差别。以某电商平台为例,该平台要求卖家必须为健康类产品提供免责声明,且具体要求会根据产品的功能主张及所在地区的法规而异。传统方案通常依赖关键词触发或僵化的规则集,这往往无法胜任更深层级的判断,从而导致违规漏报或错误执行。

SafetyKit 的政策披露 (Policy Disclosure) 智能体采取了更出色的流程:首先调取 SafetyKit 内部库中的政策条款,随后由 GPT‑5 对内容进行深度评估 — 该产品是否提到了疗效或预防作用?其销售地区是否属于强制披露范围?如果是,列表中是否确实包含了要求的法律用语?一旦发现任何瑕疵,GPT‑5 会生成结构化数据,由智能体据此精准标记问题。

“GPT‑5 的强大之处在于,当它立足于真实政策逻辑时,其推理精度令人惊叹,”Graunke 指出,“即使在其他系统束手无策的极端案例 (Edge case) 中,它也能助我们做出准确且经得起推敲的决策。”

将每一次模型更迭转化为产品优势

SafetyKit 会针对最棘手的案例对 OpenAI 发布的新模型进行基准测试,且通常在发布当日便能完成顶尖模型的部署。通过严谨的内部评估,团队能够迅速识别新模型在性能提升上的潜力,并将其无缝集成到核心基础设施中。

在 OpenAI o3 发布时,SafetyKit 借其势能显著提升了核心政策领域中极端案例的处理表现。随后的 GPT‑5 更是如此。在上线短短几天内,它就被部署到对性能要求最严苛的智能体中,使其在最难的视觉任务基准测试中提升了 10 分以上。

“OpenAI 的迭代速度极快,而我们的系统架构从设计之初就是为了紧跟这一节奏。每一次新版本的发布都为我们带来了运营层面的竞争优势 — 不仅解锁了此前无法支持的新功能与新领域,更显著提升了我们为客户提供的服务覆盖面及准确性。”
—David Graunke,SafetyKit 创始人兼 CEO

SafetyKit 还将其在实战中积累的经验反哺给整个生态系统 — 通过与 OpenAI 直接分享评测结果、极端失败案例以及特定政策的洞察,助力优化未来模型在安全关键型任务中的表现。

依托顶级 OpenAI 技术栈,推动业务与处理量增长

SafetyKit 的架构确保了在海量数据下依然能严格执行政策,兼顾速度、精度以及全面的风险覆盖。在幕后,其日处理量已从半年前的 2 亿 Token 飙升至如今的 160 亿 Token,在不牺牲准确性的前提下,实现了更深层的内容分析。

与此同时,SafetyKit 的业务版图已拓展至支付风险、欺诈检测、反儿童剥削、反洗钱等多个领域,目前正为拥有数亿终端用户的客户群保驾护航。这一坚实基础使客户能够敏捷且自信地应对不断演变的各类风险。

“我们构建了一个良性循环,OpenAI 的每一次版本迭代都能直接转化为我们能力的跃升,”Graunke 总结道,“正因如此,我们的系统得以持续进化,始终走在风险演变的前头。”

成效速览

  • 以 95% 以上的准确率,实现了对客户内容的 100% 全量覆盖
  • 日处理量从半年前的 2 亿 Token 飙升至 160 亿 Token
  • 在最棘手的视觉任务基准测试中,实现 10 分以上的性能飞跃

开启办公新时代

全球逾百万家企业正通过 OpenAI 获得切实效益。