SafetyKit масштабирует агентов оценки рисков с моделями OpenAI
От создания прототипов на ранних версиях моделей с поддержкой компьютерного зрения до масштабирования с использованием GPT‑5 — мультимодальные агенты SafetyKit осваивают новые области и повышают точность работы.

Результаты
95%+
точность при проверке 100 % клиентского контента (оценки SafetyKit)
Результаты
16B
токенов обрабатывается ежедневно (рост с 200 млн за полгода)
Результаты
10+
пунктов прироста производительности в сложнейших визуальных задачах с GPT-5
SafetyKit(открывается в новом окне) создает мультимодальных ИИ-агентов, которые помогают маркетплейсам, платежным платформам и финтех-компаниям выявлять мошенничество и запрещенную деятельность в текстах, изображениях, финансовых транзакциях, карточках товаров и других данных.. Недавние прорывы в способностях моделей к рассуждению и мультимодальному пониманию делают это более эффективным, задавая новые станларты для операций по управлению рисками, соблюдению нормативных требований и безопасности.
Агенты SafetyKit используют GPT‑5, GPT‑4.1, глубокое исследование и агент использования компьютера (CUA) для проверки 100 % пользовательского контента с точностью более 95 % (согласно оценкам SafetyKit). Они способны помогать платформам защищать пользователей, предотвращать мошенничество, избегать штрафов от регуляторов и обеспечивать соблюдение сложных правил, которые могут пропускать устаревшие системы — например, региональных норм, скрытых номеров телефонов на мошеннических изображениях или неприемлемого контента. Автоматизация также позволяет оградить модераторов от материалов оскорбительного характера и освобождает их для принятия решений по наиболее сложным и неоднозначным вопросам политики безопасности.
«OpenAI предоставляет нам доступ к самым передовым на рынке моделям рассуждений и мультимодальным моделям. Это позволяет нам быстро адаптироваться, быстрее запускать новых агентов и работать с типами контента, которые другие решения даже не могут распознать».
Проектирование агентов под конкретные задачи и выбор подходящей модели
Каждый агент SafetyKit создан для работы с определенной категорией риска — от мошенничества до запрещенных товаров. Каждая единица контента направляется агенту, который лучше всего подходит для выявления конкретного нарушения с использованием оптимальной модели OpenAI:
- GPT‑5 применяет мультимодальные рассуждения к тексту, изображениям и интерфейсу, чтобы выявлять скрытые риски и поддерживать многоуровневое принятие точных решений.
- GPT‑4.1 надежно следует детальным инструкциям по модерации контента и эффективно управляет большими объемами рабочих процессов.
- Дообучение с подкреплением (RFT) повышает полноту и точность поиска сверх стандартных моделей, достигая передовых показателей в работе со сложными политиками безопасности.
- Глубокое исследование интегрирует онлайн-расследования в режиме реального времени для проверки отзывов и верификации продавцов.
- Агент использования компьютера (CUA) автоматизирует сложные задачи по соблюдению политик, снижая зависимость от дорогостоящих ручных проверок.
Такой подход с подбором подходящей модели позволяет SafetyKit масштабировать проверку контента в различных форматах с большей глубиной и точностью, чем это возможно в устаревших решениях.
Агент обнаружения мошенничества, например, выходит за рамки простого сканирования текста. Он анализирует визуальные элементы, такие как QR-коды или номера телефонов, встроенные в изображения товаров. GPT‑4.1 помогает распознать изображение, понять структуру и определить, является ли это нарушением правил.
Агент по раскрытию политик проверяет объявления или целевые страницы на наличие обязательных формулировок, таких как юридические дисклеймеры или предупреждения о соответствии региональным нормам. GPT‑4.1 извлекает нужные разделы, GPT‑5 оценивает соответствие требованиям, а агент фиксирует нарушения.
«Мы рассматриваем наших агентов как специализированные рабочие процессы, — говорит Граунке. — Для одних задач требуется глубокое рассуждение, для других — мультимодальный контекст. OpenAI — единственный стек технологий, который обеспечивает надежную производительность в обоих случаях».
Использование GPT‑5 для работы в «серых зонах» и принятия ответственных решений
Решения по модерации часто зависят от тонких различий. Возьмем, к примеру, маркетплейс, который требует от продавцов указывать дисклеймер для товаров для здоровья, при этом требования меняются в зависимости от свойств товара и региональных правил. Традиционные сервисы используют ключевые слова или жесткие наборы правил, которые могут упускать суть, требующую более глубокого анализа. Это приводит к пропускам нарушений или ошибочным блокировкам.
Агент SafetyKit по раскрытию политик сначала обращается к правилам из внутренней библиотеки SafetyKit, а затем GPT‑5 оценивает контент: упоминается ли в нем лечение или профилактика? Продается ли товар в регионе, где раскрытие информации обязательно? И если да, включена ли требуемая формулировка в описание товара? Если чего-то не хватает, GPT‑5 выдает структурированный ответ, который агент использует для фиксации нарушения.
«Сила GPT‑5 заключается в том, насколько точно она может рассуждать, опираясь на реальные правила, — отмечает Граунке. — Это позволяет нам принимать точные и обоснованные решения даже в пограничных случаях, где другие системы терпят неудачу».
Превращение каждого релиза модели в успех продукта
SafetyKit оценивает каждую новую модель OpenAI по самым сложным сценариям и часто внедряет лучшие из них в тот же день. Тщательные внутренние оценки позволяют команде быстро определять, как новые модели могут повысить производительность и органично интегрироваться в их основную инфраструктуру.
Когда состоялся запуск OpenAI o3, SafetyKit использовала её для улучшения работы в пограничных случаях по ключевым направлениям политик безопасности. За ней последовала GPT‑5, которая в течение нескольких дней была развернута на самых требовательных агентах, что позволило повысить результаты тестов более чем на 10 пунктов в сложнейших задачах, связанных с компьютерным зрением.
«OpenAI движется быстро, и мы спроектировали нашу систему так, чтобы не отставать. Каждый новый релиз дает нам операционное преимущество — открывает новые возможности и сферы, которые мы не могли поддерживать раньше, а также повышает охват и точность услуг, которые мы предоставляем клиентам».
SafetyKit также привносит свой вклад в развитие экосистемы, напрямую передавая OpenAI результаты тестирований, данные о пограничных случаях и инсайты по конкретным политикам, чтобы помочь в настройке будущих моделей для задач, критически важных для безопасности.
Масштабирование клиентской базы и объемов с лучшим стеком технологий OpenAI
Архитектура SafetyKit обеспечивает соблюдение политик в глобальном масштабе, гарантируя скорость, точность и всесторонний охват рисков. За кулисами система теперь обрабатывает более 16 миллиардов токенов ежедневно (по сравнению с 200 миллионами полгода назад), анализируя больше контента без потери качества.
За это же время SafetyKit расширил сферу охвата, включив риски платежей, мошенничество, борьбу с эксплуатацией детей, борьбу с отмыванием денег, а также привлек новых клиентов, чьи сотни миллионов конечных пользователей находятся под защитой SafetyKit. Эта основа позволяет клиентам оперативно и уверенно реагировать на возникающие риски.
«Мы создали цикл, в котором каждый релиз OpenAI напрямую усиливает наши возможности, — говорит Граунке. — Именно поэтому система непрерывно совершенствуется, всегда опережая меняющиеся риски».
Ключевые результаты
- Точность 95 % и выше при проверке 100 % клиентского контента
- 16 млрд токенов обрабатывается ежедневно (рост с 200 млн за полгода)
- Прирост более чем на 10 пунктов в результатах тестов на самых сложных визуальных задачах


