9 сентября 2025 г.

SafetyKit масштабирует агентов оценки рисков с моделями OpenAI

От создания прототипов на ранних версиях моделей с поддержкой компьютерного зрения до масштабирования с использованием GPT‑5 — мультимодальные агенты SafetyKit осваивают новые области и повышают точность работы.

Связаться с отделом продаж

Логотип SafetyKit белого цвета по центру на темном фоне с вертикальной текстурой и теплым градиентом оранжевого, желтого и бирюзового света.

Размер компании: стартап

Регион: Северная Америка

Промышленность: технологии, услуги

Продукты: API

Результаты

95%+

точность при проверке 100 % клиентского контента (оценки SafetyKit)

Результаты

16B

токенов обрабатывается ежедневно (рост с 200 млн за полгода)

Результаты

10+

пунктов прироста производительности в сложнейших визуальных задачах с GPT-5

Загрузка…

SafetyKit⁠(открывается в новом окне) создает мультимодальных ИИ-агентов, которые помогают маркетплейсам, платежным платформам и финтех-компаниям выявлять мошенничество и запрещенную деятельность в текстах, изображениях, финансовых транзакциях, карточках товаров и других данных.. Недавние прорывы в способностях моделей к рассуждению и мультимодальному пониманию делают это более эффективным, задавая новые станларты для операций по управлению рисками, соблюдению нормативных требований и безопасности.

Агенты SafetyKit используют GPT‑5, GPT‑4.1, глубокое исследование и агент использования компьютера (CUA) для проверки 100 % пользовательского контента с точностью более 95 % (согласно оценкам SafetyKit). Они способны помогать платформам защищать пользователей, предотвращать мошенничество, избегать штрафов от регуляторов и обеспечивать соблюдение сложных правил, которые могут пропускать устаревшие системы — например, региональных норм, скрытых номеров телефонов на мошеннических изображениях или неприемлемого контента. Автоматизация также позволяет оградить модераторов от материалов оскорбительного характера и освобождает их для принятия решений по наиболее сложным и неоднозначным вопросам политики безопасности.

«OpenAI предоставляет нам доступ к самым передовым на рынке моделям рассуждений и мультимодальным моделям. Это позволяет нам быстро адаптироваться, быстрее запускать новых агентов и работать с типами контента, которые другие решения даже не могут распознать».

— Дэвид Граунке, основатель и генеральный директор SafetyKit

Проектирование агентов под конкретные задачи и выбор подходящей модели

Каждый агент SafetyKit создан для работы с определенной категорией риска — от мошенничества до запрещенных товаров. Каждая единица контента направляется агенту, который лучше всего подходит для выявления конкретного нарушения с использованием оптимальной модели OpenAI:

GPT‑5 применяет мультимодальные рассуждения к тексту, изображениям и интерфейсу, чтобы выявлять скрытые риски и поддерживать многоуровневое принятие точных решений.
GPT‑4.1 надежно следует детальным инструкциям по модерации контента и эффективно управляет большими объемами рабочих процессов.
Дообучение с подкреплением (RFT) повышает полноту и точность поиска сверх стандартных моделей, достигая передовых показателей в работе со сложными политиками безопасности.
Глубокое исследование интегрирует онлайн-расследования в режиме реального времени для проверки отзывов и верификации продавцов.
Агент использования компьютера (CUA) автоматизирует сложные задачи по соблюдению политик, снижая зависимость от дорогостоящих ручных проверок.

Такой подход с подбором подходящей модели позволяет SafetyKit масштабировать проверку контента в различных форматах с большей глубиной и точностью, чем это возможно в устаревших решениях.

Агент обнаружения мошенничества, например, выходит за рамки простого сканирования текста. Он анализирует визуальные элементы, такие как QR-коды или номера телефонов, встроенные в изображения товаров. GPT‑4.1 помогает распознать изображение, понять структуру и определить, является ли это нарушением правил.

Агент по раскрытию политик проверяет объявления или целевые страницы на наличие обязательных формулировок, таких как юридические дисклеймеры или предупреждения о соответствии региональным нормам. GPT‑4.1 извлекает нужные разделы, GPT‑5 оценивает соответствие требованиям, а агент фиксирует нарушения.

«Мы рассматриваем наших агентов как специализированные рабочие процессы, — говорит Граунке. — Для одних задач требуется глубокое рассуждение, для других — мультимодальный контекст. OpenAI — единственный стек технологий, который обеспечивает надежную производительность в обоих случаях».

Линейная и столбчатая диаграмма с подписью «SafetyKit» на светлом фоне, показывающая тенденции данных и сравнения по нескольким категориям.

Использование GPT‑5 для работы в «серых зонах» и принятия ответственных решений

Решения по модерации часто зависят от тонких различий. Возьмем, к примеру, маркетплейс, который требует от продавцов указывать дисклеймер для товаров для здоровья, при этом требования меняются в зависимости от свойств товара и региональных правил. Традиционные сервисы используют ключевые слова или жесткие наборы правил, которые могут упускать суть, требующую более глубокого анализа. Это приводит к пропускам нарушений или ошибочным блокировкам.

Агент SafetyKit по раскрытию политик сначала обращается к правилам из внутренней библиотеки SafetyKit, а затем GPT‑5 оценивает контент: упоминается ли в нем лечение или профилактика? Продается ли товар в регионе, где раскрытие информации обязательно? И если да, включена ли требуемая формулировка в описание товара? Если чего-то не хватает, GPT‑5 выдает структурированный ответ, который агент использует для фиксации нарушения.

«Сила GPT‑5 заключается в том, насколько точно она может рассуждать, опираясь на реальные правила, — отмечает Граунке. — Это позволяет нам принимать точные и обоснованные решения даже в пограничных случаях, где другие системы терпят неудачу».

Превращение каждого релиза модели в успех продукта

SafetyKit оценивает каждую новую модель OpenAI по самым сложным сценариям и часто внедряет лучшие из них в тот же день. Тщательные внутренние оценки позволяют команде быстро определять, как новые модели могут повысить производительность и органично интегрироваться в их основную инфраструктуру.

Когда состоялся запуск OpenAI o3, SafetyKit использовала её для улучшения работы в пограничных случаях по ключевым направлениям политик безопасности. За ней последовала GPT‑5, которая в течение нескольких дней была развернута на самых требовательных агентах, что позволило повысить результаты тестов более чем на 10 пунктов в сложнейших задачах, связанных с компьютерным зрением.

«OpenAI движется быстро, и мы спроектировали нашу систему так, чтобы не отставать. Каждый новый релиз дает нам операционное преимущество — открывает новые возможности и сферы, которые мы не могли поддерживать раньше, а также повышает охват и точность услуг, которые мы предоставляем клиентам».

— Дэвид Граунке, основатель и генеральный директор SafetyKit

SafetyKit также привносит свой вклад в развитие экосистемы, напрямую передавая OpenAI результаты тестирований, данные о пограничных случаях и инсайты по конкретным политикам, чтобы помочь в настройке будущих моделей для задач, критически важных для безопасности.

Масштабирование клиентской базы и объемов с лучшим стеком технологий OpenAI

Архитектура SafetyKit обеспечивает соблюдение политик в глобальном масштабе, гарантируя скорость, точность и всесторонний охват рисков. За кулисами система теперь обрабатывает более 16 миллиардов токенов ежедневно (по сравнению с 200 миллионами полгода назад), анализируя больше контента без потери качества.

За это же время SafetyKit расширил сферу охвата, включив риски платежей, мошенничество, борьбу с эксплуатацией детей, борьбу с отмыванием денег, а также привлек новых клиентов, чьи сотни миллионов конечных пользователей находятся под защитой SafetyKit. Эта основа позволяет клиентам оперативно и уверенно реагировать на возникающие риски.

«Мы создали цикл, в котором каждый релиз OpenAI напрямую усиливает наши возможности, — говорит Граунке. — Именно поэтому система непрерывно совершенствуется, всегда опережая меняющиеся риски».

Ключевые результаты

Точность 95 % и выше при проверке 100 % клиентского контента
16 млрд токенов обрабатывается ежедневно (рост с 200 млн за полгода)
Прирост более чем на 10 пунктов в результатах тестов на самых сложных визуальных задачах

Начните работать по-новому

Более 1 миллиона компаний по всему миру достигают значимых результатов с OpenAI.

Связаться с отделом продаж

Читать далее

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

Публикация1 авг. 2026 г.

Advancing responsible AI across Europe — card

Развитие ответственного ИИ в Европе

Международные отношения31 июл. 2026 г.

Building abundant intelligence

Компания31 июл. 2026 г.