SafetyKit масштабує агентів ризику із кращими моделями OpenAI
Від прототипування з попередніми версіями моделей розпізнавання до масштабування з GPT‑5, мультимодальні агенти SafetyKit розширюють застосування в нових сферах і підвищують точність.

Результати
95%+
Перевірка точності 100% контенту клієнтів (оцінювання SafetyKit)
Результати
16B
токенів обробляється щодня — порівняно з 200 млн шість місяців тому
Результати
10+
Покращення продуктивності на найскладніших завданнях із розпізнавання з GPT-5
SafetyKit(відкривається у новому вікні) створює мультимодальних ШІ-агентів, які допомагають маркетплейсам, платіжним платформам і фінтех-компаніям виявляти шахрайство й заборонену діяльність і реагувати на них у тексті, зображеннях, фінансових транзакціях, списках товарів тощо. Нещодавні прориви в міркуванні моделей і мультимодальному розумінні тепер роблять це ефективнішим, встановлюючи нову планку для операцій із управління ризиками, дотримання вимог і безпеки.
Агенти SafetyKit використовують GPT‑5, GPT‑4.1, Deep Research та агент для керування комп’ютером (CUA), щоб перевіряти 100% клієнтського контенту з точністю понад 95% за результатами оцінок SafetyKit. Вони можуть допомагати платформам захищати користувачів, запобігати шахрайству, уникати регуляторних штрафів і застосовувати складні правила, які застарілі системи можуть не виявляти — наприклад, правила для окремих регіонів, номерів телефонів на шахрайських зображеннях або відвертого контенту. Автоматизація також може захистити модераторів-людей від контакту з неприйнятними матеріалами та дозволяє їм зосередитися на складних рішеннях щодо політик.
«OpenAI надає нам доступ до найсучасніших моделей міркувань і мультимодальних моделей на ринку. Це дозволяє нам швидко адаптуватися, швидше запускати нових агентів і працювати з типами контенту, які інші рішення навіть не можуть обробити.»
Створіть агентів під завдання, потім виберіть відповідну модель
Кожного агента SafetyKit створено для роботи з певною категорією ризику — від шахрайства до незаконних товарів. Кожна одиниця контенту спрямовується до агента, який найкраще підходить для цього порушення, з використанням оптимальної моделі OpenAI.
- GPT‑5 застосовує мультимодальні міркування в тексті, зображеннях та інтерфейсі, щоб виявляти приховані ризики й підтримувати багаторівневе, точне ухвалення рішень
- GPT‑4.1 надійно дотримується докладних інструкцій щодо політики змісту та ефективно керує великомасштабними робочими процесами модерації
- Донавчання з підкріпленням (RFT) підвищує повноту й точність порівняно зі стандартними моделями, дозволяючи досягати передових результатів у межах складних політик безпеки
- Deep research включає дослідження в реальному часі онлайн у перевірки та відгуки продавців
- Агент для керування комп’ютером (CUA) автоматизує складні завдання, пов’язані з правилами, зменшуючи залежність від дорогих ручних перевірок
Цей підхід до зіставлення моделей дозволяє SafetyKit масштабувати перевірку контенту в різних форматах із більшою точністю та деталізацією, ніж застарілі рішення.
Агент Scam Detection, наприклад, виходить за межі простого сканування тексту. Він аналізує візуальні елементи, як-от QR-коди або номери телефонів, розміщені на зображеннях продуктів. GPT‑4.1 допомагає агенту аналізувати зображення, розуміти його структуру та визначати, чи є воно порушенням політик.
Агент Policy Disclosure перевіряє списки та цільові сторінки на наявність обов’язкових формулювань, таких як правові застереження або регіонально специфічні попередження щодо відповідності вимогам. GPT‑4.1 виокремлює відповідні розділи, GPT‑5 оцінює відповідність вимогам, а агент відзначає порушення.
«Ми розглядаємо наших агентів як спеціально створені робочі процеси», — каже Граунке. «Деякі завдання потребують глибокого міркування, іншим потрібен мультимодальний контекст. OpenAI — єдиний стек, що забезпечує стабільну продуктивність в обох напрямках.»
GPT‑5 дозволяє розбиратися в складних ситуаціях та ухвалювати ключові рішення
Рішення стосовно політики часто залежать від тонких нюансів. Візьмемо до прикладу маркетплейс, який вимагає від продавців додавати застереження для товарів для здоров’я, причому вимоги різняться залежно від заявлених властивостей товару та регіональних правил. Застарілі постачальники використовують тригери на основі ключових слів або жорсткі набори правил, які можуть не враховувати глибшого аналізу та зважених рішень, що призводить до пропусків або неправильного застосування.
Агент Policy Disclosure від SafetyKit спочатку звертається до політик із внутрішньої бібліотеки SafetyKit, а потім GPT‑5 оцінює вміст: чи згадуються в ньому лікування або профілактика? Чи продається це в регіоні, де розкриття інформації є обов’язковим? Якщо так, чи присутнє потрібне формулювання? Якщо щось не відповідає вимогам, GPT‑5 повертає структуровані результати, які агент використовує, щоб позначити проблему.
«Сила GPT‑5 полягає в тому, наскільки точно він може міркувати, спираючись на реальну політику», — зазначає Граунке. «Це дає нам змогу ухвалювати точні й обґрунтовані рішення навіть у тих граничних випадках, де інші системи не справляються.»
Перетворюйте кожен реліз моделі на успіх для продукту
SafetyKit оцінює кожну нову модель OpenAI на її найскладніших кейсах, часто впроваджуючи найкращі моделі того ж дня. Ретельні внутрішні оцінювання дають команді змогу швидко визначати, як нові моделі можуть підвищити ефективність і безперешкодно інтегруватися в їхню основну інфраструктуру.
Коли було запущено OpenAI o3, SafetyKit використав його для підвищення ефективності в нетипових випадках у ключових сферах політики. Слідом з’явився GPT‑5, і за лічені дні його розгорнули для найвимогливіших агентів, підвищивши результати бенчмарків більш ніж на 10 пунктів у найскладніших завданнях із розпізнавання.
«OpenAI розвивається швидко, тож ми створили нашу систему так, щоб вона не вiдставала. Кожен новий реліз дає нам операційну перевагу, відкриваючи нові можливості й напрями, які ми раніше не могли підтримувати, а також збільшуючи охоплення й точність, які ми забезпечуємо для клієнтів».
SafetyKit також вносить удосконалення в екосистему, безпосередньо передаючи OpenAI результати оцінювання, інформацію щодо збоїв у граничних випадках і висновки щодо політик, щоб допомогти формувати майбутню ефективність моделі для критично важливих для безпеки навантажень.
Масштабування зростання клієнтської бази й обсягів за допомогою найкращого стека OpenAI
Архітектура SafetyKit забезпечує дотримання політик у масштабі, забезпечуючи швидкість, точність і комплексне охоплення ризиків. Зараз вона щодня у фоновому режимі обробляє понад 16 мільярдів токенів порівняно з 200 мільйонами шість місяців тому, аналізуючи більше контенту без втрати точності.
За той самий час SafetyKit розширився, охопивши ризики у сфері платежів, шахрайство, протидію експлуатації дітей, протидію відмиванню коштів, а також нових клієнтів із сотнями мільйонів кінцевих користувачів, які перебувають під захистом SafetyKit. Ця основа дає клієнтам змогу оперативно й упевнено реагувати на нові ризики.
«Ми створили цикл, у якому кожен реліз OpenAI безпосередньо посилює наші можливості», — зазначає Граунке. «Саме тому система постійно вдосконалюється, завжди випереджаючи змінні ризики.»
Короткий огляд результатів
- Точність перевірки понад 95% для 100% клієнтського контенту
- Щодня обробляється 16 млрд токенів — зростання з 200 млн за шість місяців
- Приріст понад 10 пунктів у бенчмарках на найскладніших завданнях із розпізнавання


