SafetyKit škáluje rizikové agenty s nejvýkonnějšími modely OpenAI
Multimodální agenti SafetyKitu rozšiřují své možnosti do nových oblastí a zvyšují přesnost: od prototypování s prvními modely pro zpracování obrazu po škálování s GPT‑5

Výsledky
95%+
Kontrola přesnosti u 100 % zákaznického obsahu (vyhodnocení SafetyKit)
Výsledky
16B
Počet tokenů zpracovaných denně, oproti 200 milionům před šesti měsíci
Výsledky
10+
Nárůst výkonu o několik procentních bodů u nejnáročnějších úloh počítačového vidění díky GPT-5
Společnost SafetyKit(otevře se v novém okně) vyvíjí multimodální AI agenty, kteří pomáhají online tržištím, platebním platformám a fintech společnostem odhalovat podvody a zakázané aktivity v textu, obrázcích, finančních transakcích, produktových nabídkách a dalších oblastech a a reagovat na ně. Nedávné průlomy v modelovém uvažování a multimodálním chápání nyní tento proces zefektivňují a nastavují novou laťku pro operace v oblasti rizik, dodržování předpisů a bezpečnosti.
Agenti společnosti SafetyKit využívají GPT‑5, GPT‑4.1, hloubkový výzkum a agenta používajícího počítač k prověření 100 % zákaznického obsahu s přesností na základě hodnocení SafetyKit přes 95 %. Pomáhají platformám chránit uživatele, předcházet podvodům, vyhnout se regulačním pokutám a vymáhat složité zásady, které starší systémy mohou přehlížet. Typicky se jedná o specifická pravidla pro daný region, vložená telefonní čísla do podvodných obrázků nebo explicitní obsah. Automatizace také může chránit lidské moderátory před urážlivým obsahem a uvolňuje jim ruce, aby se mohli věnovat rozhodnutím v rámci zásad, která vyžadují jemné rozlišování.
„OpenAI nám dává přístup k nejpokročilejším modelům uvažování a multimodálním modelům na trhu. Umožňuje nám se rychle přizpůsobovat, rychleji nasazovat nové agenty a pracovat s typy obsahu, které jiná řešení nedokážou ani zpracovat.“
Agenti společnosti SafetyKit jsou navrženi tak, aby zvládali konkrétní kategorie rizik, od podvodů po nelegální produkty. Každý obsah je předáván agentovi, který se pro dané porušení nejlépe hodí, a využije se optimální model OpenAI:
- GPT‑5 využívá multimodální uvažování v textu, obrázcích a uživatelsém rozhraní k odhalování skrytých rizik a podpoře vícevrstvého, přesného rozhodování.
- GPT‑4.1 spolehlivě dodržuje podrobné pokyny týkající se zásad pro obsah a efektivně spravuje rozsáhlé moderační pracovní postupy
- Vylaďování posilováním (RFT) zvyšuje míru zachycení případů i přesnost nad úroveň výchozích modelů a dosahuje špičkového výkonu i při složitých bezpečnostních pravidlech
- Hloubkový výzkum integruje online šetření v reálném čase do recenzí a ověřování obchodníků
- Agent používající počítač (CUA) automatizuje složité úkoly související se zásadami a snižuje závislost na nákladných ručních kontrolách
Tento přístup založený na porovnávání modelů umožňuje společnosti SafetyKit rozšiřovat kontrolu obsahu napříč modalitami detailněji a přesněji, než to umí dřívější řešení.
Agent pro detekci podvodů například dělá víc než jen skenování textu. Analyzuje vizuální obsah, například QR kódy nebo telefonní čísla na produktových obrázcích. GPT‑4.1 mu pomáhá analyzovat obrázek, porozumět rozvržení a rozhodnout, zda se jedná o porušení zásad.
Agent pro zveřejňování zásad kontroluje nabídky nebo vstupní stránky, zda obsahují požadované formulace, jako jsou právní upozornění nebo regionálně specifická varování ohledně souladu. GPT‑4.1 extrahuje relevantní části, GPT‑5 vyhodnocuje soulad a agent označuje porušení.
„Naše agenty vnímáme jako účelově vytvořené pracovní postupy,“ říká Graunke. „Některé úkoly vyžadují hluboké uvažování, jiné potřebují multimodální kontext. OpenAI je jedinou vrstvou, která v obou případech poskytuje spolehlivý výkon.“
Využití GPT‑5 k orientaci v nejasných situacích a při rozhodování s vysokou mírou rizika
Rozhodnutí týkající se zásad často závisejí na jemných rozdílech. Vezměme si tržiště, které vyžaduje, aby prodejci u wellness produktů uváděli prohlášení o vyloučení odpovědnosti, přičemž požadavky se liší podle toho, co produkt uvádí, a podle regionálních pravidel. Starší poskytovatelé používají spouštěče založené na klíčových slovech nebo rigidní sady pravidel, které mohou přehlédnout hlubší úsudek potřebný pro tato rozhodnutí. Následkem je opomenutí nebo nesprávné prosazování.
Agent pro zveřejňování zásad SafetyKit nejprve odkazuje na zásady z interní knihovny SafetyKitu a GPT‑5 poté vyhodnotí obsah: zmiňuje léčbu nebo prevenci? Prodává se v regionu, kde je zveřejnění povinné? A pokud ano, je požadovaný jazyk skutečně uveden v seznamu? Pokud cokoli nevyhovuje, GPT‑5 vrátí strukturované výstupy, které agent použije k označení problému.
„Síla GPT‑5 spočívá v tom, jak přesně dokáže uvažovat, když vychází ze skutečných zásad,“ poznamenává Graunke. „Umožňuje nám přijímat přesná a obhajitelná rozhodnutí i v mezních případech, ve kterých jiné systémy selhávají.“
Proměňte každé uvedení modelu na úspěch produktu
SafetyKit porovnává každý nový model OpenAI se svými nejobtížnějšími případy a nejvýkonnější z nich často nasazuje ještě tentýž den. Důkladná interní hodnocení umožňují týmu rychle identifikovat, jak mohou nové modely zlepšit výkon a bezproblémově se integrovat do jejich základní infrastruktury.
Když byl uveden model OpenAI o3, SafetyKit jej využil k posílení výkonu v okrajových případech v klíčových oblastech zásad. Následoval GPT‑5, který byl během několika dní nasazen u nejnáročnějších agentů. U nejnáročnějších úkolů v oblasti počítačového vidění se tak zlepšilo skóre benchmarků o více než 10 procentních bodů.
„OpenAI postupuje rychle a my jsme navrhli náš systém tak, aby držel krok. Každé nové vydání nám přináší provozní výhodu: otevírá nové možnosti a oblasti, které jsme dříve nemohli podporovat, a zvyšuje rozsah a přesnost poskytovanou zákazníkům.“
SafetyKit také zpětně vkládá vylepšení do ekosystému, sdílí výsledky hodnocení, mezní případy selhání a poznatky specifické pro dané zásady přímo s OpenAI tak, aby pomohl utvářet výkonnost budoucích modelů v případě úloh zásadních pro bezpečnost.
Podpořte růst počtu zákazníků i objemu pomocí nejlepšího řešení od OpenAI
Architektura SafetyKitu prosazuje zásady ve velkém měřítku a přináší rychlost, přesnost a komplexní pokrytí rizik. Na pozadí nyní zpracovává více než 16 miliard tokenů denně (oproti 200 milionům před šesti měsíci) a analyzuje více obsahu bez kompromisů v otázkách přesnosti.
Ve stejné době se SafetyKit rozšířil o platební rizika, podvody, boj proti zneužívání dětí, boj proti praní špinavých peněz a nové zákazníky se stovkami milionů koncových uživatelů pod ochranou SafetyKitu. Tento základ umožňuje zákazníkům rychle a sebejistě reagovat na nově vznikající rizika.
„Vytvořili jsme cyklus, v němž každé vydání OpenAI přímo posiluje naše schopnosti,“ říká Graunke. „Proto se systém neustále zlepšuje a vždy si udržuje náskok před vyvíjejícími se riziky.“
Přehled výsledků
- Více než 95% přesnost při 100% kontrole zákaznického obsahu
- Denně se zpracuje 16 miliard tokenů, oproti 200 milionům za šest měsíců
- Zlepšení o více než 10 procentních bodů v nejobtížnějších srovnávacích úlohách počítačového viděni


