SafetyKit rozširuje agentov rizika s najsilnejšími modelmi OpenAI
Od prototypovania s predbežnými ukážkami modelov videnia až po škálovanie s GPT‑5 sa multimodálni agenti SafetyKit rozširujú do nových oblastí a zvyšujú presnosť.

Výsledky
95%+
Kontrola presnosti pri 100 % zákazníckeho obsahu (hodnotenia SafetyKit)
Výsledky
16B
Denne spracovaných tokenov: nárast z 200 000 000 z pred pred šiestich mesiacov
Výsledky
10+
Zlepšenie výkonu o niekoľko bodov pri najnáročnejších vizuálnych úlohách s GPT-5
SafetyKit(otvorí sa v novom okne) vyvíja multimodálnych agentov umelej inteligencie, ktorí pomáhajú online trhoviskám, platobným platformám a fintech spoločnostiam odhaľovať podvody a zakázané činnosti a prijímať proti nim opatrenia v texte, obrázkoch, finančných transakciách, ponukách produktov a ďalších oblastiach. Nedávne prelomové objavy v uvažovaní modelov a multimodálnom porozumení teraz zvyšujú efektívnosť a nastavujú novú latku pre operácie v oblasti rizík, súladu a bezpečnosti.
Agenti SafetyKitu využívajú GPT‑5, GPT‑4.1, hlboký výskum a agenta používania počítača (CUA) na kontrolu 100 % zákazníckeho obsahu s viac ako 95 % presnosťou na základe hodnotení SafetyKitu. Platformám môžu pomôcť chrániť používateľov, predchádzať podvodom, vyhnúť sa pokutám regulačných orgánov a presadzovať komplexné pravidlá, ktoré môžu staršie systémy prehliadnuť, ako sú pravidlá špecifické pre jednotlivé regióny, vložené telefónne čísla v podvodných obrázkoch alebo explicitný obsah. Automatizácia môže tiež chrániť ľudských moderátorov pred vystavením urážlivému materiálu a uvoľňuje ich, aby sa mohli venovať zložitejším rozhodnutiam týkajúcim sa pravidiel.
„OpenAI nám poskytuje prístup k najpokročilejším modelom uvažovania a multimodálnym modelom na trhu.“ Umožňuje nám rýchlo sa prispôsobiť, rýchlejšie nasadzovať nových agentov a spracovať typy obsahu, ktoré iné riešenia nedokážu ani len analyzovať.“
Každý agent SafetyKit je vytvorený tak, aby zvládal konkrétnu kategóriu rizika – od podvodov až po nelegálne produkty. Každý obsah smerujeme k agentovi, ktorý sa na dané porušenie hodí najviac, a pritom používame optimálny model od OpenAI:
- GPT‑5 využíva multimodálne uvažovanie naprieč textom, obrázkami a používateľským rozhraním na odhaľovanie skrytých rizík a podporu viacvrstvového, presného rozhodovania
- GPT‑4.1 spoľahlivo dodržiava podrobné pokyny zásad obsahu a efektívne spravuje vysokoobjemové pracovné postupy moderovania
- Dolaďovanie posilňovaním (RFT) zvyšuje mieru vybavenia a presnosť nad rámec predvolených modelov. Dosahuje prelomový výkon pri komplexných bezpečnostných pravidlách.
- Hlboký výskum integruje online skúmanie v reálnom čase do recenzií a overení obchodníkov
- Agent používania počítača (CUA) automatizuje zložité úlohy súvisiace s politikami, čím znižuje závislosť od nákladného manuálneho posudzovania.
Tento prístup založený na porovnávaní modelov umožňuje systému SafetyKit škálovať kontrolu obsahu v modalitách s väčšou presnosťou a lepším pochopením detailov, ako dokážu staršie riešenia.
Agent na detekciu podvodov napríklad robí viac než len skenovanie textu. Analyzuje vizuálne prvky, ako QR kódy alebo telefónne čísla vložené do obrázkov produktov. GPT‑4.1 pomáha analyzovať obrázok, pochopiť rozloženie a rozhodnúť, či ide o porušenie pravidiel.
Agent zverejňovania zásad kontroluje zoznamy alebo vstupné stránky z hľadiska požadovaného znenia, ako sú právne vyhlásenia alebo regionálne špecifické upozornenia na súlad. GPT‑4.1 extrahuje relevantné sekcie, GPT‑5 vyhodnocuje súlad a agent označuje porušenia.
„Našich agentov vnímame ako pracovné postupy vytvorené na konkrétny účel,“ hovorí Graunke. „Niektoré úlohy vyžadujú hlboké uvažovanie, iné multimodálny kontext.“ OpenAI je jediný stack, ktorý v oboch prípadoch poskytuje spoľahlivý výkon.
Využite GPT‑5, aby ste sa zorientovali v nejasných situáciách a pri rozhodnutiach s vysokým rizikom
Rozhodnutia o zásadách často stoja na jemných rozdieloch. Predstavte si trhovisko, kde predajcovia musia uvádzať upozornenia pri wellnesových produktoch. Požiadavky sa líšia podľa tvrdení o produkte a regionálnych pravidiel. Starší poskytovatelia používajú kľúčové slová alebo pevné pravidlá, ktoré môžu prehliadnuť dôležité rozhodnutia. To vedie k nesprávnemu alebo vynechanému presadzovaniu.
Agent pre zverejňovanie zásad od SafetyKitu najprv vychádza zo zásad z internej knižnice SafetyKitu a potom GPT‑5 vyhodnotí obsah: spomína liečbu alebo prevenciu? Predáva sa v regióne, kde je zverejnenie povinné? A ak áno, je požadovaný jazyk skutočne zahrnutý v zozname? Ak niečo nespĺňa požiadavky, GPT‑5 vráti štruktúrovaný výstup, ktorý agent použije na označenie problému.
„Sila GPT‑5 spočíva v tom, ako presne dokáže uvažovať, keď vychádza zo skutočných pravidiel,“ poznamenáva Graunke. „Umožňuje nám prijímať presné a obhájiteľné rozhodnutia aj v hraničných prípadoch, v ktorých iné systémy zlyhávajú.“
Premeňte každé vydanie modelu na úspech produktu
SafetyKit porovnáva každý nový model OpenAI s jeho najnáročnejšími prípadmi a najvýkonnejšie z nich často nasadzuje v ten istý deň. Prísne interné hodnotenia umožňujú tímu rýchlo identifikovať, ako môžu nové modely zlepšiť výkonnosť a bezproblémovo sa integrovať do ich základnej infraštruktúry.
Keď bolo OpenAI o3 spustené, SafetyKit ho využil na zvýšenie výkonu v okrajových prípadoch v kľúčových oblastiach politiky. GPT‑5 nasledoval a v priebehu niekoľkých dní bol nasadený do jeho najnáročnejších agentov, pričom zlepšil výsledky benchmarkových testov o viac ako 10 bodov v ich najťažších úlohách počítačového videnia.
„OpenAI napreduje rýchlo a navrhli sme náš systém tak, aby držal krok s týmto tempom.“ Každé nové vydanie nám prináša prevádzkovú výhodu – odomyká nové možnosti a oblasti, ktoré sme predtým nedokázali podporovať, a zvyšuje pokrytie a presnosť poskytovanú zákazníkom.“
SafetyKit tiež vracia vylepšenia späť do ekosystému a priamo zdieľa s OpenAI výsledky hodnotení, zlyhania v okrajových prípadoch a poznatky špecifické pre zásady s cieľom pomôcť formovať budúcu výkonnosť modelov pri úlohách kritických z hľadiska bezpečnosti.
Škálujte rast zákazníkov a objemu s tým najlepším balíkom OpenAI
Architektúra SafetyKit presadzuje zásady vo veľkom rozsahu a prináša rýchlosť, presnosť a komplexné pokrytie rizík. V zákulisí teraz spracúva viac ako 16 miliárd tokenov denne, v porovnaní s 200 miliónmi z pred šiestich mesiacov, a analyzuje viac obsahu bez toho, aby to bolo na úkor presnosti.
V tom istom období sa SafetyKit rozšíril aj o riziká v oblasti platieb, podvodov, prevencie zneužívania detí, boja proti praniu špinavých peňazí a pre nových zákazníkov so stovkami miliónov koncových používateľov chránených riešením SafetyKit. Tento základ umožňuje zákazníkom rýchlo a s istotou reagovať na vznikajúce riziká.
„Vytvorili sme slučku, kde každé vydanie od OpenAI priamo posilňuje naše schopnosti,“ hovorí Graunke. „Preto sa systém stále zlepšuje a vždy je o krok vpred pred vyvíjajúcimi sa rizikami.“
Prehľad výsledkov
- Presnosť 95 % + pri kontrole 100 % obsahu pre zákazníkov
- Denne spracuje 16 miliárd tokenov z 200 miliónov z pred šiestich mesiacov.
- Zlepšenie v benchmarkoch o viac ako 10 bodov pri najnáročnejších úlohách počítačového videnia.


