A SafetyKit az OpenAI fejlett modelljeivel értékel kockázatokat
A korai látásmodell-előnézetekkel végzett prototípuskészítéstől a GPT‑5-tel való skálázásig a SafetyKit multimodális ügynökei új területekre terjeszkednek, és növelik a pontosságot.

Eredmények
95%+
A pontosság felülvizsgálata az ügyféltartalom 100%-án (SafetyKit evals)
Eredmények
16B
Naponta feldolgozott token, ami hat hónappal ezelőtt 200 millió volt
Eredmények
10+
Teljesítménynövekedés a legnehezebb vizuális feladatoknál a GPT-5-tel
SafetyKit(új ablakban nyílik meg) multimodális AI-ügynököket fejleszt, amelyek segítenek a piactereknek, fizetési platformoknak és fintech cégeknek a csalások és tiltott tevékenységek észlelésében és kezelésében szövegekben, képeken, pénzügyi tranzakciókban, terméklistákban és más területeken. A modell érvelésében és a multimodális megértésben elért legújabb áttörések most még hatékonyabbá teszik ezt, új mércét állítva a kockázatkezelés, megfelelőség és biztonsági műveletek számára.
A SafetyKit ügynökei a GPT‑5-öt, a GPT‑4.1-et, a mély kutatást és a Számítógép-használó Ügynököt (CUA) használják az ügyféltartalmak 100%-ának átvizsgálására, a SafetyKit értékelései alapján több mint 95%-os pontossággal. Segíthetnek a platformoknak megvédeni a felhasználókat, megelőzni a csalásokat, elkerülni a szabályozói bírságokat, valamint érvényesíteni azokat az összetett irányelveket, amelyeket az örökölt rendszerek esetleg nem észlelnek, például a régióspecifikus szabályokat, a csaló képekbe ágyazott telefonszámokat vagy az explicit tartalmat. Az automatizálás emellett megvédheti az emberi moderátorokat a sértő tartalmakkal való találkozástól, és lehetővé teszi számukra, hogy árnyalt szakpolitikai döntésekkel foglalkozzanak.
„Az OpenAI hozzáférést biztosít számunkra a piacon elérhető legfejlettebb érvelési és multimodális modellekhez.” Lehetővé teszi, hogy gyorsan alkalmazkodjunk, gyorsabban szállítsunk új ügynököket, és olyan tartalomtípusokat is kezeljünk, amelyeket más megoldások még értelmezni sem tudnak.
Az ügynököket a feladat igényeihez tervezd meg, majd válaszd ki a megfelelő modellt
A SafetyKit ügynökeit úgy tervezték, hogy egy adott kockázati kategóriát kezeljenek, a csalásoktól kezdve az illegális termékekig. Minden tartalmat az adott jogsértéshez leginkább megfelelő ügynökhöz irányítanak, az optimális OpenAI modell alkalmazásával:
- A GPT‑5 multimodális érvelést alkalmaz szövegek, képek és felhasználói felületek között, hogy feltárja a rejtett kockázatokat, és támogassa a rétegzett, precíz döntéshozatalt.
- A GPT‑4.1 megbízhatóan követi a részletes tartalomszabályzati utasításokat, és hatékonyan kezeli a nagy mennyiségű moderálási folyamatokat
- A megerősítéses finomhangolás (RFT) az alapértelmezett modelleken túl növeli a visszahívást és a precizitást, összetett biztonsági irányelvek mellett is élvonalbeli teljesítményt nyújtva.
- A mély kutatás valós idejű online vizsgálatot integrál a kereskedői értékelések és ellenőrzések területén
- A számítógép-használó ügynök (CUA) automatizálja az összetett szabályzati feladatokat, csökkentve a költséges manuális felülvizsgálatoktól való függést
Ez a modell-illesztési megközelítés lehetővé teszi a SafetyKit számára, hogy a tartalomellenőrzést a különböző modalitások között árnyaltabban és pontosabban végezze, mint a korábbi megoldások.
A csalásfelismerő ügynök például nem csupán a szöveg átvizsgálására képes. Elemzi a vizuális elemeket, például a termékképekbe ágyazott QR-kódokat vagy telefonszámokat. A GPT‑4.1 segít értelmezni a képet, megérteni az elrendezést, és eldönteni, hogy az szabálysértésnek minősül-e.
A szabályzati közzétételi ügynök ellenőrzi a listázásokat vagy a céloldalakat a szükséges szövegek, például jogi nyilatkozatok vagy régióspecifikus megfelelőségi figyelmeztetések szempontjából. A GPT‑4.1 kinyeri a releváns szakaszokat, a GPT‑5 kiértékeli a megfelelőséget, az ügynök pedig jelzi a jogsértéseket.
„Az ügynökeinkre úgy gondolunk, mint kifejezetten erre a célra kialakított munkafolyamatokra” – mondja Graunke. „Egyes feladatok mély érvelést igényelnek, másoknak multimodális kontextusra van szükségük. Az OpenAI az egyetlen stack, amely mindkettőben megbízható teljesítményt nyújt.”
Használd a GPT‑5-öt, hogy eligazodj a szürke zónákban és a nagy téttel járó döntések között.
A szakpolitikai döntések gyakran finom különbségeken múlnak. Vegyünk egy piacteret, amely előírja az eladók számára, hogy a wellness-termékekhez jogi nyilatkozatot mellékeljenek, és ahol a követelmények a termék állításaitól és a regionális szabályoktól függően eltérnek. A hagyományos szolgáltatók kulcsszóalapú aktiválási feltételeket vagy merev szabálykészleteket használnak, amelyek nem képesek kezelni az ezekhez a döntésekhez szükséges mélyebb mérlegelést, ami elmulasztott vagy helytelen érvényesítéshez vezethet.
A SafetyKit irányelvek közzétételéért felelős ügynök először a SafetyKit belső irányelveire hivatkozik, majd a GPT‑5 értékeli a tartalmat: említik-e a kezelést vagy a megelőzést? Olyan régióban értékesítik, ahol kötelező a tájékoztatás? És ha igen, a szükséges tájékoztató szöveg valóban szerepel a listában? Ha valami nem felel meg az elvárásoknak, a GPT‑5 strukturált kimenetet ad vissza, amelyet az ügynök a probléma jelzésére használ.
„A GPT‑5 ereje abban rejlik, hogy milyen pontosan képes érvelni, ha valós irányelvekre támaszkodik” – jegyezte meg Graunke. „Lehetővé teszi számunkra, hogy pontos, megalapozott döntéseket hozzunk még azokban a szélsőséges esetekben is, ahol más rendszerek kudarcot vallanak.”
Tedd minden modellkiadást terméksikerré
A SafetyKit minden új OpenAI-modellt a legnehezebb eseteivel vet össze, és a legjobban teljesítő modelleket gyakran még aznap élesíti. A szigorú belső értékelések lehetővé teszik a csapat számára, hogy gyorsan azonosítsa, hogyan javíthatják az új modellek a teljesítményt, és hogyan épülhetnek be zökkenőmentesen az alapvető infrastruktúrájukba.
Amikor megjelent az OpenAI o3, a SafetyKit arra használta, hogy javítsa a szélsőséges esetek kezelésének teljesítményét a legfontosabb szakpolitikai területeken. Ezt követően néhány napon belül bevezették a legnagyobb igénybevételnek kitett ügynökeiknél is a GPT‑5-öt, amely a legnehezebb vizuális feladataikban több mint 10 ponttal javította a benchmark-eredményeket.
„Az OpenAI gyorsan halad, és úgy terveztük meg a rendszerünket, hogy lépést tudjon tartani vele.” „Minden új kiadás működési előnyt biztosít számunkra – új képességeket és területeket nyit meg, amelyeket korábban nem tudtunk támogatni, és növeli az ügyfeleknek nyújtott lefedettséget és pontosságot.”
A SafetyKit emellett visszacsatornázza a fejlesztéseket az ökoszisztémába: közvetlenül megosztja az OpenAI-jal az evalok eredményeit, a szélső esetekben tapasztalt hibákat és a szabályzatspecifikus megállapításokat, hogy ezzel hozzájáruljon a modell jövőbeli teljesítményének alakításához a biztonságkritikus munkaterhelések esetében.
Növeld ügyfélkörödet és növekedésedet a legjobb OpenAI technológiai stackkel
A SafetyKit architektúrája nagy léptékben érvényesíti a szabályzatokat, miközben gyorsaságot, pontosságot és átfogó kockázati lefedettséget nyújt. A háttérben ma már naponta több mint 16 milliárd tokent kezel, szemben a hat hónappal ezelőtti 200 millióval, így több tartalmat elemez a pontosság feláldozása nélkül.
Ez idő alatt a SafetyKit kiterjesztette tevékenységét a fizetési kockázatok, csalások, gyermekek kizsákmányolása és pénzmosás elleni küzdelem területére, valamint új ügyfelekkel bővült, akiknek több százmillió végfelhasználója áll a SafetyKit védelme alatt. Ez az alap lehetővé teszi az ügyfelek számára, hogy gyorsan és magabiztosan reagáljanak a felmerülő kockázatokra.
„Olyan kört alakítottunk ki, amelyben az OpenAI minden egyes kiadása közvetlenül erősíti a képességeinket” – mondja Graunke. „Ezért fejlődik a rendszer folyamatosan, mindig az alakuló kockázatok előtt járva.”
Az eredmények röviden
- 95%+ pontosság az ügyféltartalmak 100%-ának ellenőrzése során
- Naponta 16 milliárd token kerül feldolgozásra, hat hónap alatt 200 millióról növekedve
- 10+ pontos benchmarkjavulás a legnehezebb képfeldolgozási feladatokban


