SafetyKit povečuje obseg agentov za tveganja z modeli OpenAI.
Od prototipiranja z zgodnjimi predogledi vizualnega modela do širjenja z GPT‑5, SafetyKitovi večmodalni agenti vstopajo na nova področja in povečujejo natančnost.

Rezultati
95%+
Pregled natančnosti 100 % vsebine strank (ocene SafetyKit)
Rezultati
16B
Dnevno obdelanih 200 milijonov žetonov več kot pred šestimi meseci
Rezultati
10+
Dosegajte izboljšave zmogljivosti pri najzahtevnejših nalogah vizije z GPT-5.
SafetyKit(odpre se v novem oknu) razvija večmodalne UI agente, ki spletnim tržnicam, plačilnim platformam in fintech podjetjem pomagajo zaznavati goljufije in prepovedane dejavnosti ter glede njih ukrepati v besedilu, slikah, finančnih transakcijah, seznamih izdelkov in drugje. Nedavni preboji na področju sklepanja modelov in večmodalnega razumevanja zdaj to naredijo učinkovitejše ter postavljajo nov standard za operacije na področju tveganj, skladnosti in varnosti.
Agenti SafetyKit uporabljajo GPT‑5, GPT‑4.1, poglobljeno raziskovanje in agenta za uporabo računalnika (CUA) za pregled 100 % vsebine strank z več kot 95 % natančnostjo na podlagi evalvacij SafetyKit. Platformam lahko pomagajo zaščititi uporabnike, preprečiti goljufije, se izogniti regulativnim globam in uveljavljati kompleksne politike, ki jih starejši sistemi morda spregledajo, na primer regionalno specifična pravila, vgrajene telefonske številke v slikah prevar ali eksplicitne vsebine. Avtomatizacija lahko človeške moderatorje zaščiti pred izpostavljenostjo žaljivim vsebinam in jih razbremeni, da lahko obravnavajo prefinjene odločitve glede pravilnikov.
»OpenAI nam omogoča dostop do najnaprednejših modelov za sklepanje in večmodalnih modelov na trgu. Omogoča nam, da se hitro prilagodimo, hitreje uvedemo nove agente in obdelujemo vrste vsebin, ki jih druge rešitve sploh ne znajo razčleniti.«
Oblikujte agente glede na zahteve naloge in izberite ustrezen model
Agenti SafetyKit so zasnovani za obravnavo specifičnih kategorij tveganj, od goljufij do nezakonitih izdelkov. Vsaka vsebina se usmeri k agentu, ki je najprimernejši za določeno kršitev, pri tem pa uporablja optimalni model OpenAI:
- GPT‑5 uporablja multimodalno sklepanje v besedilu, slikah in uporabniškem vmesniku za razkrivanje skritih tveganj in podporo večplastnemu, natančnemu odločanju
- GPT‑4.1 zanesljivo sledi podrobnim navodilom pravilnika o vsebini in učinkovito upravlja delovne tokove moderiranja velikega obsega
- Prilagajanje z okrepljenim učenjem (RFT) izboljša priklic in natančnost v primerjavi s privzetimi modeli ter dosega prelomno zmogljivost pri kompleksnih varnostnih pravilnikih
- Poglobljeno raziskovanje vključuje sprotno spletno raziskovanje ocen in preverjanj trgovcev
- Agent za uporabo računalnika (CUA) avtomatizira zapletene naloge pravilnikov in zmanjšuje odvisnost od dragih ročnih pregledov.
Ta pristop ujemanja modelov omogoča SafetyKitu, da razširi pregled vsebine med modalnostmi z večjo natančnostjo in več niansami kot starejše rešitve.
Agent za zaznavanje prevar, npr., presega zgolj pregledovanje besedila. Analizira vizualne elemente, kot so QR kode ali telefonske številke, ki so del slike izdelkov. GPT‑4.1 mu pomaga razčleniti sliko, razumeti postavitev in odločiti, ali gre za kršitev pravilnika.
Agent za razkritje pravilnikov preverja sezname ali ciljne strani za zahtevan jezik, kot so pravna obvestila ali opozorila o skladnosti, specifična za regijo. GPT‑4.1 izlušči ustrezne razdelke, GPT‑5 oceni skladnost, agent pa označi kršitve.
»Naše agente razumemo kot namensko zasnovane poteke dela,« pravi Graunke. »Nekatere naloge zahtevajo poglobljeno sklepanje, druge potrebujejo večmodalni kontekst.« OpenAI je edini sklad, ki zagotavlja zanesljivo delovanje na obeh področjih.
Izkoristite GPT‑5 za lažje odločanje v sivih območjih in pri pomembnih odločitvah
Odločitve o politikah so pogosto odvisne od subtilnih razlik. Vzemimo za primer tržnico, ki od prodajalcev zahteva, da za izdelke za dobro počutje vključijo opozorilo, pri čemer se zahteve razlikujejo glede na navedbe o izdelku in regionalna pravila. Tradicionalni ponudniki uporabljajo sprožilce na podlagi ključnih besed ali toge nabore pravil, zato lahko spregledajo presojne odločitve, ki jih te situacije zahtevajo, kar vodi do spregledanega ali napačnega uveljavljanja pravil.
Agent za razkrivanje pravilnikov SafetyKit se najprej sklicuje na pravilnike iz interne knjižnice SafetyKit, nato pa GPT‑5 oceni vsebino: ali omenja zdravljenje ali preprečevanje? Ali se prodaja v regiji, kjer je razkritje obvezno? In če je tako, ali je zahtevani jezik dejansko naveden v seznamu? Če kar koli ne ustreza, GPT‑5 vrne strukturirani izhod, ki ga agent uporabi za označevanje težave.
»Moč GPT‑5 je v tem, kako natančno lahko sklepa, ko temelji na dejanskih pravilnikih,« ugotavlja Graunke. »Omogoča nam sprejemanje natančnih in utemeljenih odločitev tudi v mejnih primerih, kjer drugi sistemi odpovejo.«
Spremenite vsako izdajo modela v uspešno zgodbo izdelka
SafetyKit vsak nov model OpenAI primerja z njegovimi najtežjimi primeri in najuspešnejše pogosto uvede še isti dan. Stroga notranja vrednotenja ekipi omogočajo hitro ugotavljanje, kako lahko novi modeli izboljšajo zmogljivost in se brezhibno vključijo v osrednjo infrastrukturo.
Ko so predstavili OpenAI o3, ga je SafetyKit uporabil za izboljšanje uspešnosti pri obravnavi mejnih primerov na ključnih področjih politik. GPT‑5 je sledil in so ga v nekaj dneh uvedli pri svojih najzahtevnejših agentih, s čimer je izboljšal primerjalne rezultate za več kot 10 točk pri njihovih najzahtevnejših nalogah videnja.
»OpenAI hitro napreduje, naš sistem pa smo zasnovali tako, da lahko temu tempu sledi. Vsaka nova izdaja nam daje operativno prednost – odpira nove zmogljivosti in področja, ki jih prej nismo mogli podpirati, ter povečuje obseg in natančnost, ki ju strankam zagotavljamo.«
SafetyKit v ekosistem prav tako prispeva izboljšave in neposredno deli z OpenAI rezultate evalvacij, napake v mejnih primerih ter vpoglede, specifične za pravilnike, da bi izboljšal prihodnjo zmogljivost model za varnostno kritične naloge.
Povečajte rast strank in obsega z najboljšim OpenAI tehnološkim skladom
SafetyKitova arhitektura omogoča uveljavljanje pravilnikov v velikem obsegu ter zagotavlja hitrost, natančnost in celovito pokritost tveganj. V ozadju zdaj dnevno obdela več kot 16 milijard žetonov, v primerjavi z 200 milijoni pred šestimi meseci, pri tem pa analizira več vsebine, ne da bi pri tem žrtvoval natančnost.
V tem času se je SafetyKit razširil na tveganja pri plačilih, goljufije, preprečevanje izkoriščanja otrok, pranja denarja in pridobil nove stranke s stotinami milijonov končnih uporabnikov pod svojo zaščito. Ta osnova strankam omogoča hitro in samozavestno odzivanje na nastajajoča tveganja.
»Ustvarili smo zanko, v kateri vsaka izdaja OpenAI neposredno krepi naše zmogljivosti,« pravi Graunke. »Zato se sistem nenehno izboljšuje in vedno ostaja pred razvijajočimi se tveganji.«
Rezultati na kratko
- 95 % ali več točnosti pri pregledovanju 100 % vsebine strank
- Dnevno obdelanih 16 milijard žetonov, v primerjavi z 200 milijoni pred šestimi meseci
- Izboljšanje referenčnih meril za več kot 10 točk pri najzahtevnejših nalogah s področja vida


