SafetyKit skaleerib riskiagente OpenAI võimekaimate mudelitega
Alates varaste nägemismudelite eelvaadetega prototüüpimisest kuni GPT‑5-ga skaleerumiseni laienevad SafetyKiti multimodaalsed agendid uutesse valdkondadesse ja suurendavad täpsust.

Tulemused
95%+
100% kliendisisu läbivaatamise täpsus (SafetyKiti hindamised)
Tulemused
16B
Igapäevaselt töödeldud tokenid, kasvanud 200 miljonilt kuus kuud tagasi
Tulemused
10+
Punktiline jõudluse kasv kõige keerulisemates pildituvastusülesannetes GPT-5-ga
SafetyKit(avaneb uues aknas) ehitab multimodaalseid tehisintellekti agente, et aidata kauplemisplatvormidel, makseplatvormidel ja finantstehnoloogia ettevõtetel tuvastada pettusi ja keelatud tegevusi ning neile reageerida nii tekstis, piltides, finantstehingutes, tootenimekirjades kui ka mujal. Hiljutised läbimurded mudelite arutlusvõimes ja multimodaalses mõistmises muudavad selle nüüd tõhusamaks, seades riskide, nõuetele vastavuse ja ohutustoimingute jaoks uue lati.
SafetyKiti agendid kasutavad GPT‑5, GPT‑4.1, süvauuringute ja arvuti kasutamise agendi (CUA) tuge, et vaadata läbi 100% klientide sisust enam kui 95% täpsusega, tuginedes SafetyKiti hindamistele. Need võivad aidata platvormidel kaitsta kasutajaid, ennetada pettusi, vältida regulatiivseid trahve ja jõustada keerulisi reegleid, mis vanematel süsteemidel võivad kahe silma vahele jääda, nagu näiteks piirkonnaspetsiifilised eeskirjad, pettusepiltidele peidetud telefoninumbrid või sündsusetu sisu. Automatiseerimine võib kaitsta ka inimoderaatoreid solvava materjaliga kokkupuutumise eest ja vabastab nad nüansseeritud poliitikaotsuste tegemiseks.
„OpenAI annab meile juurdepääsu turu kõige arenenumatele arutlus- ja multimodaalsetele mudelitele. See võimaldab meil kiiresti kohaneda, uusi agente kiiremini turule tuua ja käsitleda sisutüüpe, mida teised lahendused ei suuda isegi töödelda.“
Kujunda agendid vastavalt ülesande nõuetele, seejärel vali õige mudel
Iga SafetyKiti agent on loodud tegelema kindla riskikategooriaga, alates pettustest kuni ebaseaduslike toodeteni. Iga sisuelement suunatakse selle rikkumise jaoks sobivaimale agendile, kasutades optimaalset OpenAI mudelit:
- GPT‑5 rakendab multimodaalset arutlusvõimet tekstis, piltides ja kasutajaliideses, et tuua esile varjatud riskid ning toetada mitmekihilist ja täpset otsustamist
- GPT‑4.1 järgib usaldusväärselt üksikasjalikke sisupoliitika juhiseid ja haldab tõhusalt suuremahulisi modereerimise töövooge
- Kinnistav peenhäälestamine (RFT) tõstab mudeli suutlikkust informatsiooni leidmisel ja täpsustamisel, pakkudes tipptasemel tulemusi isegi rangete ja keerukate ohutusreeglite raamistikus
- Süvauuring integreerib reaalajas veebiuurimise kaupmeeste taustakontrollidesse ja kinnitamistesse
- Arvuti kasutamise agent (CUA) automatiseerib keerulisi poliitikaülesandeid, vähendades sõltuvust kulukatest käsitsi ülevaatustest
Selline mudelite sobitamise lähenemine võimaldab SafetyKitil skaleerida sisu ülevaatamist eri modaalsuste lõikes suurema nüansirikkuse ja täpsusega, kui vanemad lahendused suudavad.
Pettuste tuvastamise agent ei piirdu näiteks ainult teksti skannimisega. See analüüsib visuaale, nagu QR-koodid või tootepiltidele integreeritud telefoninumbrid. GPT‑4.1 aitab pilti analüüsida, mõista selle paigutust ja otsustada, kas tegemist on reeglite rikkumisega.
Eeskirjade avalikustamise agent kontrollib tootenimekirju või sihtlehti nõutud teksti, näiteks juriidiliste lahtiütluste või piirkonnaspetsiifiliste vastavushoiatuste osas. GPT‑4.1 eraldab asjakohased jaotised, GPT‑5 hindab vastavust ja agent märgistab rikkumised.
„Me näeme oma agente eesmärgipäraselt ehitatud töövoogudena,“ ütleb Graunke. „Mõned ülesanded nõuavad sügavat arutlust, teised vajavad multimodaalset konteksti. OpenAI on ainus tehnoloogiakogum, mis pakub usaldusväärset jõudlust mõlemas osas.“
Poliitikaotsused sõltuvad sageli peentest eristustest. Võtame näiteks veebiplatvormi, mis nõuab tervisetoodete müüjatelt lahtiütluse lisamist, kusjuures nõuded varieeruvad vastavalt toote kohta esitatud väidetele ja piirkondlikele eeskirjadele. Vanemad teenusepakkujad kasutavad märksõnade käivitajaid või jäiku reeglistikke, mis võivad jätta märkamata sügavamad hinnangud, mida need otsused nõuda võivad, viies puuduliku või vale jõustamiseni.
SafetyKiti eeskirjade avalikustamise agent viitab esmalt SafetyKiti sisemise teegi reeglitele, seejärel hindab GPT‑5 sisu: kas see mainib ravi või ennetamist? Kas seda müüakse piirkonnas, kus avalikustamine on kohustuslik? Ja kui jah, kas nõutud tekst on tegelikult tootekirjelduses olemas? Kui midagi jääb puudu, tagastab GPT‑5 struktureeritud väljundi, mida agent kasutab probleemi märgistamiseks.
„GPT‑5 jõud seisneb selles, kui täpselt suudab see arutleda, kui toetub reaalsetele eeskirjadele,“ märgib Graunke. „See võimaldab meil teha täpseid ja põhjendatud otsuseid isegi äärmuslike juhtumite puhul, kus teised süsteemid ebaõnnestuvad.“
Muuda iga mudeli väljalase tootevõiduks
SafetyKit testib iga uut OpenAI mudelit oma kõige keerulisemate juhtumite peal, juurutades sageli parimaid sooritajaid juba samal päeval. Ranged sisemised hindamised võimaldavad meeskonnal kiiresti tuvastada, kuidas uued mudelid saavad jõudlust parandada ja sujuvalt nende põhiinfrastruktuuri integreeruda.
Kui OpenAI o3 turule toodi, kasutas SafetyKit seda äärmuslike juhtumite jõudluse suurendamiseks peamistes poliitikavaldkondades. Sellele järgnes GPT‑5 ning mõne päeva jooksul juurutati see nende kõige nõudlikumate agentide seas, parandades võrdlustestide tulemusi enam kui 10 punkti võrra nende kõige keerulisemates pildituvastusülesannetes.
„OpenAI liigub kiiresti ja me oleme oma süsteemi loonud sellega sammu pidama. Iga uus väljalase annab meile tegevuseelise – avades uusi võimekusi ja valdkondi, mida me varem toetada ei suutnud, ning suurendades ulatust ja täpsust, mida me klientidele pakume.“
SafetyKit annab täiustusi ka ökosüsteemi tagasi, jagades hindamistulemusi, äärmuslike juhtumite ebaõnnestumisi ja eeskirjaspetsiifilisi teadmisi otse OpenAI-ga, et aidata kujundada tulevaste mudelite jõudlust ohutuskriitiliste töökoormuste jaoks.
Skaleeri kliendi- ja mahukasvu parima OpenAI tehnoloogiaga
SafetyKiti arhitektuur jõustab eeskirju mastaapselt, pakkudes kiirust, täpsust ja terviklikku riskikatvust. Kulisside taga käsitleb see nüüd enam kui 16 miljardit tokenit päevas - võrreldes 200 miljoniga kuus kuud tagasi - analüüsides rohkem sisu täpsust ohverdamata.
Sama aja jooksul on SafetyKit laienenud makseriskide, pettuste, laste ärakasutamise vastase võitluse ja rahapesu tõkestamise valdkondadesse ning uute klientideni, jättes sadu miljoneid lõppkasutajaid SafetyKiti kaitse alla. See vundament annab klientidele võimaluse reageerida esilekerkivatele riskidele kiiresti ja enesekindlalt.
„Oleme loonud tsükli, kus iga OpenAI väljalase tugevdab otseselt meie võimekusi,“ ütleb Graunke. „Seetõttu süsteem pidevalt täiustub, püsides arenevatest riskidest alati sammu võrra ees.“
Tulemused lühidalt
- 95%+ täpsus 100% kliendisisu läbivaatamisel
- 16 miljardit töödeldud tokenit päevas, võrreldes 200 miljoniga kuue kuu eest
- 10+ punktine võrdlustestide kasv kõige keerulisemates pildituvastusülesannetes


