SafetyKit skalerer risikoagenter med OpenAIs mest kapable modell
Fra prototyping med tidlige forhåndsvisninger av synsmodeller til skalering med GPT‑5, utvides nå SafetyKits multimodale agenter til nye områder og øker nøyaktigheten.

Resultater
95%+
Nøyaktighetsgjennomgang av 100 % av kundeinnholdet (SafetyKit-evalueringer)
Resultater
16B
Tokens behandles daglig, en økning fra 200 millioner for seks måneder siden
Resultater
10+
Fokuser ytelsesforbedringer på de mest krevende synsoppgavene med GPT-5
SafetyKit(åpnes i et nytt vindu) bygger multimodale AI-agenter for å hjelpe markedsplasser, betalingsplattformer og fintech-selskaper med å oppdage og håndtere svindel og ulovlig aktivitet på tvers av tekst, bilder, finansielle transaksjoner, produktoppføringer og mer. Nylige gjennombrudd innen modellresonnering og multimodal forståelse gjør nå dette mer effektivt og setter en ny standard for arbeid med risiko, etterlevelse og sikkerhet.
SafetyKits agenter bruker GPT‑5, GPT‑4.1, dyp forskning og databrukende agent (CUA (DBA)) til å gjennomgå 100 % av kundeinnholdet med over 95 % nøyaktighet, basert på SafetyKits evalueringer. De kan hjelpe plattformer med å beskytte brukere, forhindre svindel, unngå regulatoriske bøter og håndheve komplekse retningslinjer som eldre systemer kan overse, som regionsspesifikke regler, innebygde telefonnumre i svindelbilder eller eksplisitt innhold. Automatisering kan også beskytte menneskelige moderatorer mot å bli eksponert for støtende materiale og frigjør dem til å håndtere nyanserte beslutninger om retningslinjer.
«OpenAI gir oss tilgang til de mest avanserte resonnerings- og multimodale modellene på markedet. Det lar oss tilpasse oss raskt, levere nye agenter raskere og håndtere innholdstyper som andre løsninger ikke engang kan tolke.
Design agenter for det oppgaven krever, og velg deretter riktig modell
SafetyKits agenter er alle utviklet for å håndtere en spesifikk risikokategori, fra svindel til ulovlige produkter. Hvert innholdselement rutes til agenten som er best egnet for det aktuelle bruddet, ved hjelp av den optimale OpenAI-modellen:
- GPT‑5 bruker multimodal resonnering på tvers av tekst, bilder og UI for å avdekke skjulte risikoer og støtte lagdelt, presis beslutningstaking
- GPT‑4.1 følger detaljerte instruksjoner for innholdspolicy på en pålitelig måte og håndterer modereringsarbeidsflyter med høyt volum på en effektiv måte
- Finjustering av forsterkning (RFT) gir bedre tilbakekalling og presisjon enn standardmodeller, og leverer banebrytende ytelse med komplekse sikkerhetspolicyer
- Deep research integrerer sanntidsundersøkelser på nettet med anmeldelser og verifiseringer av forhandlere
- Databrukende agent (CUA (DBA)) automatiserer komplekse policyoppgaver og reduserer avhengigheten av kostbare manuelle vurderinger
Denne modell-matching-metoden lar SafetyKit skalere innholdsgjennomgang på tvers av modaliteter med mer nyanser og høyere nøyaktighet enn eldre løsninger.
Scam Detection-agenten går for eksempel utover bare å skanne tekst. Den analyserer visuelle elementer som QR-koder eller telefonnumre som er innebygd i produktbilder. GPT‑4.1 hjelper den med å tolke bildet, forstå layouten og avgjøre om det er et brudd på retningslinjene.
Policy Disclosure-agenten sjekker oppføringer eller landingssider for nødvendig språk, som juridiske ansvarsfraskrivelser eller regionsspesifikke samsvarsadvarsler. GPT‑4.1 henter ut relevante avsnitt, GPT‑5 vurderer samsvar, og agenten flagger brudd.
«Vi ser på agentene våre som arbeidsflyter laget for spesifikke formål», sier Graunke. «Noen oppgaver krever dyp resonnering, andre trenger multimodal kontekst. OpenAI er den eneste plattformen som leverer pålitelig ytelse på tvers av begge.»
Avgjørelser om retningslinjer avhenger ofte av subtile skiller. Tenk deg en markedsplass som krever at selgere inkluderer en ansvarsfraskrivelse for velværeprodukter, der kravene varierer avhengig av produktpåstander og regionale regler. Eldre leverandører bruker nøkkelordutløsere eller rigide regelsett, som kan gå glipp av de mer nyanserte vurderingene som disse beslutningene kan kreve, noe som fører til manglende eller feil håndhevelse.
SafetyKits Policy Disclosure-agent refererer først til retningslinjer fra SafetyKits interne bibliotek, og deretter vurderer GPT‑5 innholdet: nevner det behandling eller forebygging? Blir det solgt i en region der offentliggjøring er obligatorisk? Og hvis det er tilfelle, er det nødvendige språket faktisk oppført i listen? Hvis noe ikke er på plass, returnerer GPT‑5 strukturert utdata som agenten bruker til å flagge problemet.
«Styrken til GPT‑5 ligger i hvor presist det kan resonnere når det er forankret i faktiske retningslinjer», påpeker Graunke. «Det lar oss ta nøyaktige og forsvarlige beslutninger selv i yttertilfellene der andre systemer svikter.»
Gjør hver modellutgivelse om til en produktseier
SafetyKit tester hver nye OpenAI-modell mot de vanskeligste tilfellene, og bruker ofte de beste samme dag. Grundige interne evalueringer gjør at teamet raskt kan finne ut hvordan nye modeller kan forbedre ytelsen og integreres sømløst i kjerneinfrastrukturen deres.
Da OpenAI o3 ble lansert, brukte SafetyKit det til å forbedre ytelsen i edge cases på tvers av viktige policyområder. GPT‑5 kom deretter, og i løpet av få dager ble den tatt i bruk på tvers av de mest krevende agentene deres, og forbedret referansepoengene med mer enn 10 poeng på deres mest utfordrende visuelle oppgaver.
«OpenAI beveger seg raskt, og vi har designet systemet vårt for å holde tritt. Hver nye lansering gir oss et operasjonelt fortrinn – åpner for nye muligheter og bruksområder vi ikke kunne støtte tidligere, og øker dekningen og nøyaktigheten vi leverer til kundene.»
SafetyKit bidrar også med forbedringer tilbake til økosystemet, og deler evalueringsresultater, feil i grensetilfeller og innsikt knyttet til retningslinjer direkte med OpenAI for å bidra til å forme fremtidig modellprestasjon for sikkerhetskritiske arbeidsbelastninger.
Skaler kunde- og volumvekst med den beste OpenAI-plattformen
SafetyKits arkitektur håndhever retningslinjer i stor skala og leverer hastighet, presisjon og omfattende risikodekning. Bak kulissene håndterer det nå over 16 milliarder tokens daglig, opp fra 200 millioner for seks måneder siden, og analyserer mer innhold uten å gå på kompromiss med nøyaktigheten.
I samme periode har SafetyKit blitt utvidet til å omfatte betalingsrisiko, svindel, beskyttelse mot utnyttelse av barn, bekjempelse av hvitvasking og nye kunder med hundrevis av millioner av sluttbrukere under SafetyKits beskyttelse. Dette grunnlaget gjør kundene i stand til å reagere raskt og trygt på nye risikoer.
«Vi har skapt en sløyfe der hver OpenAI-lansering direkte styrker kapasiteten vår», sier Graunke. «Det er derfor systemet stadig forbedres og alltid holder seg i forkant av utviklende risikoer.»
Kort sagt om resultatene
- 95 %+ nøyaktighet ved gjennomgang av 100 % av kundeinnhold
- 16 mrd. tokens behandles daglig, opp fra 200 mill. på seks måneder
- Forbedringer på over 10 poeng på de vanskeligste visjonsoppgavene


