Gå direkt till huvudinnehåll
OpenAI

9 september 2025

SafetyKit skalar upp riskagenter med OpenAI:s främsta modeller

Från prototyparbete med tidiga förhandsversioner av visionsmodeller till uppskalning med GPT‑5 expanderar SafetyKits multimodal-agenter till nya domäner och förbättrar träffsäkerheten.

SafetyKit-logotypen i vitt, centrerad på en mörk bakgrund med orange, gult och blågrönt ljus.
Företagets storlek: Startupföretag
Region: Nordamerika
Bransch: Teknik, Tjänster
Produkter: API

Resultat

95%+

Noggrann granskning av 100 % av allt kundinnehåll (SafetyKit-utvärderingar)

Resultat

16B

Token som bearbetas dagligen, en ökning från 200 miljoner för sex månader sedan

Resultat

10+

Poängprestandaökningar vid svåraste visionsuppgifter med GPT-5

Laddar …

SafetyKit(öppnas i ett nytt fönster) utvecklar multimodala AI-agenter för att hjälpa marknadsplatser, betalningsplattformar och fintechbolag att upptäcka och agera mot bedrägerier och förbjudna aktiviteter i text, bilder, finansiella transaktioner, produktannonser och mer. Nya genombrott inom modellresonemang och multimodal förståelse gör nu detta mer effektivt och sätter en ny ribba för risk-, efterlevnads- och säkerhetsverksamhet.

SafetyKits agenter använder GPT‑5, GPT‑4.1, djup forskning och datoranvändande agent (CUA) för att granska 100 % av kundinnehållet med över 95 % noggrannhet enligt SafetyKits utvärderingar. De kan hjälpa plattformar att skydda användare, förhindra bedrägerier, undvika böter från tillsynsmyndigheter och upprätthålla komplexa policyer som äldre system kan missa, såsom regionsspecifika regler, inbäddade telefonnummer i bedrägliga bilder eller explicit innehåll. Automatisering kan också skydda mänskliga moderatorer från exponering för stötande material och frigöra dem för att hantera nyanserade policybeslut.

“OpenAI ger oss tillgång till marknadens mest avancerade resonemangs- och multimodala modeller. Det gör att vi kan anpassa oss snabbt, leverera nya agenter snabbare och hantera innehållstyper som andra lösningar inte ens kan tolka.”
David Graunke, grundare och VD på SafetyKit

Utforma agenter efter vad uppgiften kräver och välj rätt modell.

SafetyKits agenter är var och en utformad för att hantera en specifik riskkategori, från bedrägerier till olagliga produkter. Allt innehåll vidarebefordras till den agent som passar bäst för överträdelsen med den optimala OpenAI-modellen:

  • GPT‑5 tillämpar multimodalt resonemang på text, bilder och användargränssnitt för att identifiera dolda risker och stödja noggrant och flerskiktat beslutsfattande
  • GPT‑4.1 följer detaljerade instruktioner för innehållspolicy tillförlitligt och hanterar modereringsarbetsflöden i stor skala effektivt
  • Finjustering av förstärkning (RFT) förbättrar återkallelse och precision jämfört med standardmodeller och uppnår banbrytande prestanda med komplexa säkerhetspolicyer
  • Funktionen djup forskning integrerar onlineundersökningar i realtid i omdömen och verifieringar av handlare.
  • Datoranvändande agent (CUA) automatiserar komplexa policyuppgifter och minskar därmed beroendet av kostsamma manuella granskningar

Den här metoden för modellmatchning gör det möjligt för SafetyKit att skala upp innehållsgranskningen i flera modaliteter, med större nyans och noggrannhet än äldre lösningar.

Agenten för bedrägeridetektering går till exempel längre än att bara skanna text. Den analyserar visuella element som QR-koder eller telefonnummer som är inbäddade i produktbilder. GPT‑4.1 hjälper den att tolka bilden, förstå layouten och avgöra om det rör sig om ett policybrott.

Agenten för policyavslöjanden granskar listor eller landningssidor för obligatoriska texter, till exempel juridiska friskrivningar eller regionspecifika efterlevnadsvarningar. GPT‑4.1 extraherar relevanta avsnitt, GPT‑5 utvärderar efterlevnaden och agenten flaggar överträdelser.

”Vi ser våra agenter som specialbyggda arbetsflöden”, säger Graunke. ”Vissa uppgifter kräver djupa resonemang, andra behöver multimodal kontext. OpenAI är den enda stacken som levererar tillförlitlig prestanda i båda.

Linjediagram och stapeldiagram med etiketten ”SafetyKit” mot en ljus bakgrund, som visar datatrender och jämförelser mellan flera kategorier.

Använd GPT‑5 för att navigera i gråzoner och fatta viktiga beslut.

Policybeslut beror ofta på små, men viktiga skillnader. Föreställ dig en marknadsplats där säljare måste inkludera en friskrivning för wellnessprodukter, med krav som varierar beroende på produktpåståenden och regionala regler. Äldre leverantörer använder nyckelordsutlösare eller strikta regeluppsättningar, vilket kan missa de mer nyanserade bedömningar som dessa beslut kräver och därmed leda till utebliven eller felaktig verkställighet.

SafetyKits Policy Disclosure-agent hänvisar först till policyer i SafetyKits interna bibliotek och därefter utvärderar GPT‑5 innehållet: nämns behandling eller förebyggande åtgärder? Säljs den i en region där informationsskyldighet är obligatorisk? Och i så fall, är det språk som krävs faktiskt med i listan? Om något brister returnerar GPT‑5 en strukturerad utdata som agenten använder för att flagga problemet.

”GPT‑5:s styrka ligger i hur precist det kan resonera när det grundas i faktisk policy”, konstaterar Graunke. ”Det gör att vi kan fatta korrekta och välgrundade beslut även i de kantfall där andra system misslyckas.”

Förvandla varje modellsläpp till en produktframgång

SafetyKit benchmarkar varje ny OpenAI-modell mot de svåraste fallen och driftsätter ofta de bästa modellerna redan samma dag. Rigorösa interna utvärderingar gör det möjligt för teamet att snabbt se hur nya modeller kan förbättra prestandan och integreras sömlöst i deras kärninfrastruktur.

När OpenAI o3 lanserades använde SafetyKit det för att förbättra prestandan i gränsfall inom viktiga policyområden. GPT‑5 kom därefter, och inom några dagar driftsattes det i deras mest krävande agenter, vilket förbättrade benchmarkresultaten med mer än 10 poäng på deras svåraste visuella uppgifter.

”OpenAI utvecklas snabbt och vi har utformat vårt system för att hänga med. Varje ny lansering ger oss ett operativt försprång – öppnar nya möjligheter och områden som vi inte har kunnat stödja tidigare, och ökar täckningen och precisionen vi levererar till kunderna.”
– David Graunke, grundare och VD på SafetyKit

SafetyKit för också tillbaka förbättringar till ekosystemet genom att dela evalresultat, gränsfall, fel och policyspecifika insikter direkt med OpenAI för att bidra till att forma framtida modellprestanda för säkerhetskritiska arbetsbelastningar.

Skala kund- och volymtillväxt med den bästa OpenAI-stacken

SafetyKits arkitektur säkerställer efterlevnad av policyer i stor skala och ger snabbhet, precision och heltäckande riskhantering. I bakgrunden hanterar den nu över 16 miljarder token per dag, jämfört med 200 miljoner för sex månader sedan, och analyserar mer innehåll utan att tumma på noggrannheten.

Under samma period har SafetyKit expanderat till betalningsrisker, bedrägerier, mot sexuell exploatering av barn, mot penningtvätt och nya kunder med hundratals miljoner slutanvändare som skyddas av SafetyKit. Den här grunden ger kunder möjlighet att agera snabbt och tryggt inför nya risker.

”Vi har skapat en återkopplingsslinga där varje lansering från OpenAI direkt stärker vår förmåga”, säger Graunke. ”Det är därför systemet ständigt förbättras och alltid ligger steget före föränderliga risker.”

Resultat i korthet

  • 95-procentig precision vid granskning av 100 procent av kundinnehåll
  • 16 miljarder token bearbetas dagligen, upp från 200 miljoner på sex månader
  • Över tio punkters förbättring på riktmärken för de mest utmanande visuella uppgifterna

Bli en del av den nya eran av arbete

Mer än 1 miljon företag världen runt uppnår meningsfulla resultat med OpenAI.