Overslaan naar hoofdinhoud
OpenAI

9 september 2025

SafetyKit schaalt agents voor risicobeheersing met OpenAI

Van prototyping met vroege previews van vision-modellen tot opschalen met GPT‑5: de multimodale agents van SafetyKit breiden zich uit naar nieuwe domeinen en verhogen de nauwkeurigheid.

SafetyKit-logo in wit, gecentreerd op een donkere achtergrond met verticale textuur en een warm kleurverloop van oranje, geel en blauwgroen licht.
Grootte van de onderneming: Start-up
Regio: Noord-Amerika
Sector: Technologie, Diensten
Producten: API

Resultaten

95%+

Nauwkeurigheidsbeoordeling van 100% van de klantinhoud (SafetyKit-evaluaties)

Resultaten

16B

Tokens die dagelijks worden verwerkt, tegenover 200 miljoen zes maanden geleden

Resultaten

10+

Punten prestatieverbetering op de moeilijkste visietaken met GPT-5

Bezig met laden...

SafetyKit(opent in een nieuw venster) bouwt multimodale AI-agents om marktplaatsen, betalingsplatforms en fintechs te helpen fraude en illegale activiteiten te detecteren en er actie tegen te ondernemen in tekst, afbeeldingen, financiële transacties, productvermeldingen en meer. Recente doorbraken in de redenering van modellen en multimodaal begrip maken dit nu effectiever en leggen de lat hoger voor activiteiten op het gebied van risico, compliance en veiligheid.

De agents van SafetyKit maken gebruik van GPT‑5, GPT‑4.1, diepgaand onderzoek en Computer Using Agent (CUA) om 100% van de klantcontent te beoordelen met een nauwkeurigheid van meer dan 95% op basis van de evaluaties van SafetyKit. Ze kunnen platforms helpen gebruikers te beschermen, fraude te voorkomen, boetes van toezichthouders te vermijden en complex beleid te handhaven dat verouderde systemen mogelijk missen, zoals regiospecifieke regels, ingesloten telefoonnummers in frauduleuze afbeeldingen of expliciete inhoud. Automatisering kan menselijke moderators ook beschermen tegen blootstelling aan aanstootgevend materiaal en maakt het voor hen mogelijk zich bezig te houden met genuanceerde beleidsbeslissingen.

"OpenAI geeft ons toegang tot de meest geavanceerde modellen voor redeneren en multimodale toepassingen op de markt. Daardoor kunnen we snel schakelen, sneller nieuwe agents bouwen en werken met content die andere oplossingen niet eens kunnen verwerken."
David Graunke, oprichter en CEO van SafetyKit

Ontwerp agents voor wat de taak vereist en kies vervolgens het juiste model

De agents van SafetyKit zijn elk ontwikkeld om een specifieke risicocategorie af te handelen, van oplichting tot illegale producten. Elk stuk content wordt geleid naar de agent die het meest geschikt is voor die overtreding, met behulp van het optimale OpenAI-model:

  • GPT‑5 past multimodale redenering toe op tekst, afbeeldingen en UI om verborgen risico’s aan het licht te brengen en gelaagde, nauwkeurige besluitvorming te ondersteunen
  • GPT‑4.1 volgt gedetailleerde instructies voor contentbeleid betrouwbaar op en beheert grootschalige moderatieworkflows efficiënt
  • Reinforcement fine-tuning (RFT) verbetert recall en precisie ten opzichte van standaardmodellen en haalt topprestaties bij complexe veiligheidsrichtlijnen.
  • Diepgaand onderzoek integreert realtime online onderzoek in recensies en verificaties van verkopers
  • Computer-Using Agent (CUA) automatiseert complexe beleidstaken, waardoor de afhankelijkheid van dure handmatige controles afneemt

Met deze model-matching aanpak kan SafetyKit contentbeoordeling over verschillende modaliteiten opschalen, met meer nuance en nauwkeurigheid dan oudere oplossingen.

De Scam Detection-agent gaat bijvoorbeeld verder dan alleen het scannen van tekst. Het analyseert visuele elementen zoals QR-codes of telefoonnummers die zijn ingesloten in productafbeeldingen. GPT‑4.1 helpt je de afbeelding te parsen, de lay-out te begrijpen en te bepalen of er sprake is van een beleidsschending.

De Policy Disclosure-agent controleert vermeldingen of landingspagina’s op vereiste formuleringen, zoals juridische disclaimers of regiospecifieke nalevingswaarschuwingen. GPT‑4.1 selecteert relevante secties, GPT‑5 beoordeelt de naleving en de agent markeert overtredingen.

"We beschouwen onze agents als specifiek ontworpen workflows," zegt Graunke. "Sommige taken vereisen diepe redenering, andere hebben multimodale context nodig. OpenAI is de enige stack die op beide betrouwbare prestaties levert."

Lijn- en staafdiagram met het label “SafetyKit” op een lichte achtergrond, dat gegevenstrends en vergelijkingen in meerdere categorieën weergeeft.

GPT‑5 als hulpmiddel bij twijfelgevallen en belangrijke beslissingen

Beleidsbeslissingen hangen vaak af van subtiele nuances. Stel je een marktplaats voor waar verkopers een disclaimer voor wellnessproducten moeten opnemen, waarbij de vereisten variëren op basis van productclaims en regionale regels. Verouderde aanbieders gebruiken trefwoordtriggers of rigide regelsets, waardoor diepere afwegingen die deze beslissingen mogelijk vereisen over het hoofd kunnen worden gezien, wat leidt tot gemiste of onjuiste handhaving.

SafetyKit’s Policy Disclosure-agent raadpleegt eerst beleidsregels uit SafetyKit’s interne bibliotheek, waarna GPT‑5 de inhoud beoordeelt: worden behandeling of preventie genoemd? Wordt het verkocht in een regio waar openbaarmaking verplicht is? En zo ja, is de vereiste taal daadwerkelijk in de lijst opgenomen? Als iets tekortschiet, geeft GPT‑5 gestructureerde output terug die de agent gebruikt om het probleem te markeren.

"De kracht van GPT‑5 zit in hoe nauwkeurig het kan redeneren wanneer het is gebaseerd op echt beleid", merkt Graunke op. "Het stelt ons in staat om nauwkeurige, verdedigbare beslissingen te nemen, zelfs in de randgevallen waarin andere systemen falen."

Maak van elke model-release een productsucces

SafetyKit test elk nieuw OpenAI-model aan de hand van de moeilijkste gevallen en zet het best presterende model vaak nog diezelfde dag in. Strenge interne evaluaties stellen het team in staat om snel te bepalen hoe nieuwe modellen de prestaties kunnen verbeteren en naadloos in hun kerninfrastructuur kunnen worden geïntegreerd.

Toen OpenAI o3 werd gelanceerd, gebruikte SafetyKit het om de prestaties in edge cases binnen belangrijke beleidsdomeinen te verbeteren. GPT‑5 volgde daarop, en werd binnen enkele dagen uitgerold voor hun meest veeleisende agents, waarmee de benchmarkscores op hun moeilijkste visietaken met meer dan 10 punten werden verbeterd.

“OpenAI ontwikkelt zich snel en ons systeem is daarop ingericht. Elke nieuwe release geeft ons een voorsprong: we kunnen meer toepassingen en domeinen ondersteunen, en leveren bredere dekking en hogere nauwkeurigheid aan klanten."
—David Graunke, oprichter en CEO van SafetyKit

SafetyKit brengt ook verbeteringen terug in het ecosysteem en deelt evaluatieresultaten, mislukkingen in randgevallen en beleidspecifieke inzichten rechtstreeks met OpenAI om de toekomstige prestaties van modellen voor veiligheidskritieke workloads vorm te geven.

Schaal klant- en volumegroei op met de beste OpenAI-stack

De architectuur van SafetyKit dwingt beleid op schaal af en levert snelheid, precisie en brede risicodekking. Achter de schermen verwerkt het nu dagelijks meer dan 16 miljard tokens, tegenover 200 miljoen zes maanden geleden, waarbij meer content wordt geanalyseerd zonder concessies te doen aan de nauwkeurigheid.

In diezelfde periode is SafetyKit uitgebreid naar betalingsrisico’s, fraude, de bestrijding van kinduitbuiting en witwassen, en bedient het nieuwe klanten met honderden miljoenen eindgebruikers. Deze basis stelt klanten in staat snel en vol vertrouwen te reageren op opkomende risico's.

"We hebben een feedbacklus gecreëerd waarbij elke OpenAI-release onze mogelijkheden direct versterkt", zegt Graunke. "Daarom blijft het systeem zich continu verbeteren en loopt het altijd voor op nieuwe risico’s."

Resultaten in één oogopslag

  • 95%+ nauwkeurigheid bij het beoordelen van 100% van de klantcontent
  • Dagelijks 16 miljard tokens verwerkt, tegenover 200 miljoen zes maanden geleden.
  • Meer dan 10 punten benchmarkwinst bij de moeilijkste visuele taken

Stap in het nieuwe tijdperk van werk

Meer dan 1 miljoen bedrijven wereldwijd behalen zinvolle resultaten met OpenAI.