Zum Hauptinhalt springen
OpenAI

9. September 2025

SafetyKit skaliert Risikoagenten mit OpenAIs stärksten Modellen

Vom Prototyping mit Vorschauen von frühen Bildverarbeitungsmodellen bis zur Skalierung mit GPT‑5 erschließen die multimodalen Agenten von SafetyKit neue Anwendungsbereiche und steigern die Genauigkeit.

SafetyKit-Logo in Weiß, zentriert vor einem dunklen, vertikal strukturierten Hintergrund mit einem warmen Farbverlauf aus orangefarbenem, gelbem und türkisfarbenem Licht.
Unternehmensgröße: Startup
Region: Nordamerika
Branche: Technologie, Dienstleistungen
Produkte: API

Resultate

95%+

Genauigkeit bei der Überprüfung von 100 % der Kundeninhalte (SafetyKit-Evals)

Resultate

16B

Tokens pro Tag verarbeitet, gegenüber 200 Mio. vor sechs Monaten

Resultate

10+

Punkte Leistungssteigerung bei den anspruchsvollsten Bildverarbeitungsaufgaben mit GPT-5

Laden …

SafetyKit(wird in einem neuen Fenster geöffnet) entwickelt multimodale KI-Agenten, um Marktplätzen, Zahlungsplattformen und Fintech-Unternehmen dabei zu helfen, Betrug und verbotene Aktivitäten in Texten, Bildern, Finanztransaktionen, Produktangeboten und mehr zu erkennen und dagegen vorzugehen. Jüngste Durchbrüche im Reasoning und multimodalen Verständnis von Modellen machen dies nun effektiver und setzen damit neue Maßstäbe für Risiko-, Compliance- und Sicherheitsabläufe.

Die Agenten von SafetyKit nutzen GPT‑5, GPT‑4.1, Deep Research und Computer-Using Agent (CUA), um 100 % der Kundeninhalte mit einer Genauigkeit von über 95 %, basierend auf den Evals von SafetyKit, zu prüfen. Sie können Plattformen dabei helfen, Nutzer:innen zu schützen, Betrug zu verhindern, aufsichtsrechtliche Geldbußen zu vermeiden und komplexe Richtlinien durchzusetzen, die Altsystemen möglicherweise entgehen, etwa regionsspezifische Regeln, in Betrugsbilder eingebettete Telefonnummern oder explizite Inhalte. Automatisierung kann menschliche Moderator:innen zudem vor der Konfrontation mit anstößigem Material schützen und es ihnen ermöglichen, sich auf differenzierte Richtlinienentscheidungen zu konzentrieren.

„OpenAI gibt uns Zugang zu den fortschrittlichsten Reasoning- und multimodalen Modellen auf dem Markt. So können wir uns schnell anpassen, schneller neue Agenten bereitstellen und mit Inhaltstypen umgehen, die andere Lösungen nicht einmal analysieren können.“
David Graunke, Grüner und CEO von SafetyKit

Agenten für die Anforderungen der jeweiligen Aufgabe entwickeln und dann das richtige Modell auswählen

Die Agenten von SafetyKit sind jeweils dafür entwickelt, eine bestimmte Risikokategorie zu handhaben – von Betrugsmaschen bis hin zu illegalen Produkten. Jeder Inhalt wird an den für den jeweiligen Verstoß am besten geeigneten Agenten weitergeleitet, der das jeweils optimale OpenAI-Modell verwendet:

  • GPT‑5 wendet multimodales Reasoning über Text, Bilder und Benutzeroberflächen hinweg an, um verborgene Risiken aufzudecken und eine mehrschichtige, präzise Entscheidungsfindung zu unterstützen.
  • GPT‑4.1 befolgt zuverlässig detaillierte Anweisungen zu Inhaltsrichtlinien und verwaltet Workflows zur Moderation mit hohem Volumen effizient.
  • Reinforcement Fine-Tuning (RFT) steigert die Erkennungsrate und Präzision über die Standardmodelle hinaus und erzielt so Frontier-Leistung bei komplexen Sicherheitsrichtlinien.
  • Deep Research integriert Echtzeit-Online-Prüfung von Händlerbewertungen und -verifizierungen.
  • Computer-Using Agent (CUA) automatisiert komplexe Richtlinienaufgaben und verringert die Abhängigkeit von teuren manuellen Prüfungen.

Mit diesem Ansatz zum Modellabgleich kann SafetyKit die Inhaltsprüfung modalitätsübergreifend mit größerer Differenziertheit und Genauigkeit skalieren, als es herkömmliche Lösungen können.

Der Agent „Scam Detection“ (Betrugserkennung) geht beispielsweise über das bloße Scannen von Text hinaus. Er analysiert visuelle Elemente wie QR-Codes oder Telefonnummern, die in Produktbildern eingebettet sind. GPT‑4.1 hilft ihm beim Analysieren des Bildes, beim Verstehen des Layouts und bei der Entscheidung, ob es sich um einen Richtlinienverstoß handelt.

Der Agent „Policy Disclosure“ (Richtlinienhinweis) prüft Angebote oder Landingpages auf erforderliche Formulierungen, wie z. B. rechtliche Haftungsausschlüsse oder regionsspezifische Compliance-Warnhinweise. GPT‑4.1 extrahiert relevante Abschnitte, GPT‑5 bewertet die Compliance, und der Agent kennzeichnet Verstöße.

„Wir betrachten unsere Agenten als speziell entwickelte Arbeitsabläufe“, sagt Graunke. „Einige Aufgaben erfordern tiefes Reasoning, andere benötigen multimodalen Kontext. OpenAI ist der einzige Stack, der in beiden Bereichen zuverlässige Leistung bietet.“

Linien- und Balkendiagramm mit der Bezeichnung „SafetyKit“, das auf hellem Hintergrund Datentrends und Vergleiche über mehrere Kategorien hinweg darstellt.

GPT‑5 nutzen, um Grauzonen und Entscheidungen mit hohem Risiko zu bewältigen

Richtlinienentscheidungen hängen oft von feinen Unterscheidungen ab. Nehmen wir einen Marktplatz, der von Verkäufer:innen verlangt, für Wellness-Produkte einen Haftungsausschluss anzugeben, wobei die Anforderungen je nach Produktaussagen und regionalen Vorschriften variieren. Herkömmliche Anbieter nutzen Schlüsselwort-Trigger oder starre Regelsätze, wodurch die für diese Entscheidungen möglicherweise erforderlichen tiefergehenden Ermessensentscheidungen außer Acht gelassen werden, was zu einer unterlassenen oder fehlerhaften Durchsetzung führen kann.

Der „Policy Disclosure“-Agent von SafetyKit zieht zunächst Richtlinien aus der internen Bibliothek von SafetyKit heran, dann bewertet GPT‑5 den Inhalt: Werden Behandlung oder Prävention erwähnt? Wird es in einer Region verkauft, in der ein Hinweis vorgeschrieben ist? Und wenn ja, ist die erforderliche Formulierung tatsächlich im Angebot enthalten? Wenn etwas nicht den Anforderungen entspricht, gibt GPT‑5 eine strukturierte Ausgabe zurück, die der Agent verwendet, um das Problem zu kennzeichnen.

„Die Stärke von GPT‑5 liegt darin, wie präzise es Schlussfolgerungen ziehen kann, wenn es in realen Richtlinien verankert wird“, so Graunke. „Es ermöglicht uns, selbst in Grenzfällen, in denen andere Systeme scheitern, präzise, vertretbare Entscheidungen zu treffen.“

Jedes Modell-Release zu einem Produkterfolg machen

SafetyKit evaluiert jedes neue OpenAI-Modell anhand seiner schwierigsten Fälle und implementiert die leistungsstärksten Modelle oft noch am selben Tag. Strenge interne Evaluierungen ermöglichen es dem Team, schnell zu erkennen, wie neue Modelle die Leistung verbessern können und sich nahtlos in die Kerninfrastruktur integrieren lassen.

Als OpenAI o3 eingeführt wurde, nutzte SafetyKit es, um die Leistung bei Grenzfällen in wichtigen Richtlinienbereichen zu verbessern. Darauf folgte GPT‑5, das innerhalb weniger Tage bei den anspruchsvollsten Agenten des Unternehmens zum Einsatz kam, wodurch sich die Benchmark-Ergebnisse bei den schwierigsten Bildverarbeitungsaufgaben um mehr als 10 Punkte verbesserten.

„OpenAI entwickelt sich schnell weiter, und wir haben unser System so konzipiert, dass es mithalten kann. Jedes neue Release verschafft uns einen operativen Vorsprung – sie erschließen uns neue Funktionen und Einsatzbereiche, die wir zuvor nicht unterstützen konnten, und erhöhen die Abdeckung und Genauigkeit, die wir unseren Kund:innen bieten.“
– David Graunke, Gründer und CEO von SafetyKit

SafetyKit spielt Verbesserungen außerdem zurück ins Ökosystem, indem es Eval-Ergebnisse, Fehler in Grenzfällen und richtlinienbezogene Erkenntnisse direkt mit OpenAI teilt, um die künftige Modellleistung für sicherheitskritische Workloads mitzugestalten.

Kunden- und Volumenwachstum mit dem besten OpenAI-Stack skalieren

Die Architektur von SafetyKit setzt Richtlinien im großen Maßstab durch und bietet Geschwindigkeit, Präzision und umfassende Risikoabdeckung. Hinter den Kulissen verarbeitet das System mittlerweile täglich über 16 Milliarden Token – vor sechs Monaten waren es noch 200 Millionen – und analysiert damit mehr Inhalte, ohne dabei an Genauigkeit einzubüßen.

Im selben Zeitraum hat SafetyKit sein Angebot auf Zahlungsrisiken, Betrug, Maßnahmen gegen die Ausbeutung von Kindern, Geldwäschebekämpfung sowie neue Kunden mit Hunderten Millionen Endnutzer:innen, die unter dem Schutz von SafetyKit stehen, ausgeweitet. Diese Grundlage versetzt Kunden in die Lage, schnell und souverän auf neu auftretende Risiken zu reagieren.

„Wir haben einen Kreislauf geschaffen, in dem jedes OpenAI-Release unsere Fähigkeiten direkt stärkt“, so Graunke. „Deshalb verbessert sich das System kontinuierlich und ist den sich stetig weiterentwickelnden Risiken immer einen Schritt voraus.“

Ergebnisse auf einen Blick

  • 95 %+ Genauigkeit bei der Überprüfung von 100 % der Kundeninhalte
  • 16 Mrd. Tokens pro Tag verarbeitet – noch sechs Monate zuvor waren es 200 Mio.
  • 10+ Punkte Leistungssteigerung bei den schwierigsten Bildverarbeitungsaufgaben in Benchmarks

Werde Teil der neuen Arbeitswelt

Mehr als 1 Million Unternehmen weltweit erzielen mit OpenAI bedeutende Ergebnisse.