SafetyKit amplía sus agentes de riesgo con los modelos de OpenAI
Desde la creación de prototipos con las primeras versiones preliminares de modelos de visión hasta la ampliación con GPT‑5, los agentes multimodales de SafetyKit se expanden a nuevos ámbitos y aumentan la precisión.

Resultados
95%+
de precisión al revisar el 100% del contenido de los clientes (evaluaciones de SafetyKit)
Resultados
16B
de tokens procesados al día, frente a los 200 millones de hace seis meses
Resultados
10+
puntos de mejora en el rendimiento en las tareas de visión más difíciles con GPT-5
SafetyKit(se abre en una ventana nueva) desarrolla agentes de IA multimodales para ayudar a los marketplaces, las plataformas de pago y las fintech a detectar y actuar frente al fraude y las actividades prohibidas en textos, imágenes, transacciones financieras, listados de productos y mucho más. Los avances recientes en el razonamiento de modelos y la comprensión multimodal hacen que estas soluciones sean más eficaces y establecen un nuevo estándar para las operaciones de riesgo, cumplimiento normativo y seguridad.
Los agentes de SafetyKit utilizan GPT‑5, GPT‑4.1, investigación en profundidad y el agente informático (CUA) para revisar el 100% del contenido de los clientes con una precisión superior al 95%, según las evaluaciones de SafetyKit. Pueden ayudar a las plataformas a proteger a los usuarios, prevenir el fraude, evitar sanciones regulatorias y aplicar políticas complejas que los sistemas tradicionales pueden pasar por alto, como normas específicas de cada región, números de teléfono incrustados en imágenes fraudulentas o contenido explícito. La automatización también puede proteger a los moderadores humanos de la exposición a material ofensivo y les permite centrarse en decisiones normativas matizadas.
«OpenAI nos da acceso a los modelos de razonamiento y multimodales más avanzados del mercado. Nos permite adaptarnos rápidamente, lanzar nuevos agentes más rápido y gestionar tipos de contenido que otras soluciones ni siquiera pueden analizar».
Diseña agentes según lo que exija la tarea y luego elige el modelo adecuado
Cada uno de los agentes de SafetyKit está diseñado para gestionar una categoría de riesgo específica, desde estafas hasta productos ilegales. Cada contenido se dirige al agente más adecuado para esa infracción, con el modelo óptimo de OpenAI:
- GPT‑5 aplica razonamiento multimodal en texto, imágenes e IU para detectar riesgos ocultos y facilitar una toma de decisiones precisa y por capas
- GPT‑4.1 sigue de forma fiable instrucciones detalladas de políticas de contenido y gestiona con eficiencia flujos de trabajo de moderación de gran volumen
- El ajuste fino por refuerzo (RFT) mejora la exhaustividad y la precisión más allá de los modelos predeterminados, y logra un rendimiento de vanguardia con políticas de seguridad complejas
- La investigación avanzada integra la búsqueda en línea en tiempo real en las revisiones y verificaciones de comercios
- El agente informático (CUA) automatiza tareas complejas relacionadas con las políticas y reduce la dependencia de costosas revisiones manuales
Este enfoque de emparejamiento de modelos permite a SafetyKit ampliar la revisión de contenido en distintas modalidades con más matices y precisión que las soluciones tradicionales.
El agente de detección de estafas, por ejemplo, va más allá del simple escaneo de texto. Analiza elementos visuales como códigos QR o números de teléfono incrustados en imágenes de productos. GPT‑4.1 le ayuda a analizar la imagen, comprender la disposición y decidir si constituye una infracción de la política.
El agente de divulgación de políticas comprueba que los anuncios o las páginas de destino incluyan el texto obligatorio, como avisos legales o advertencias de cumplimiento específicas de cada región. GPT‑4.1 extrae las secciones pertinentes, GPT‑5 evalúa el cumplimiento y el agente señala las infracciones.
«Entendemos nuestros agentes como flujos de trabajo diseñados para un fin específico», afirma Graunke. «Algunas tareas requieren un razonamiento profundo y otras necesitan un contexto multimodal. OpenAI es la única plataforma que ofrece un rendimiento fiable en ambos casos».
Las decisiones sobre políticas suelen depender de distinciones sutiles. Pensemos en un marketplace que exige a los vendedores incluir un aviso legal para productos de bienestar, con requisitos que varían según las afirmaciones del producto y las normas regionales. Los proveedores tradicionales usan palabras clave o conjuntos de reglas rígidos, lo que puede pasar por alto las valoraciones más profundas que estas decisiones requieren y da lugar a una aplicación incorrecta o inexistente.
El agente de divulgación de políticas de SafetyKit consulta primero las políticas de la biblioteca interna de SafetyKit y, a continuación, GPT‑5 evalúa el contenido: ¿menciona tratamiento o prevención? ¿Se vende en una región donde la divulgación es obligatoria? Y, si es así, ¿se incluye realmente el texto obligatorio en el anuncio? Si algo no cumple lo esperado, GPT‑5 devuelve un resultado estructurado que el agente utiliza para señalar el problema.
«La potencia de GPT‑5 reside en la precisión con la que puede razonar cuando se basa en políticas reales», señala Graunke. «Nos permite tomar decisiones precisas y justificables incluso en los casos límite en los que otros sistemas fallan».
Convierte cada lanzamiento de modelo en un éxito de producto
SafetyKit somete cada nuevo modelo de OpenAI a pruebas comparativas frente a sus casos más difíciles y, a menudo, implementa los de mejor rendimiento ese mismo día. Las rigurosas evaluaciones internas permiten al equipo identificar rápidamente cómo pueden los nuevos modelos mejorar el rendimiento e integrarse a la perfección en su infraestructura principal.
Cuando se lanzó OpenAI o3, SafetyKit lo utilizó para mejorar el rendimiento en casos límite en áreas clave de políticas. Después llegó GPT‑5 y, en cuestión de días, se implementó en sus agentes más exigentes, con mejoras de más de 10 puntos en las pruebas de referencia de sus tareas de visión más difíciles.
«OpenAI avanza a toda velocidad y hemos diseñado nuestro sistema para seguirle el ritmo. Cada nueva versión nos da una ventaja operativa: nos abre las puertas a nuevas capacidades y ámbitos que antes no podíamos abarcar, y aumenta la cobertura y la precisión que ofrecemos a los clientes».
SafetyKit también retroalimenta el ecosistema con mejoras: comparte directamente con OpenAI resultados de evaluaciones, fallos en casos límite e información específica sobre políticas para ayudar a dar forma al rendimiento futuro de los modelos en cargas de trabajo críticas para la seguridad.
Multiplica el crecimiento de clientes y volumen con la mejor pila de OpenAI
La arquitectura de SafetyKit aplica las políticas a gran escala y ofrece velocidad, precisión y una cobertura de riesgos completa. Entre bastidores, ahora gestiona más de 16 000 millones de tokens al día, frente a los 200 millones de hace seis meses, y analiza más contenido sin sacrificar la precisión.
En ese mismo periodo, SafetyKit se ha expandido al riesgo en pagos, el fraude, la lucha contra la explotación infantil, la prevención del blanqueo de capitales y nuevos clientes, con cientos de millones de usuarios finales bajo su protección. Esta base permite a los clientes responder con rapidez y confianza a los riesgos emergentes.
«Hemos creado un ciclo en el que cada lanzamiento de OpenAI refuerza directamente nuestras capacidades», afirma Graunke. «Por eso el sistema mejora continuamente y se mantiene siempre por delante de los riesgos en constante evolución».
Resultados de un vistazo
- Más del 95% de precisión al revisar el 100% del contenido de los clientes
- 16 000 millones de tokens procesados al día, frente a los 200 millones de hace seis meses
- Más de 10 puntos de mejora en las pruebas de referencia en las tareas de visión más difíciles


