Pasar al contenido principal
OpenAI

9 de septiembre de 2025

SafetyKit escala agentes de riesgo con los modelos de OpenAI

Desde la creación de prototipos con versiones preliminares de modelos de visión hasta escalar con GPT‑5, los agentes multimodales de SafetyKit se expanden a nuevos dominios y mejoran la precisión.

Logotipo de SafetyKit en blanco, centrado sobre un fondo oscuro con textura vertical y un degradado cálido de luz naranja, amarilla y verde azulado.
Tamaño de la empresa: Startup
Región: Norteamérica
Sector: Tecnología, Servicios
Productos: API

Resultados

95%+

de precisión al revisar el 100% del contenido de los clientes (evaluaciones de SafetyKit)

Resultados

16B

token procesados diariamente, frente a 200 millones seis meses atrás.

Resultados

10+

mejoras de rendimiento puntual en las tareas de visión más complejas con GPT-5

Cargando...

SafetyKit(se abre en una nueva ventana) desarrolla agentes de IA multimodales para ayudar a marketplaces, plataformas de pago y fintechs a detectar y actuar frente a fraudes y actividades prohibidas en texto, imágenes, transacciones financieras, publicaciones de productos y más. Los avances recientes en el razonamiento del modelo y la comprensión multimodal ahora hacen que esto sea más eficaz, estableciendo un nuevo estándar para las operaciones de riesgo, cumplimiento y seguridad.

Los agentes de SafetyKit aprovechan GPT‑5, GPT‑4.1, investigación profunda y el agente informático (CUA) para revisar el 100% del contenido de los clientes con más del 95% de precisión, según las evaluaciones de SafetyKit. Pueden ayudar a las plataformas a proteger a los usuarios, prevenir fraudes, evitar multas regulatorias y aplicar políticas complejas que los sistemas heredados podrían pasar por alto, como reglas específicas de cada región, números de teléfono incrustados en imágenes de estafas o contenido explícito. La automatización también puede proteger a los moderadores humanos de la exposición a material ofensivo y les permite ocuparse de decisiones políticas matizadas.

“OpenAI nos da acceso a los modelos de razonamiento y multimodales más avanzados del mercado. Nos permite adaptarnos rápidamente, lanzar nuevos agentes más rápido y manejar tipos de contenido que otras soluciones ni siquiera pueden analizar“.
David Graunke, fundador y director ejecutivo de SafetyKit

Diseña agentes según lo que exija la tarea y luego elige el modelo adecuado

Los agentes de SafetyKit están diseñados para abordar una categoría de riesgo específica, desde estafas hasta productos ilegales. Cada pieza de contenido se dirige al agente que mejor se adapta a esa infracción, utilizando el modelo de OpenAI óptimo:

  • GPT‑5 aplica razonamiento multimodal en texto, imágenes e interfaces de usuario para revelar riesgos ocultos y respaldar una toma de decisiones precisa y estructurada.
  • GPT‑4.1 sigue instrucciones detalladas de políticas de contenido y gestiona de manera eficiente flujos de trabajo de moderación de gran volumen de forma confiable.
  • El ajuste fino por refuerzo (RFT) mejora la recuperación y la precisión más allá de los modelos predeterminados, alcanzando un rendimiento de vanguardia con políticas de seguridad complejas.
  • La investigación profunda integra las reseñas y verificaciones de comercios en tiempo real.
  • El agente informático (CUA) automatiza tareas complejas de políticas, reduciendo la dependencia de revisiones manuales costosas.

Este enfoque de emparejamiento de modelos permite a SafetyKit ampliar la revisión de contenido en distintas modalidades con más matices y precisión que las soluciones heredadas.

El agente de detección de estafas, por ejemplo, va más allá de solo escanear texto. Analiza elementos visuales, como códigos QR o números de teléfono, integrados en imágenes de productos. GPT‑4.1 le ayuda a analizar la imagen, comprender la disposición y decidir si constituye una infracción de las políticas.

El agente de Divulgación de Políticas revisa listados o páginas de destino para verificar el lenguaje requerido, como avisos legales o advertencias de cumplimiento específicas de cada región. GPT‑4.1 extrae las secciones relevantes, GPT‑5 evalúa el cumplimiento y el agente señala infracciones.

“Consideramos a nuestros agentes como flujos de trabajo diseñados para propósitos específicos”, afirma Graunke. “Algunas tareas requieren razonamiento profundo, mientras que otras necesitan contexto multimodal. OpenAI es la única plataforma que ofrece un rendimiento confiable en ambos casos.

Gráfico de líneas y barras etiquetado como “SafetyKit” sobre un fondo claro, que muestra tendencias y comparaciones de datos en múltiples categorías.

Aprovecha GPT‑5 para navegar por las zonas grises y tomar decisiones críticas.

Las decisiones de políticas suelen depender de distinciones sutiles. Por ejemplo, un mercado que exige a los vendedores incluir un aviso legal para productos de bienestar, con requisitos que varían según las afirmaciones del producto y las normas regionales. Los proveedores heredados usan disparadores de palabras clave o reglas rígidas, que pueden pasar por alto las decisiones más profundas que estas decisiones pueden requerir, lo que puede llevar a una aplicación incumplida o incorrecta.

El agente de divulgación de políticas de SafetyKit primero consulta las políticas de la biblioteca interna de SafetyKit y luego GPT‑5 evalúa el contenido: ¿menciona tratamiento o prevención? ¿Se está vendiendo en una región donde la divulgación es obligatoria? Y, de ser así, ¿el idioma requerido realmente está incluido en la lista? Si algo no se cumple, GPT‑5 devuelve resultados estructurados que el agente usa para señalar el problema.

“La potencia de GPT‑5 radica en la precisión con la que puede razonar cuando se basa en políticas reales”, señala Graunke. “Nos permite tomar decisiones precisas y justificables incluso en los casos extremos en los que otros sistemas fallan”.

Convierte cada lanzamiento de modelo en un éxito de producto

SafetyKit compara cada nuevo modelo de OpenAI con sus casos más difíciles y, a menudo, implementa los de mejor rendimiento ese mismo día. Las rigurosas evaluaciones internas permiten al equipo identificar rápidamente cómo los nuevos modelos pueden mejorar el rendimiento e integrarse sin problemas a su infraestructura principal.

Cuando se lanzó OpenAI o3, SafetyKit lo utilizó para mejorar el rendimiento en casos límite en áreas clave de políticas. GPT‑5 vino después y, en cuestión de días, se implementó en sus agentes más exigentes, mejorando los puntajes en pruebas de referencia en más de 10 puntos en sus tareas de visión más difíciles.

“OpenAI avanza rápido, y hemos diseñado nuestro sistema para seguirle el ritmo. Cada nuevo lanzamiento nos da una ventaja operativa: desbloquea nuevas capacidades y dominios que antes no admitíamos, y aumenta la cobertura y la precisión que ofrecemos a los clientes”.
—David Graunke, fundador y director ejecutivo de SafetyKit

SafetyKit también retroalimenta mejoras al ecosistema, compartiendo resultados de evaluaciones, fallas en casos límite y hallazgos específicos sobre políticas directamente con OpenAI para ayudar a dar forma al rendimiento futuro de los modelos en cargas de trabajo críticas para la seguridad.

Escala el crecimiento de clientes y volumen con el mejor stack de OpenAI

La arquitectura de SafetyKit aplica políticas a escala, proporcionando rapidez, precisión y una cobertura integral de riesgos. Detrás de escena, ahora procesa más de 16 mil millones de tokens al día, frente a los 200 millones de hace seis meses, y analiza más contenido sin sacrificar la precisión.

En ese mismo período, SafetyKit se ha expandido a riesgo en pagos, fraude, prevención de la explotación infantil, prevención del lavado de dinero y nuevos clientes con cientos de millones de usuarios finales bajo la protección de SafetyKit. Esta base permite a los clientes responder con rapidez y confianza a los riesgos emergentes.

“Creamos un ciclo en el que cada lanzamiento de OpenAI fortalece directamente nuestras capacidades”, dice Graunke. “Por eso, el sistema mejora continuamente, manteniéndose siempre por delante de los riesgos cambiantes”.

Resultados de un vistazo

  • Más de 95% de precisión revisando el 100% del contenido del cliente.
  • 16 mil millones de tokens procesados al día, frente a 200 millones seis meses atrás.
  • Más de 10 puntos de mejora en pruebas de referencia de las tareas de visión más complejas.

Únete a la nueva era del trabajo

Más de un millón de empresas en todo el mundo logran resultados significativos con OpenAI.