La defensa con IA de Doppel frena ataques antes de propagarse
Con GPT‑5 y el ajuste fino por refuerzo (RFT), Doppel redujo un 80 % la carga de trabajo de los analistas y ahora mitiga amenazas en minutos en lugar de horas.

Resultados
80%
flujos de trabajo reducidos para analistas
Resultados
3x
capacidad de gestión de amenazas
Un solo sitio de suplantación puede activarse, atacar a miles de usuarios y desaparecer en menos de una hora. Ese tiempo basta para que un atacante cause daños reales. Y con herramientas generativas, pueden crear cientos más como ese.
El propósito inicial de Doppel era proteger a las organizaciones de deepfakes y suplantaciones de identidad en línea. Al poco tiempo, la empresa advirtió que las amenazas generadas por IA podían escalar indefinidamente. Para los atacantes, ya no es necesario crear estafas manualmente: en cuestión de segundos pueden generar variantes infinitas de kits de phishing, dominios falsificados y cuentas de suplantación de identidad.
«Los daños de los ataques de phishing pueden producirse en cuestión de minutos al propagarse por redes sociales y canales de mensajería. La capacidad de generar persuasión infinita a coste casi nulo lo cambió todo».
Dentro del lanzamiento
Para mantenerse a la vanguardia, Doppel desarrolló un nuevo sistema de defensa frente a los ataques de la ingeniería social basado en los modelos GPT‑5 y o4-mini de OpenAI. La plataforma de Doppel detecta, clasifica y elimina amenazas de forma autónoma, reduce un 80 % la carga de trabajo de los analistas, triplica la capacidad de gestión de amenazas y acorta los tiempos de respuesta de horas a minutos.
Anticiparse a las amenazas cada vez más rápidas
La protección digital tradicional dependía de que personas revisaran manualmente sitios de suplantación, dominios de phishing y perfiles y publicaciones en redes sociales. Doppel vio que ese modelo estaba dejando de funcionar a medida que los atacantes automatizaban los procesos, lanzando amenazas más rápido y en más frentes de los que los humanos podían analizar.
«Nuestro sistema procesa un flujo constante de señales para identificar las amenazas reales entre señales irrelevantes. Una vez detectada la amenaza, hay una ventana muy estrecha para actuar antes de que se produzca el daño. «Usar IA para automatizar la toma de decisiones ha sido una de las mayores claves para la empresa, porque nos permite combatir ataques con la escala y velocidad de internet».
Esa rapidez es clave para los clientes de Doppel, organizaciones que no pueden permitirse esperar horas para confirmar una amenaza. El sistema de Doppel clasifica la mayoría de las amenazas de forma automática, utilizando modelos de OpenAI para el razonamiento y un ciclo de retroalimentación estructurado conocido como ajuste fino por refuerzo (RFT), que mejora el modelo con el tiempo. En el RFT, la evaluación humana se emplea como ejemplos valorados que ayudan a los modelos a aprender a tomar decisiones coherentes y explicables por sí mismos.
Orquestar la detección de amenazas con LLM
El sistema basado en modelos de lenguaje (LLM) de Doppel está en el centro de la estructura de detección. Tras recibir y filtrar las señales, el sistema ejecuta tareas específicas de razonamiento: analizar amenazas potenciales, confirmar intenciones y tomar decisiones de clasificación. Cada etapa tiene por objeto equilibrar la rapidez, la precisión y la coherencia, sin que los analistas descuiden los casos límite que requieren criterio humano.

Así es como funciona:
- Filtrado de señales y extracción de funciones: cada día, los sistemas de Doppel procesan millones de dominios, URL y cuentas. Una combinación de métodos heurísticos y OpenAI o4-mini filtra el ruido y extrae funciones estructuradas que sirven de base para evaluaciones posteriores del modelo.
- Confirmación paralela de amenazas: cada señal pasa por múltiples prompts de GPT‑5 diseñados específicamente para diferentes tipos de análisis de amenazas. Estos prompts evalúan factores como el riesgo de suplantación, el uso indebido de marca o los patrones de ingeniería social.
- Clasificación de amenazas: la versión RFT de o4-mini sintetiza las confirmaciones anteriores para asignar una etiqueta estructurada: maliciosa, benigna o ambigua, con una coherencia apta para producción.
- Verificación final: una segunda evaluación con GPT‑5 valida la decisión del modelo y genera una justificación en lenguaje natural. Si la confianza supera el umbral, el sistema inicia automáticamente las medidas de aplicación.
- Revisión humana: los resultados con baja confianza o contradictorios se remiten a analistas humanos. Sus decisiones se registran y se incorporan al ciclo de RFT para mejorar de forma continua la consistencia del modelo.
Entrenamiento de modelos mediante ajuste fino por refuerzo (RFT)
Doppel ya había observado mejoras significativas con su primer proceso de detección potenciado por LLM. Pero cuando se trataba de casos en los que una misma amenaza podía evaluarse de forma diferente según el analista, la consistencia se convirtió en el factor limitante.
«Uno de los grandes beneficios que aporta la RFT es que hace que las decisiones del modelo sean más consistentes».
Para conseguir esa consistencia, Doppel aplicó el RFT aplicando sus propios datos analíticos como fuente de retroalimentación. Así, cada decisión de clasificar un dominio como malicioso, benigno o dudoso pasó a ser un ejemplo calificado. Con estos ejemplos etiquetados, el modelo aprendió a imitar el criterio de los expertos, incluso en los casos límite más inciertos.

En colaboración con el equipo de ingeniería aplicada de OpenAI, Doppel diseñó funciones de evaluación que medían no solo la precisión, sino también la calidad explicativa, premiando a los modelos que razonaban de forma clara, no solo correcta. Al convertir la opinión de los analistas en datos de entrenamiento estructurados, Doppel demostró cómo la RFT puede hacer que la detección automatizada sea más consistente y fiable.
Consolidar la confianza mediante la transparencia
El ajuste de hiperparámetros y las evaluaciones iterativas acercaron el modelo a una consistencia de nivel humano. Para Doppel, sin embargo, completar la última etapa de la automatización también implicaba hacer que las decisiones fueran comprensibles de inmediato.
Ahora, cada eliminación de contenido de forma automática incluye una justificación generada por IA que explica por qué se eliminó una amenaza, lo que proporciona a los clientes una comprensión inmediata de la medida tomada, algo que antes requería la intervención de un analista.

Esa visibilidad refuerza la confianza, un factor fundamental para los usuarios de Doppel. Ver no solo qué acción se tomó, sino también por qué, da a los equipos la confianza necesaria para responder con rapidez y el contexto necesario para explicar esas decisiones internamente o a las partes interesadas.
Resultados de un vistazo
- Redujo la carga de trabajo de los analistas en un 80 %
- Acortó los tiempos de respuesta ante amenazas de horas a minutos
- Triple capacidad de gestión de amenazas
- La mayoría de las amenazas clasificadas automáticamente
Próximos pasos
Tras automatizar casi por completo la detección y eliminación de phishing y suplantación, Doppel ahora aplica el mismo enfoque basado en modelos en otros canales más variables.
«Los dominios son probablemente el canal más difícil que manejamos», afirma Madduluri. «Las señales son confusas, el contenido cambia constantemente y las amenazas evolucionan rápido en varios frentes a la vez. Si podemos automatizarlo de extremo a extremo, podemos hacerlo con cualquier cosa: redes sociales, anuncios de pago, lo que sea».
Los próximos hitos incluyen multiplicar por diez el volumen del conjunto de datos de la RFT, experimentar con nuevas estrategias de evaluación y usar GPT‑5 para la extracción de características en etapas anteriores. Estos cambios permitirán a Doppel consolidar etapas del proceso y razonar sobre indicadores de amenaza más complejos desde fases más tempranas.
Con cada iteración, Doppel avanza hacia un sistema capaz de proteger lo que es real en todas las superficies donde se pone en juego la confianza.


