Pasar al contenido principal
OpenAI

28 de octubre de 2025

La defensa con IA de Doppel frena ataques antes de propagarse

Gracias a GPT‑5 y al ajuste fino por refuerzo (RFT), Doppel reduce las cargas de trabajo de los analistas en un 80 % y mitiga amenazas en minutos en lugar de horas.

Logotipo de Doppel en blanco, centrado sobre un fondo metálico oscuro con textura, con líneas curvas y remaches.
Tamaño de la empresa: Startup
Región: Norteamérica
Sector: Tecnología
Productos: API

Resultados

80%

flujos de trabajo reducidos para analistas

Resultados

3x

capacidad para manejar amenazas

Cargando...

Un sitio cualquiera de suplantación de identidad puede activarse, alcanzar a miles de usuarios y esfumarse en menos de una hora. Es más tiempo del que un atacante necesita para causar daños graves. Y si cuenta con herramientas generativas, puede crear cientos de variantes similares.

El propósito inicial de Doppel era proteger a las organizaciones de deepfakes y suplantaciones de identidad en línea. Al poco tiempo, la empresa advirtió que las amenazas generadas por IA podían escalar indefinidamente. Para los atacantes, ya no es necesario crear estafas manualmente: en cuestión de segundos pueden generar infinitas variantes de kits de phishing, dominios falsificados y cuentas de suplantación de identidad.

“El daño de los ataques de phishing puede ocurrir en cuestión de minutos, porque se propagan muy rápido por redes sociales y canales de mensajería. La capacidad de generar mensajes persuasivos a escala y a un costo prácticamente nulo cambió todo”.
— Rahul Madduluri, cofundador y director de tecnología de Doppel

Dentro del lanzamiento

Para mantenerse a la vanguardia, Doppel desarrolló un sistema de defensa contra ataques de ingeniería social basado en los modelos GPT‑5 y o4-mini de OpenAI. Su plataforma detecta, clasifica y elimina amenazas de forma autónoma, reduce la carga de los analistas en un 80 %, triplica su capacidad para gestionar amenazas y acorta los tiempos de respuesta de horas a minutos.

Un paso adelante de amenazas infinitamente más rápidas

La forma tradicional de protección contra riesgos digitales dependía de la revisión manual de sitios de suplantación de identidad y dominios de phishing, así como de perfiles y publicaciones en redes sociales. Cuando los atacantes empezaron a automatizar sus acciones, lanzando amenazas más rápidamente y en más áreas de las que los humanos podían evaluar, Doppel percibió que ese modelo tenía los días contados.

“Nuestro sistema analiza un flujo constante de señales para discriminar, entre el ruido, cuáles son las amenazas reales. Una vez que se detecta una amenaza, hay muy poco tiempo para actuar antes de que se produzca el daño. El uso de la IA para automatizar la toma de decisiones es uno de los grandes avances de la empresa, ya que nos permite combatir los ataques a la escala y velocidad de Internet”.
— Rahul Madduluri, cofundador y director de tecnología de Doppel

Los clientes de Doppel son organizaciones que no pueden permitirse esperar horas para confirmar una amenaza. Para ellos, la velocidad es fundamental. El sistema de Doppel se encarga de clasificar automáticamente la mayor parte de las amenazas. Para ello, usa el razonamiento de los modelos de OpenAI y un ciclo de retroalimentación estructurado, conocido como ajuste fino por refuerzo (RFT), que perfecciona el modelo con el tiempo. El ajuste fino por refuerzo toma los comentarios humanos como ejemplos calificados. Esto ayuda a los modelos a aprender a tomar decisiones coherentes y explicables por sí mismos.

Organizar la detección de amenazas basada en LLM

En la plataforma de detección de Doppel, el proceso basado en LLM ocupa una posición central. Tras recibir y filtrar las señales, el sistema ejecuta tareas específicas de razonamiento: analizar amenazas potenciales, confirmar intenciones y tomar decisiones de clasificación. Cada etapa tiene por objeto equilibrar la rapidez, la precisión y la coherencia, sin que los analistas descuiden los casos límite que requieren criterio humano.

Un diagrama muestra un flujo de procesos para la detección de amenazas mediante LLMs, desde la recolección y el filtrado, pasando por la extracción de características y la clasificación, hasta la verificación final y los sistemas de remoción. Modelos como GPT-5 y o4-mini se utilizan en etapas clave.

Así es como funciona:

  • Filtrado de señales y extracción de funciones: cada día, los sistemas de Doppel procesan millones de dominios, URL y cuentas. Una combinación de métodos heurísticos y OpenAI o4-mini filtra el ruido y extrae funciones estructuradas para alimentar evaluaciones posteriores del modelo.
  • Confirmación paralela de amenazas: cada señal pasa por múltiples prompts de GPT‑5 diseñados específicamente para diferentes tipos de análisis de amenazas. Estos prompts evalúan factores como el riesgo de suplantación de identidad, el uso indebido de una marca o los patrones de ingeniería social.
  • Clasificación de amenazas: la versión del RFT de o4-mini sintetiza las confirmaciones anteriores para asignar una etiqueta estructurada, que puede ser maliciosa, benigna o ambigua, con una consistencia de calidad de producción.
  • Verificación final: una segunda pasada de GPT‑5 valida la decisión del modelo y genera una justificación en lenguaje natural. Si la confianza sobrepasa el umbral, el sistema inicia la ejecución automática de las medidas necesarias.
  • Revisión humana: los resultados poco confiables o contradictorios se remiten a analistas humanos. Sus decisiones se registran y se introducen de nuevo en el bucle de RFT para mejorar continuamente la consistencia del modelo.

Entrenamiento de modelos con ajuste fino por refuerzo (RFT)

El proceso original de detección mejorado con LLM de Doppel ya ofrecía resultados muy positivos, pero cuando se trataba de casos en los que la misma amenaza podía evaluarse de forma diferente dependiendo del analista, la consistencia pasaba a ser un factor determinante.

"Un beneficio tangible del ajuste fino de refuerzo es que las decisiones de los modelos son más consistentes”.
— Kiran Arimilli, ingeniero de software en Doppel

Para conseguir esa consistencia, Doppel aplicó el RFT aplicando sus propios datos analíticos como fuente de retroalimentación. Así, cada decisión de clasificar un dominio como malicioso, benigno o dudoso pasó a ser un ejemplo calificado. Con estos ejemplos etiquetados, el modelo aprendió a imitar el criterio de los expertos, incluso en los casos límite más inciertos.

Un diagrama circular muestra el flujo de trabajo de clasificación de amenazas de Doppel: los LLM en producción toman decisiones → los revisores humanos hacen correcciones → el entrenamiento actualiza el modelo → el despliegue lo envía a producción.

Junto con el equipo de ingeniería aplicada de OpenAI, Doppel diseñó funciones de calificación que evaluaban no solo la precisión, sino también la calidad explicativa, dando prioridad a los modelos que razonaban correctamente y con claridad. Así, al convertir los comentarios de los analistas en datos de entrenamiento estructurados, Doppel contribuyó a demostrar el modo en que el ajuste fino de refuerzo puede hacer que la detección automatizada resulte más consistente y confiable.

La transparencia construye confianza

El ajuste de hiperparámetros y las evaluaciones iterativas acercaron el modelo a un nivel de consistencia similar al humano. Sin embargo, para Doppel, completar la última fase de la automatización también implicaba lograr que las decisiones fueran comprensibles de inmediato.

Cada eliminación automatizada de amenazas incluye una explicación generada por IA con su justificación, lo que permite a los clientes entender de inmediato por qué se tomó la medida, algo que antes requería la intervención de un analista.

Una vista del panel muestra una alerta de eliminación de contenido para el dominio “d0ppel.click,” marcado por suplantar a Doppel. El resumen menciona casos de phishing y robo de credenciales, con una línea de tiempo a la derecha que muestra las actualizaciones de estado desde la creación hasta su resolución, el 10 de octubre de 2025.

Esa visibilidad incrementa la confianza, algo fundamental para los usuarios de Doppel. Conocer las medidas que se han tomado y los motivos para hacerlo proporciona a los equipos la confianza necesaria para responder rápidamente y el contexto para explicar las decisiones tanto internamente como a las partes interesadas.

Resultados de un vistazo

  • Redujo la carga de trabajo de los analistas en un 80 %
  • Redujo los tiempos de respuesta ante amenazas de horas a minutos
  • Capacidad triplicada para manejar amenazas
  • La mayoría de las amenazas se clasifican automáticamente

¿Qué sigue?

Tras automatizar casi por completo la detección y eliminación de phishing y suplantación, Doppel ahora aplica el mismo enfoque basado en modelos en otros canales más variables.

Según Madduluri, “Los dominios son probablemente el canal más difícil de manejar". Las señales son caóticas, el contenido cambia constantemente y las amenazas evolucionan velozmente en muchas superficies a la vez. Si podemos automatizar ese proceso de principio a fin, lo podremos hacer en cualquier ámbito: redes sociales, anuncios pagados y mucho más”.

Los próximos hitos incluyen ampliar el conjunto de datos de RFT en un orden de magnitud, experimentar con nuevas estrategias de calificación y utilizar GPT‑5 para la extracción temprana de funciones. Gracias a estos cambios, Doppel podrá consolidar las etapas del proceso y evaluar de forma más temprana los indicadores de amenazas más complejos.

En cada iteración, Doppel construye un sistema que protege lo auténtico allí donde la confianza se ve amenazada.