A defesa de IA da Doppel trava ataques antes de se espalharem
Com o GPT‑5 e reinforcement fine-tuning (RFT), Doppel reduziu o trabalho dos analistas em 80% e agora mitiga ameaças em minutos, em vez de horas.

Resultados
80%
redução do trabalho dos analistas
Resultados
3x
capacidade de tratamento de ameaças
Um único site de impersonação pode surgir, visar milhares de utilizadores e desaparecer em menos de uma hora. Isso é mais do que tempo suficiente para um atacante causar danos reais. E, com ferramentas generativas, podem criar centenas de outros semelhantes.
Doppel foi criada para defender organizações de deepfakes e de impersonações online, mas depressa percebeu que a IA significava que as ameaças podiam escalar infinitamente. Os atacantes deixaram de precisar de criar burlas à mão; podiam gerar variantes infinitas de kits de phishing, domínios falsificados e contas de impersonação em segundos.
«Os danos de ataques de phishing podem ocorrer em poucos minutos, à medida que se propagam pelas redes sociais e por canais de mensagens. A capacidade de gerar persuasão infinita a um custo quase nulo mudou tudo.»
Dentro do lançamento
Para se manter à frente, Doppel desenvolveu um novo tipo de sistema de defesa contra engenharia social baseado nos modelos OpenAI GPT‑5 e o4-mini. A plataforma da Doppel deteta, classifica e remove ameaças de forma autónoma, reduzindo o trabalho dos analistas em 80%, triplicando a capacidade de tratamento de ameaças e reduzindo o tempo de resposta de horas para minutos.
Manter-se à frente de ameaças infinitamente mais rápidas
A proteção tradicional contra riscos digitais dependia de pessoas para rever manualmente sites de impersonação, domínios de phishing e perfis e publicações nas redes sociais. Doppel viu esse modelo a falhar quando os atacantes começaram a automatizar, lançando ameaças mais depressa e em mais superfícies do que as pessoas conseguiam avaliar.
«O nosso sistema processa um fluxo constante de sinais para identificar as ameaças reais no meio do ruído. Assim que uma ameaça é detetada, há uma janela muito curta para agir antes de os danos acontecerem. Usar IA para automatizar a tomada de decisão é uma das maiores alavancas para a empresa, permitindo-nos combater ataques à escala e velocidade da internet.»
Essa velocidade é crítica para os clientes da Doppel, organizações que não se podem dar ao luxo de esperar horas para confirmar uma ameaça. O sistema da Doppel classifica a maioria das ameaças automaticamente, usando modelos da OpenAI para raciocínio e um ciclo de feedback estruturado conhecido como reinforcement fine-tuning (RFT) para melhorar o modelo ao longo do tempo. No RFT, o feedback humano é usado como exemplos classificados, ajudando os modelos a aprender a tomar decisões consistentes e explicáveis por si próprios.
Orquestrar a deteção de ameaças orientada por LLMs
O pipeline orientado por LLMs da Doppel está no centro da sua stack de deteção. Depois de os sinais serem recolhidos e filtrados, o sistema executa uma série de tarefas de raciocínio direcionadas: analisar potenciais ameaças, confirmar a intenção e orientar decisões de classificação. Cada etapa foi concebida para equilibrar velocidade, precisão e consistência, mantendo os analistas focados nos casos-limite que exigem julgamento humano.

Eis como funciona:
- Filtragem de sinais e extração de características: os sistemas da Doppel processam milhões de domínios, URLs e contas diariamente. Uma combinação de heurísticas e do modelo OpenAI o4-mini filtra o ruído e extrai características estruturadas para orientar as avaliações do modelo nas etapas seguintes.
- Confirmação paralela de ameaças: cada sinal é passado por vários prompts do GPT‑5 concebidos especificamente para diferentes tipos de análise de ameaças. Estes prompts avaliam fatores como risco de impersonação, uso indevido da marca ou padrões de engenharia social.
- Classificação de ameaças: a versão RFT do o4-mini sintetiza as confirmações anteriores para atribuir uma etiqueta estruturada — malicioso, benigno ou ambíguo — com consistência ao nível de produção.
- Verificação final: uma segunda passagem do GPT‑5 valida a decisão do modelo e gera uma justificação em linguagem natural. Se a confiança exceder o limiar, o sistema inicia automaticamente a aplicação de medidas.
- Revisão humana: resultados com baixa confiança ou conflituantes são encaminhados para analistas humanos. As suas decisões são registadas e reintroduzidas no ciclo de RFT para melhorar continuamente a consistência do modelo.
Treinar modelos com reinforcement fine-tuning (RFT)
A Doppel já tinha visto ganhos significativos com o seu pipeline de deteção reforçado por LLMs, mas, quando se tratava de casos em que a mesma ameaça podia ser avaliada de forma diferente consoante o analista, a consistência tornou-se o fator limitativo.
«Uma vantagem real do RFT é tornar as decisões desse modelo mais consistentes.»
Para criar essa consistência, a Doppel aplicou RFT usando os seus próprios dados dos analistas como fonte de feedback. Cada decisão de classificar um domínio como malicioso, benigno ou ambíguo tornou-se um exemplo pontuado. Esses exemplos rotulados treinaram o modelo para replicar o juízo de especialistas, mesmo em casos-limite ambíguos.

Em estreita colaboração com a equipa de engenharia aplicada da OpenAI, a Doppel concebeu funções de avaliação (graders) que mediam não só a precisão, mas também a qualidade da explicação, recompensando modelos que raciocinavam com clareza, e não apenas corretamente. Ao transformar o feedback dos analistas em dados de treino estruturados, a Doppel ajudou a mostrar como o RFT pode tornar a deteção automatizada mais consistente e fiável.
Concretizar a confiança através da transparência
A afinação de hiperparâmetros e as evals iterativas aproximaram o modelo de uma consistência ao nível humano. Mas, para a Doppel, completar o último quilómetro da automação também significava tornar as decisões imediatamente compreensíveis.
Cada remoção automática inclui agora uma justificação gerada por IA que explica por que motivo uma ameaça foi removida, dando aos clientes uma visão imediata do porquê da ação tomada — algo que antes exigia intervenção de um analista.

Essa visibilidade reforça a confiança, que é um fator crítico para os utilizadores da Doppel. Ver não apenas que ação foi tomada, mas porquê, dá às equipas a confiança para responder rapidamente e o contexto para explicar essas decisões internamente ou às partes interessadas.
Resultados em resumo
- Redução da carga de trabalho dos analistas em 80%
- Redução do tempo de resposta a ameaças de horas para minutos
- Capacidade de tratamento de ameaças triplicada
- Maioria das ameaças classificada automaticamente
O que se segue
Depois de atingir uma automação quase completa para domínios de phishing e impersonação, a Doppel está agora a aplicar a mesma estrutura orientada por modelos a outros canais com elevada variabilidade.
«Os domínios são provavelmente o canal mais difícil com que lidamos», disse Madduluri. «Os sinais são confusos, o conteúdo muda constantemente e as ameaças evoluem depressa em várias superfícies em simultâneo. Se conseguirmos automatizar isto de ponta a ponta, conseguimos fazê-lo para qualquer coisa: redes sociais, anúncios pagos, o que quiser.»
Os próximos marcos incluem aumentar o seu conjunto de dados de RFT numa ordem de grandeza, experimentar novas estratégias de avaliação e usar o GPT‑5 para extração de características a montante. Estas mudanças permitirão à Doppel consolidar etapas do pipeline e raciocinar sobre indicadores de ameaça mais complexos mais cedo no processo.
A cada iteração, a Doppel aproxima-se de um sistema que defende o que é real em todas as superfícies onde a confiança está sob ataque.


