Saltar para o conteúdo principal
OpenAI

28 de outubro de 2025

A defesa de IA da Doppel trava ataques antes de se espalharem

Com o GPT‑5 e reinforcement fine-tuning (RFT), Doppel reduziu o trabalho dos analistas em 80% e agora mitiga ameaças em minutos, em vez de horas.

Logótipo da Doppel a branco, centrado num fundo metálico escuro texturizado, com linhas curvas e rebites.
Dimensão da empresa: Startup
Região: América do Norte
Setor: Tecnologia
Produtos: API

Resultados

80%

redução do trabalho dos analistas

Resultados

3x

capacidade de tratamento de ameaças

A carregar…

Um único site de impersonação pode surgir, visar milhares de utilizadores e desaparecer em menos de uma hora. Isso é mais do que tempo suficiente para um atacante causar danos reais. E, com ferramentas generativas, podem criar centenas de outros semelhantes.

Doppel foi criada para defender organizações de deepfakes e de impersonações online, mas depressa percebeu que a IA significava que as ameaças podiam escalar infinitamente. Os atacantes deixaram de precisar de criar burlas à mão; podiam gerar variantes infinitas de kits de phishing, domínios falsificados e contas de impersonação em segundos.

«Os danos de ataques de phishing podem ocorrer em poucos minutos, à medida que se propagam pelas redes sociais e por canais de mensagens. A capacidade de gerar persuasão infinita a um custo quase nulo mudou tudo.»
—Rahul Madduluri, Cofundador e CTO, Doppel

Dentro do lançamento

Para se manter à frente, Doppel desenvolveu um novo tipo de sistema de defesa contra engenharia social baseado nos modelos OpenAI GPT‑5 e o4-mini. A plataforma da Doppel deteta, classifica e remove ameaças de forma autónoma, reduzindo o trabalho dos analistas em 80%, triplicando a capacidade de tratamento de ameaças e reduzindo o tempo de resposta de horas para minutos.

Manter-se à frente de ameaças infinitamente mais rápidas

A proteção tradicional contra riscos digitais dependia de pessoas para rever manualmente sites de impersonação, domínios de phishing e perfis e publicações nas redes sociais. Doppel viu esse modelo a falhar quando os atacantes começaram a automatizar, lançando ameaças mais depressa e em mais superfícies do que as pessoas conseguiam avaliar.

«O nosso sistema processa um fluxo constante de sinais para identificar as ameaças reais no meio do ruído. Assim que uma ameaça é detetada, há uma janela muito curta para agir antes de os danos acontecerem. Usar IA para automatizar a tomada de decisão é uma das maiores alavancas para a empresa, permitindo-nos combater ataques à escala e velocidade da internet.»
—Rahul Madduluri, Cofundador e CTO, Doppel

Essa velocidade é crítica para os clientes da Doppel, organizações que não se podem dar ao luxo de esperar horas para confirmar uma ameaça. O sistema da Doppel classifica a maioria das ameaças automaticamente, usando modelos da OpenAI para raciocínio e um ciclo de feedback estruturado conhecido como reinforcement fine-tuning (RFT) para melhorar o modelo ao longo do tempo. No RFT, o feedback humano é usado como exemplos classificados, ajudando os modelos a aprender a tomar decisões consistentes e explicáveis por si próprios.

Orquestrar a deteção de ameaças orientada por LLMs

O pipeline orientado por LLMs da Doppel está no centro da sua stack de deteção. Depois de os sinais serem recolhidos e filtrados, o sistema executa uma série de tarefas de raciocínio direcionadas: analisar potenciais ameaças, confirmar a intenção e orientar decisões de classificação. Cada etapa foi concebida para equilibrar velocidade, precisão e consistência, mantendo os analistas focados nos casos-limite que exigem julgamento humano.

Um fluxograma mostra um pipeline de deteção de ameaças com LLMs, passando da recolha e filtragem, pela extração de características e classificação, até à verificação final e aos sistemas de remoção. Modelos como o GPT‑5 e o o4-mini são usados em etapas-chave.

Eis como funciona:

  • Filtragem de sinais e extração de características: os sistemas da Doppel processam milhões de domínios, URLs e contas diariamente. Uma combinação de heurísticas e do modelo OpenAI o4-mini filtra o ruído e extrai características estruturadas para orientar as avaliações do modelo nas etapas seguintes.
  • Confirmação paralela de ameaças: cada sinal é passado por vários prompts do GPT‑5 concebidos especificamente para diferentes tipos de análise de ameaças. Estes prompts avaliam fatores como risco de impersonação, uso indevido da marca ou padrões de engenharia social.
  • Classificação de ameaças: a versão RFT do o4-mini sintetiza as confirmações anteriores para atribuir uma etiqueta estruturada — malicioso, benigno ou ambíguo — com consistência ao nível de produção.
  • Verificação final: uma segunda passagem do GPT‑5 valida a decisão do modelo e gera uma justificação em linguagem natural. Se a confiança exceder o limiar, o sistema inicia automaticamente a aplicação de medidas.
  • Revisão humana: resultados com baixa confiança ou conflituantes são encaminhados para analistas humanos. As suas decisões são registadas e reintroduzidas no ciclo de RFT para melhorar continuamente a consistência do modelo.

Treinar modelos com reinforcement fine-tuning (RFT)

A Doppel já tinha visto ganhos significativos com o seu pipeline de deteção reforçado por LLMs, mas, quando se tratava de casos em que a mesma ameaça podia ser avaliada de forma diferente consoante o analista, a consistência tornou-se o fator limitativo.

«Uma vantagem real do RFT é tornar as decisões desse modelo mais consistentes.»
—Kiran Arimilli, Engenheiro de software, Doppel

Para criar essa consistência, a Doppel aplicou RFT usando os seus próprios dados dos analistas como fonte de feedback. Cada decisão de classificar um domínio como malicioso, benigno ou ambíguo tornou-se um exemplo pontuado. Esses exemplos rotulados treinaram o modelo para replicar o juízo de especialistas, mesmo em casos-limite ambíguos.

Um diagrama circular mostra o fluxo de classificação de ameaças da Doppel: LLMs em produção tomam decisões → revisores humanos fazem correções → o treino do modelo atualiza os modelos → a implementação envia modelos atualizados para produção.

Em estreita colaboração com a equipa de engenharia aplicada da OpenAI, a Doppel concebeu funções de avaliação (graders) que mediam não só a precisão, mas também a qualidade da explicação, recompensando modelos que raciocinavam com clareza, e não apenas corretamente. Ao transformar o feedback dos analistas em dados de treino estruturados, a Doppel ajudou a mostrar como o RFT pode tornar a deteção automatizada mais consistente e fiável.

Concretizar a confiança através da transparência

A afinação de hiperparâmetros e as evals iterativas aproximaram o modelo de uma consistência ao nível humano. Mas, para a Doppel, completar o último quilómetro da automação também significava tornar as decisões imediatamente compreensíveis.

Cada remoção automática inclui agora uma justificação gerada por IA que explica por que motivo uma ameaça foi removida, dando aos clientes uma visão imediata do porquê da ação tomada — algo que antes exigia intervenção de um analista.

Uma vista do painel mostra um alerta de remoção para o domínio «d0ppel.click», assinalado por se fazer passar pela Doppel. O resumo menciona phishing e roubo de credenciais, com uma linha temporal à direita a mostrar atualizações de estado desde a criação até à resolução em 10 de outubro de 2025.

Essa visibilidade reforça a confiança, que é um fator crítico para os utilizadores da Doppel. Ver não apenas que ação foi tomada, mas porquê, dá às equipas a confiança para responder rapidamente e o contexto para explicar essas decisões internamente ou às partes interessadas.

Resultados em resumo

  • Redução da carga de trabalho dos analistas em 80%
  • Redução do tempo de resposta a ameaças de horas para minutos
  • Capacidade de tratamento de ameaças triplicada
  • Maioria das ameaças classificada automaticamente

O que se segue

Depois de atingir uma automação quase completa para domínios de phishing e impersonação, a Doppel está agora a aplicar a mesma estrutura orientada por modelos a outros canais com elevada variabilidade.

«Os domínios são provavelmente o canal mais difícil com que lidamos», disse Madduluri. «Os sinais são confusos, o conteúdo muda constantemente e as ameaças evoluem depressa em várias superfícies em simultâneo. Se conseguirmos automatizar isto de ponta a ponta, conseguimos fazê-lo para qualquer coisa: redes sociais, anúncios pagos, o que quiser.»

Os próximos marcos incluem aumentar o seu conjunto de dados de RFT numa ordem de grandeza, experimentar novas estratégias de avaliação e usar o GPT‑5 para extração de características a montante. Estas mudanças permitirão à Doppel consolidar etapas do pipeline e raciocinar sobre indicadores de ameaça mais complexos mais cedo no processo.

A cada iteração, a Doppel aproxima-se de um sistema que defende o que é real em todas as superfícies onde a confiança está sob ataque.