A SafetyKit escala agentes de risco com modelos líderes da OpenAI
Do protótipo com prévias de modelos de visão ao ganho de escala com o GPT‑5, os agentes multimodais da SafetyKit avançam para novos domínios e aumentam a precisão.

Resultados
95%+
Precisão ao revisar 100% do conteúdo dos clientes (avaliações da SafetyKit)
Resultados
16B
Tokens processados por dia, ante 200M há seis meses
Resultados
10+
Pontos de ganho de desempenho nas tarefas visuais mais difíceis com o GPT-5
A SafetyKit(abre em uma nova janela) cria agentes de IA multimodais para ajudar marketplaces, plataformas de pagamento e fintechs a detectar e agir contra fraude e atividades proibidas em textos, imagens, transações financeiras, anúncios de produtos e muito mais. Avanços recentes em raciocínio de modelos e compreensão multimodal tornam isso ainda mais eficaz, elevando o padrão de operações de risco, conformidade e segurança.
Os agentes da SafetyKit usam GPT‑5, GPT‑4.1, pesquisa aprofundada e o Computer Using Agent (CUA) para revisar 100% do conteúdo dos clientes com mais de 95% de precisão, com base nas avaliações da SafetyKit. Eles ajudam plataformas a proteger usuários, prevenir fraudes, evitar multas regulatórias e aplicar políticas complexas que sistemas legados podem deixar passar, como regras específicas por região, números de telefone embutidos em imagens de golpe ou conteúdo explícito. A automação também pode proteger moderadores humanos da exposição a material ofensivo e libera tempo para lidar com decisões de política mais nuanceadas.
"A OpenAI nos dá acesso aos modelos de raciocínio e multimodais mais avançados do mercado. Isso nos permite nos adaptar rápido, lançar novos agentes mais depressa e lidar com tipos de conteúdo que outras soluções nem conseguem analisar."
Projete agentes conforme a tarefa exige e, depois, escolha o modelo certo
Cada agente da SafetyKit é criado para lidar com uma categoria específica de risco, de golpes a produtos ilegais. Cada conteúdo é roteado para o agente mais adequado à violação, usando o modelo ideal da OpenAI:
- O GPT‑5 aplica raciocínio multimodal em texto, imagens e UI para revelar riscos ocultos e apoiar decisões em camadas, com precisão
- O GPT‑4.1 segue de forma confiável instruções detalhadas de políticas de conteúdo e gerencia com eficiência fluxos de moderação de alto volume
- O fine-tuning por reforço (RFT) aumenta recall e precisão além dos modelos padrão, alcançando desempenho de ponta com políticas de segurança complexas
- A pesquisa aprofundada integra investigação online em tempo real em avaliações e verificações de lojistas
- O Computer Using Agent (CUA) automatiza tarefas complexas de política, reduzindo a dependência de revisões manuais caras
Essa abordagem de combinar tarefa e modelo permite à SafetyKit escalar a revisão de conteúdo entre modalidades com mais nuance e precisão do que soluções legadas conseguem.
O agente de Detecção de Golpes, por exemplo, vai além de apenas varrer texto. Ele analisa visuais como QR codes ou números de telefone embutidos em imagens de produtos. O GPT‑4.1 ajuda a interpretar a imagem, entender o layout e decidir se há violação de política.
O agente de Divulgação de Políticas verifica anúncios ou landing pages em busca da linguagem obrigatória, como avisos legais ou alertas de conformidade específicos por região. O GPT‑4.1 extrai trechos relevantes, o GPT‑5 avalia a conformidade, e o agente sinaliza violações.
"Encaramos nossos agentes como fluxos de trabalho feitos sob medida", diz Graunke. "Algumas tarefas exigem raciocínio profundo; outras, contexto multimodal. A OpenAI é o único stack que entrega desempenho confiável em ambos."
Decisões de política frequentemente dependem de distinções sutis. Pense em um marketplace que exige que vendedores incluam um aviso para produtos de bem-estar, com exigências que variam conforme as alegações do produto e regras regionais. Fornecedores legados usam gatilhos por palavra-chave ou conjuntos rígidos de regras, que podem não capturar o julgamento mais profundo que essas decisões exigem, levando a aplicação ausente ou incorreta.
O agente de Divulgação de Políticas da SafetyKit primeiro consulta as políticas na biblioteca interna da SafetyKit e, então, o GPT‑5 avalia o conteúdo: ele menciona tratamento ou prevenção? Ele está sendo vendido em uma região onde a divulgação é obrigatória? E, se sim, a linguagem exigida está de fato incluída no anúncio? Se algo estiver faltando, o GPT‑5 retorna uma saída estruturada que o agente usa para sinalizar o problema.
"O poder do GPT‑5 está na precisão com que ele consegue raciocinar quando ancorado em políticas reais", observa Graunke. "Isso nos permite tomar decisões precisas e defensáveis até nos casos-limite em que outros sistemas falham."
Transforme cada lançamento de modelo em uma vitória de produto
A SafetyKit testa cada novo modelo da OpenAI em seus casos mais difíceis, frequentemente colocando os melhores em produção no mesmo dia. Avaliações internas rigorosas permitem que a equipe identifique rapidamente como novos modelos podem melhorar o desempenho e se integrem sem atrito à infraestrutura central.
Quando o OpenAI o3 foi lançado, a SafetyKit o usou para elevar o desempenho em casos-limite em áreas-chave de políticas. Em seguida veio o GPT‑5 e, em poucos dias, ele foi implantado nos agentes mais exigentes, melhorando as pontuações de benchmark em mais de 10 pontos nas tarefas de visão mais difíceis.
"A OpenAI se move rápido, e nós projetamos nosso sistema para acompanhar. Cada novo lançamento nos dá uma vantagem operacional — liberando novas capacidades e domínios que antes não conseguíamos atender e ampliando a cobertura e a precisão que entregamos aos clientes."
A SafetyKit também devolve melhorias ao ecossistema, compartilhando resultados de avaliações, falhas de casos-limite e insights específicos de políticas diretamente com a OpenAI para ajudar a orientar o desempenho de futuros modelos em cargas de trabalho críticas para a segurança.
Escale o crescimento de clientes e volume com o melhor stack da OpenAI
A arquitetura da SafetyKit aplica políticas em escala, entregando velocidade, precisão e cobertura abrangente de riscos. Nos bastidores, ela já processa mais de 16 bilhões de tokens por dia, ante 200 milhões há seis meses, analisando mais conteúdo sem sacrificar a precisão.
Nesse mesmo período, a SafetyKit expandiu para risco de pagamentos, fraude, combate à exploração infantil, combate à lavagem de dinheiro e novos clientes com centenas de milhões de usuários finais sob a proteção da SafetyKit. Essa base permite que clientes respondam com rapidez e confiança a riscos emergentes.
"Criamos um ciclo em que cada lançamento da OpenAI fortalece diretamente nossas capacidades", diz Graunke. "É por isso que o sistema melhora continuamente, sempre à frente de riscos em evolução."
Resultados em resumo
- Mais de 95% de precisão ao revisar 100% do conteúdo dos clientes
- 16B tokens processados por dia, ante 200M em seis meses
- Mais de 10 pontos de ganho de benchmark nas tarefas visuais mais difíceis


