9 de setembro de 2025

A SafetyKit escala agentes de risco com modelos líderes da OpenAI

Do protótipo com prévias de modelos de visão ao ganho de escala com o GPT‑5, os agentes multimodais da SafetyKit avançam para novos domínios e aumentam a precisão.

Fale com a gente

Logotipo da SafetyKit em branco, centralizado em um fundo escuro com textura vertical e um gradiente quente de luz laranja, amarela e azul-petróleo.

Tamanho da empresa: Startup

Região: América do Norte

Setor: Tecnologia, Serviços

Produtos: API

Resultados

95%+

Precisão ao revisar 100% do conteúdo dos clientes (avaliações da SafetyKit)

Resultados

16B

Tokens processados por dia, ante 200M há seis meses

Resultados

10+

Pontos de ganho de desempenho nas tarefas visuais mais difíceis com o GPT-5

Carregando…

A SafetyKit⁠(abre em uma nova janela) cria agentes de IA multimodais para ajudar marketplaces, plataformas de pagamento e fintechs a detectar e agir contra fraude e atividades proibidas em textos, imagens, transações financeiras, anúncios de produtos e muito mais. Avanços recentes em raciocínio de modelos e compreensão multimodal tornam isso ainda mais eficaz, elevando o padrão de operações de risco, conformidade e segurança.

Os agentes da SafetyKit usam GPT‑5, GPT‑4.1, pesquisa aprofundada e o Computer Using Agent (CUA) para revisar 100% do conteúdo dos clientes com mais de 95% de precisão, com base nas avaliações da SafetyKit. Eles ajudam plataformas a proteger usuários, prevenir fraudes, evitar multas regulatórias e aplicar políticas complexas que sistemas legados podem deixar passar, como regras específicas por região, números de telefone embutidos em imagens de golpe ou conteúdo explícito. A automação também pode proteger moderadores humanos da exposição a material ofensivo e libera tempo para lidar com decisões de política mais nuanceadas.

"A OpenAI nos dá acesso aos modelos de raciocínio e multimodais mais avançados do mercado. Isso nos permite nos adaptar rápido, lançar novos agentes mais depressa e lidar com tipos de conteúdo que outras soluções nem conseguem analisar."

David Graunke, fundador e CEO da SafetyKit

Projete agentes conforme a tarefa exige e, depois, escolha o modelo certo

Cada agente da SafetyKit é criado para lidar com uma categoria específica de risco, de golpes a produtos ilegais. Cada conteúdo é roteado para o agente mais adequado à violação, usando o modelo ideal da OpenAI:

O GPT‑5 aplica raciocínio multimodal em texto, imagens e UI para revelar riscos ocultos e apoiar decisões em camadas, com precisão
O GPT‑4.1 segue de forma confiável instruções detalhadas de políticas de conteúdo e gerencia com eficiência fluxos de moderação de alto volume
O fine-tuning por reforço (RFT) aumenta recall e precisão além dos modelos padrão, alcançando desempenho de ponta com políticas de segurança complexas
A pesquisa aprofundada integra investigação online em tempo real em avaliações e verificações de lojistas
O Computer Using Agent (CUA) automatiza tarefas complexas de política, reduzindo a dependência de revisões manuais caras

Essa abordagem de combinar tarefa e modelo permite à SafetyKit escalar a revisão de conteúdo entre modalidades com mais nuance e precisão do que soluções legadas conseguem.

O agente de Detecção de Golpes, por exemplo, vai além de apenas varrer texto. Ele analisa visuais como QR codes ou números de telefone embutidos em imagens de produtos. O GPT‑4.1 ajuda a interpretar a imagem, entender o layout e decidir se há violação de política.

O agente de Divulgação de Políticas verifica anúncios ou landing pages em busca da linguagem obrigatória, como avisos legais ou alertas de conformidade específicos por região. O GPT‑4.1 extrai trechos relevantes, o GPT‑5 avalia a conformidade, e o agente sinaliza violações.

"Encaramos nossos agentes como fluxos de trabalho feitos sob medida", diz Graunke. "Algumas tarefas exigem raciocínio profundo; outras, contexto multimodal. A OpenAI é o único stack que entrega desempenho confiável em ambos."

Gráfico de linhas e barras com o rótulo "SafetyKit" em um fundo claro, exibindo tendências e comparações de dados em várias categorias.

Use o GPT‑5 para navegar pelas zonas cinzentas e decisões de alto risco

Decisões de política frequentemente dependem de distinções sutis. Pense em um marketplace que exige que vendedores incluam um aviso para produtos de bem-estar, com exigências que variam conforme as alegações do produto e regras regionais. Fornecedores legados usam gatilhos por palavra-chave ou conjuntos rígidos de regras, que podem não capturar o julgamento mais profundo que essas decisões exigem, levando a aplicação ausente ou incorreta.

O agente de Divulgação de Políticas da SafetyKit primeiro consulta as políticas na biblioteca interna da SafetyKit e, então, o GPT‑5 avalia o conteúdo: ele menciona tratamento ou prevenção? Ele está sendo vendido em uma região onde a divulgação é obrigatória? E, se sim, a linguagem exigida está de fato incluída no anúncio? Se algo estiver faltando, o GPT‑5 retorna uma saída estruturada que o agente usa para sinalizar o problema.

"O poder do GPT‑5 está na precisão com que ele consegue raciocinar quando ancorado em políticas reais", observa Graunke. "Isso nos permite tomar decisões precisas e defensáveis até nos casos-limite em que outros sistemas falham."

Transforme cada lançamento de modelo em uma vitória de produto

A SafetyKit testa cada novo modelo da OpenAI em seus casos mais difíceis, frequentemente colocando os melhores em produção no mesmo dia. Avaliações internas rigorosas permitem que a equipe identifique rapidamente como novos modelos podem melhorar o desempenho e se integrem sem atrito à infraestrutura central.

Quando o OpenAI o3 foi lançado, a SafetyKit o usou para elevar o desempenho em casos-limite em áreas-chave de políticas. Em seguida veio o GPT‑5 e, em poucos dias, ele foi implantado nos agentes mais exigentes, melhorando as pontuações de benchmark em mais de 10 pontos nas tarefas de visão mais difíceis.

"A OpenAI se move rápido, e nós projetamos nosso sistema para acompanhar. Cada novo lançamento nos dá uma vantagem operacional — liberando novas capacidades e domínios que antes não conseguíamos atender e ampliando a cobertura e a precisão que entregamos aos clientes."

—David Graunke, fundador e CEO da SafetyKit

A SafetyKit também devolve melhorias ao ecossistema, compartilhando resultados de avaliações, falhas de casos-limite e insights específicos de políticas diretamente com a OpenAI para ajudar a orientar o desempenho de futuros modelos em cargas de trabalho críticas para a segurança.

Escale o crescimento de clientes e volume com o melhor stack da OpenAI

A arquitetura da SafetyKit aplica políticas em escala, entregando velocidade, precisão e cobertura abrangente de riscos. Nos bastidores, ela já processa mais de 16 bilhões de tokens por dia, ante 200 milhões há seis meses, analisando mais conteúdo sem sacrificar a precisão.

Nesse mesmo período, a SafetyKit expandiu para risco de pagamentos, fraude, combate à exploração infantil, combate à lavagem de dinheiro e novos clientes com centenas de milhões de usuários finais sob a proteção da SafetyKit. Essa base permite que clientes respondam com rapidez e confiança a riscos emergentes.

"Criamos um ciclo em que cada lançamento da OpenAI fortalece diretamente nossas capacidades", diz Graunke. "É por isso que o sistema melhora continuamente, sempre à frente de riscos em evolução."

Resultados em resumo

Mais de 95% de precisão ao revisar 100% do conteúdo dos clientes
16B tokens processados por dia, ante 200M em seis meses
Mais de 10 pontos de ganho de benchmark nas tarefas visuais mais difíceis

Entre na nova era do trabalho

Mais de 1 milhão de empresas em todo o mundo estão alcançando resultados significativos com a OpenAI.

Fale com a gente

Continuar lendo

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

Publicação1 de ago. de 2026

Advancing responsible AI across Europe — card

Promovendo a IA responsável em toda a Europa

Assuntos Globais31 de jul. de 2026

Building abundant intelligence

Empresa31 de jul. de 2026