Pular para o conteúdo principal
OpenAI

9 de setembro de 2025

A SafetyKit escala agentes de risco com modelos líderes da OpenAI

Do protótipo com prévias de modelos de visão ao ganho de escala com o GPT‑5, os agentes multimodais da SafetyKit avançam para novos domínios e aumentam a precisão.

Logotipo da SafetyKit em branco, centralizado em um fundo escuro com textura vertical e um gradiente quente de luz laranja, amarela e azul-petróleo.
Tamanho da empresa: Startup
Região: América do Norte
Setor: Tecnologia, Serviços
Produtos: API

Resultados

95%+

Precisão ao revisar 100% do conteúdo dos clientes (avaliações da SafetyKit)

Resultados

16B

Tokens processados por dia, ante 200M há seis meses

Resultados

10+

Pontos de ganho de desempenho nas tarefas visuais mais difíceis com o GPT-5

Carregando…

A SafetyKit(abre em uma nova janela) cria agentes de IA multimodais para ajudar marketplaces, plataformas de pagamento e fintechs a detectar e agir contra fraude e atividades proibidas em textos, imagens, transações financeiras, anúncios de produtos e muito mais. Avanços recentes em raciocínio de modelos e compreensão multimodal tornam isso ainda mais eficaz, elevando o padrão de operações de risco, conformidade e segurança.

Os agentes da SafetyKit usam GPT‑5, GPT‑4.1, pesquisa aprofundada e o Computer Using Agent (CUA) para revisar 100% do conteúdo dos clientes com mais de 95% de precisão, com base nas avaliações da SafetyKit. Eles ajudam plataformas a proteger usuários, prevenir fraudes, evitar multas regulatórias e aplicar políticas complexas que sistemas legados podem deixar passar, como regras específicas por região, números de telefone embutidos em imagens de golpe ou conteúdo explícito. A automação também pode proteger moderadores humanos da exposição a material ofensivo e libera tempo para lidar com decisões de política mais nuanceadas.

"A OpenAI nos dá acesso aos modelos de raciocínio e multimodais mais avançados do mercado. Isso nos permite nos adaptar rápido, lançar novos agentes mais depressa e lidar com tipos de conteúdo que outras soluções nem conseguem analisar."
David Graunke, fundador e CEO da SafetyKit

Projete agentes conforme a tarefa exige e, depois, escolha o modelo certo

Cada agente da SafetyKit é criado para lidar com uma categoria específica de risco, de golpes a produtos ilegais. Cada conteúdo é roteado para o agente mais adequado à violação, usando o modelo ideal da OpenAI:

  • O GPT‑5 aplica raciocínio multimodal em texto, imagens e UI para revelar riscos ocultos e apoiar decisões em camadas, com precisão
  • O GPT‑4.1 segue de forma confiável instruções detalhadas de políticas de conteúdo e gerencia com eficiência fluxos de moderação de alto volume
  • O fine-tuning por reforço (RFT) aumenta recall e precisão além dos modelos padrão, alcançando desempenho de ponta com políticas de segurança complexas
  • A pesquisa aprofundada integra investigação online em tempo real em avaliações e verificações de lojistas
  • O Computer Using Agent (CUA) automatiza tarefas complexas de política, reduzindo a dependência de revisões manuais caras

Essa abordagem de combinar tarefa e modelo permite à SafetyKit escalar a revisão de conteúdo entre modalidades com mais nuance e precisão do que soluções legadas conseguem.

O agente de Detecção de Golpes, por exemplo, vai além de apenas varrer texto. Ele analisa visuais como QR codes ou números de telefone embutidos em imagens de produtos. O GPT‑4.1 ajuda a interpretar a imagem, entender o layout e decidir se há violação de política.

O agente de Divulgação de Políticas verifica anúncios ou landing pages em busca da linguagem obrigatória, como avisos legais ou alertas de conformidade específicos por região. O GPT‑4.1 extrai trechos relevantes, o GPT‑5 avalia a conformidade, e o agente sinaliza violações.

"Encaramos nossos agentes como fluxos de trabalho feitos sob medida", diz Graunke. "Algumas tarefas exigem raciocínio profundo; outras, contexto multimodal. A OpenAI é o único stack que entrega desempenho confiável em ambos."

Gráfico de linhas e barras com o rótulo "SafetyKit" em um fundo claro, exibindo tendências e comparações de dados em várias categorias.

Use o GPT‑5 para navegar pelas zonas cinzentas e decisões de alto risco

Decisões de política frequentemente dependem de distinções sutis. Pense em um marketplace que exige que vendedores incluam um aviso para produtos de bem-estar, com exigências que variam conforme as alegações do produto e regras regionais. Fornecedores legados usam gatilhos por palavra-chave ou conjuntos rígidos de regras, que podem não capturar o julgamento mais profundo que essas decisões exigem, levando a aplicação ausente ou incorreta.

O agente de Divulgação de Políticas da SafetyKit primeiro consulta as políticas na biblioteca interna da SafetyKit e, então, o GPT‑5 avalia o conteúdo: ele menciona tratamento ou prevenção? Ele está sendo vendido em uma região onde a divulgação é obrigatória? E, se sim, a linguagem exigida está de fato incluída no anúncio? Se algo estiver faltando, o GPT‑5 retorna uma saída estruturada que o agente usa para sinalizar o problema.

"O poder do GPT‑5 está na precisão com que ele consegue raciocinar quando ancorado em políticas reais", observa Graunke. "Isso nos permite tomar decisões precisas e defensáveis até nos casos-limite em que outros sistemas falham."

Transforme cada lançamento de modelo em uma vitória de produto

A SafetyKit testa cada novo modelo da OpenAI em seus casos mais difíceis, frequentemente colocando os melhores em produção no mesmo dia. Avaliações internas rigorosas permitem que a equipe identifique rapidamente como novos modelos podem melhorar o desempenho e se integrem sem atrito à infraestrutura central.

Quando o OpenAI o3 foi lançado, a SafetyKit o usou para elevar o desempenho em casos-limite em áreas-chave de políticas. Em seguida veio o GPT‑5 e, em poucos dias, ele foi implantado nos agentes mais exigentes, melhorando as pontuações de benchmark em mais de 10 pontos nas tarefas de visão mais difíceis.

"A OpenAI se move rápido, e nós projetamos nosso sistema para acompanhar. Cada novo lançamento nos dá uma vantagem operacional — liberando novas capacidades e domínios que antes não conseguíamos atender e ampliando a cobertura e a precisão que entregamos aos clientes."
—David Graunke, fundador e CEO da SafetyKit

A SafetyKit também devolve melhorias ao ecossistema, compartilhando resultados de avaliações, falhas de casos-limite e insights específicos de políticas diretamente com a OpenAI para ajudar a orientar o desempenho de futuros modelos em cargas de trabalho críticas para a segurança.

Escale o crescimento de clientes e volume com o melhor stack da OpenAI

A arquitetura da SafetyKit aplica políticas em escala, entregando velocidade, precisão e cobertura abrangente de riscos. Nos bastidores, ela já processa mais de 16 bilhões de tokens por dia, ante 200 milhões há seis meses, analisando mais conteúdo sem sacrificar a precisão.

Nesse mesmo período, a SafetyKit expandiu para risco de pagamentos, fraude, combate à exploração infantil, combate à lavagem de dinheiro e novos clientes com centenas de milhões de usuários finais sob a proteção da SafetyKit. Essa base permite que clientes respondam com rapidez e confiança a riscos emergentes.

"Criamos um ciclo em que cada lançamento da OpenAI fortalece diretamente nossas capacidades", diz Graunke. "É por isso que o sistema melhora continuamente, sempre à frente de riscos em evolução."

Resultados em resumo

  • Mais de 95% de precisão ao revisar 100% do conteúdo dos clientes
  • 16B tokens processados por dia, ante 200M em seis meses
  • Mais de 10 pontos de ganho de benchmark nas tarefas visuais mais difíceis

Entre na nova era do trabalho

Mais de 1 milhão de empresas em todo o mundo estão alcançando resultados significativos com a OpenAI.