Saltar para o conteúdo principal
OpenAI

9 de setembro de 2025

SafetyKit escala agentes de risco com modelos de topo da OpenAI

Desde a prototipagem com pré-visualizações iniciais de modelos de visão até à escalabilidade com o GPT‑5, os agentes multimodais da SafetyKit expandem-se para novos domínios e aumentam a precisão.

Logótipo da SafetyKit a branco, centrado num fundo escuro com textura vertical e um gradiente quente de luz laranja, amarela e azul‑petróleo.
Dimensão da empresa: Startup
Região: América do Norte
Setor: Tecnologia, Serviços
Produtos: API

Resultados

95%+

Precisão ao rever 100% do conteúdo dos clientes (evals da SafetyKit)

Resultados

16B

Tokens processados por dia, face a 200 milhões há seis meses

Resultados

10+

Ganhos de desempenho, em pontos, nas tarefas de visão mais difíceis com o GPT-5

A carregar…

A SafetyKit(abre numa nova janela) cria agentes de IA multimodais para ajudar marketplaces, plataformas de pagamentos e fintechs a detetar e agir sobre fraude e atividades proibidas em texto, imagens, transações financeiras, listagens de produtos e muito mais. Avanços recentes no raciocínio dos modelos e na compreensão multimodal tornam isto agora mais eficaz, definindo um novo padrão para operações de risco, conformidade e segurança.

Os agentes da SafetyKit tiram partido do GPT‑5, GPT‑4.1, Pesquisa Aprofundada e do Computer Using Agent (CUA) para rever 100% do conteúdo dos clientes com mais de 95% de precisão, com base nas evals da SafetyKit. Podem ajudar as plataformas a proteger utilizadores, prevenir fraude, evitar coimas regulamentares e aplicar políticas complexas que sistemas legados podem não detetar, como regras específicas por região, números de telefone incorporados em imagens de burlas ou conteúdo explícito. A automação também pode proteger moderadores humanos da exposição a material ofensivo e libertá-los para lidarem com decisões sobre políticas com mais nuance.

«A OpenAI dá-nos acesso aos modelos de raciocínio e multimodais mais avançados do mercado. Permite-nos adaptar rapidamente, lançar novos agentes mais depressa e lidar com tipos de conteúdo que outras soluções nem sequer conseguem analisar.»
David Graunke, fundador e CEO da SafetyKit

Conceba agentes para o que a tarefa exige e depois escolha o modelo certo

Cada agente da SafetyKit é concebido para lidar com uma categoria de risco específica, de burlas a produtos ilegais. Cada peça de conteúdo é encaminhada para o agente mais adequado a essa infração, usando o modelo da OpenAI ideal:

  • O GPT‑5 aplica raciocínio multimodal a texto, imagens e UI para revelar riscos ocultos e apoiar uma tomada de decisão em camadas e precisa
  • O GPT‑4.1 segue de forma fiável instruções detalhadas de políticas de conteúdo e gere, de forma eficiente, fluxos de trabalho de moderação de grande volume
  • Reinforcement fine-tuning (RFT) aumenta o recall e a precisão para lá dos modelos predefinidos, alcançando desempenho de ponta com políticas de segurança complexas
  • A Pesquisa Aprofundada integra investigação online em tempo real em avaliações e verificações de comerciantes
  • O Computer Using Agent (CUA) automatiza tarefas complexas de políticas, reduzindo a dependência de revisões manuais dispendiosas

Esta abordagem de correspondência de modelos permite à SafetyKit escalar a revisão de conteúdo entre modalidades com mais nuance e precisão do que as soluções legadas.

O agente de Deteção de Burlas, por exemplo, vai além de apenas analisar texto. Analisa elementos visuais, como códigos QR ou números de telefone incorporados em imagens de produtos. O GPT‑4.1 ajuda-o a interpretar a imagem, compreender o layout e decidir se é uma violação das políticas.

O agente de Divulgação de Políticas verifica listagens ou páginas de destino quanto à linguagem obrigatória, como avisos legais ou avisos de conformidade específicos por região. O GPT‑4.1 extrai as secções relevantes, o GPT‑5 avalia a conformidade e o agente sinaliza infrações.

«Pensamos nos nossos agentes como fluxos de trabalho feitos à medida», diz Graunke. «Algumas tarefas exigem raciocínio profundo, outras precisam de contexto multimodal. A OpenAI é a única stack que oferece desempenho fiável em ambos.»

Gráfico de linhas e barras com a legenda «SafetyKit» num fundo claro, mostrando tendências de dados e comparações em várias categorias.

Tire partido do GPT‑5 para navegar pelas zonas cinzentas e pelas decisões de alto risco

As decisões sobre políticas dependem muitas vezes de distinções subtis. Imagine um marketplace que exige que os vendedores incluam um aviso legal para produtos de bem-estar, com requisitos que variam consoante as alegações do produto e as regras regionais. Os fornecedores legados usam gatilhos por palavras-chave ou conjuntos de regras rígidos, que podem falhar o juízo mais profundo que estas decisões exigem, levando a aplicação em falta ou incorreta.

O agente de Divulgação de Políticas da SafetyKit começa por consultar políticas na biblioteca interna da SafetyKit e depois o GPT‑5 avalia o conteúdo: menciona tratamento ou prevenção? Está a ser vendido numa região onde a divulgação é obrigatória? E, se sim, a formulação exigida está realmente incluída na listagem? Se algo ficar aquém, o GPT‑5 devolve um output estruturado que o agente usa para sinalizar o problema.

«O poder do GPT‑5 está na precisão com que consegue raciocinar quando se baseia em políticas reais», observa Graunke. «Permite-nos tomar decisões precisas e defensáveis, mesmo nos casos-limite em que outros sistemas falham.»

Transforme cada lançamento de modelo numa vitória de produto

A SafetyKit submete cada novo modelo da OpenAI a benchmarks com os seus casos mais difíceis, muitas vezes implementando os melhores no próprio dia. Avaliações internas rigorosas permitem à equipa identificar rapidamente como novos modelos podem melhorar o desempenho e integrar-se sem fricção na sua infraestrutura central.

Quando o OpenAI o3 foi lançado, a SafetyKit usou-o para melhorar o desempenho em casos-limite em áreas-chave de políticas. Seguiu-se o GPT‑5 e, em poucos dias, foi implementado nos seus agentes mais exigentes, melhorando as pontuações de benchmark em mais de 10 pontos nas tarefas de visão mais difíceis.

«A OpenAI avança depressa, e concebemos o nosso sistema para acompanhar. Cada novo lançamento dá-nos uma vantagem operacional — desbloqueia novas capacidades e domínios que antes não conseguíamos suportar e aumenta a cobertura e a precisão que entregamos aos clientes.»
—David Graunke, fundador e CEO da SafetyKit

A SafetyKit também devolve melhorias ao ecossistema, partilhando resultados de evals, falhas em casos-limite e insights específicos de políticas diretamente com a OpenAI para ajudar a moldar o desempenho futuro dos modelos em cargas de trabalho críticas para a segurança.

Escale o crescimento de clientes e volumes com a melhor stack da OpenAI

A arquitetura da SafetyKit aplica políticas à escala, oferecendo velocidade, precisão e cobertura abrangente de riscos. Nos bastidores, já processa mais de 16 mil milhões de tokens por dia, face a 200 milhões há seis meses, analisando mais conteúdo sem sacrificar a precisão.

Neste mesmo período, a SafetyKit expandiu-se para risco em pagamentos, fraude, combate à exploração infantil, combate ao branqueamento de capitais e novos clientes com centenas de milhões de utilizadores finais sob a proteção da SafetyKit. Esta base permite aos clientes responderem com rapidez e confiança a riscos emergentes.

«Criámos um ciclo em que cada lançamento da OpenAI reforça diretamente as nossas capacidades», diz Graunke. «É por isso que o sistema melhora continuamente, mantendo-se sempre à frente dos riscos em evolução.»

Resultados em resumo

  • Precisão de 95%+ ao rever 100% do conteúdo dos clientes
  • 16 mil milhões de tokens processados por dia, face a 200 milhões em seis meses
  • Ganhos de benchmark de 10+ pontos nas tarefas de visão mais difíceis

Junte-se à nova era do trabalho

Mais de 1 milhão de empresas em todo o mundo estão a obter resultados significativos com a OpenAI.