Saltar para o conteúdo principal
OpenAI

6 de outubro de 2025

Produto

Apresentamos o AgentKit

Novas ferramentas para criar, implementar e otimizar agentes.

A carregar…

Hoje lançamos o AgentKit, um conjunto completo de ferramentas para os programadores e empresas criarem, implementarem e otimizarem agentes. Até agora, criar agentes significava lidar com ferramentas fragmentadas — orquestração complexa sem controlo de versões, conetores personalizados, pipelines de avaliação manual, ajustes rápidos e semanas de trabalho de front-end antes do lançamento. Com o AgentKit, os programadores já podem conceber fluxos de trabalho visualmente e incorporar interfaces de utilizador de agentes mais rapidamente, utilizando novos blocos de construção como:

  • Agent Builder: um ecrã visual para criar e gerir versões de fluxos de trabalho de vários agentes.
  • Connector Registry: um local central para os administradores gerirem a forma como os dados e as ferramentas se ligam entre os produtos OpenAI.
  • ChatKit: um kit de ferramentas para integrar experiências de agente personalizáveis baseadas em chat no teu produto

Estamos também a expandir as capacidades de avaliação com novas funcionalidades, tais como conjuntos de dados, classificação de funcionamento, otimização automática de prompts e compatibilidade com modelos de terceiros para medir e melhorar o desempenho de agentes.

Desde o lançamento da API responses e do SDK Agents em março, temos visto os programadores e as empresas a criarem fluxos de trabalho de agentes completos para deep research, apoio ao cliente e muito mais. A Klarna criou um agente de apoio que trata de dois terços de todos os pedidos de apoio e a Clay multiplicou o seu crescimento por 10 com um agente de vendas. O AgentKit baseia-se na API de Respostas para ajudar os desenvolvedores a criar agentes de forma mais eficiente e fiável.

Criar fluxos de trabalho com o construtor de agentes

À medida que os fluxos de trabalho dos agentes se tornam mais complexos, os programadores precisam de uma visibilidade mais clara de como funcionam. O Agent Builder(abre numa nova janela) oferece um canvas visual para compor lógica com nós de arrastar e largar, ligar ferramentas e configurar proteções personalizadas. Permite execuções de pré-visualização, configuração de avaliação incorporada e gestão de versões completo — ideal para iterações rápidas.

Vista da interface de um fluxo de automatização do apoio ao cliente num construtor visual. O ecrã mostra nós ligados com os rótulos Início, Proteção contra jailbreak, Agente de classificação, If/else, Agente de retorno, Agente de retenção, Agente de informação, Guardrail contra distorções e Fim. Uma barra lateral à esquerda lista os tipos de nós disponíveis, como Agente, Nota, Pesquisa de Ficheiros, Guardrails, MCP e Aprovação do Utilizador. Os controlos principais incluem opções para Avaliar, Codificar, Pré-visualizar e Publicar.

Os construtores podem começar com uma tela em branco ou com modelos pré-fabricados.

Na Ramp, a equipa passou de um canvas em branco para um agente em apenas algumas horas:

O Agent Builder transformou o que antes requeria meses de orquestração complexa, código personalizado e otimizações manuais em apenas algumas horas. O canvas visual mantém as equipas de produto, jurídica e de engenharia alinhadas, reduzindo os ciclos de iteração em 70% e permitindo que um agente seja implementado em dois sprints em vez de dois trimestres."
— Ramp

Da mesma forma, a LY Corporation — uma empresa japonesa líder em tecnologia e serviços de internet — criou um agente assistente de trabalho com o Agent Builder em menos de duas horas.

"O Agent Builder permitiu-nos orquestrar os agentes de uma forma totalmente nova, com engenheiros e especialistas no assunto a colaborar numa única interface. Criámos o nosso primeiro fluxo de trabalho de vários agentes e executámo-lo em menos de duas horas, acelerando drasticamente o tempo de criação e implementação de agentes."
— LY Corporation

Lançamos também um Connector Registry para que as empresas possam gerir e manter dados em vários espaços de trabalho e organizações. O Connector Registry(abre numa nova janela) consolida as origens de dados num único painel de administração para o ChatGPT e a API. O registo inclui todos os conetores pré-criados, como Dropbox, Google Drive, SharePoint e Microsoft Teams, bem como MCPs terceiros.

Os programadores também podem ativar Guardrails(abre numa nova janela) no Agent Builder — uma camada de segurança modular de código aberto que ajuda a proteger os agentes contra comportamentos indesejados ou maliciosos. Os guardrails podem mascarar ou sinalizar informações pessoais identificáveis (PII), detetar intrusões de sistemas e aplicar outras salvaguardas, facilitando a criação e a implementação de agentes fiáveis e seguros. Os guardrails podem ser implementados de forma autónoma ou através da biblioteca de guardrails para Python(abre numa nova janela) e JavaScript(abre numa nova janela).

Integra experiências de agente com o ChatKit

Implementar interfaces de chat para agentes pode ser surpreendentemente complexo — lidar com respostas em fluxo contínuo, gerir tópicos, mostrar o raciocínio do modelo e criar experiências envolventes no chat. O ChatKit(abre numa nova janela) torna simples a integração de agentes baseados em chat que parecem nativos do teu produto. Pode ser integrado em aplicações ou sites e personalizado para combinar com o teu tema ou marca.

"Economizámos mais de duas semanas no desenvolvimento de um agente de apoio ao cliente para a nossa comunidade de programadores do Canva com o ChatKit e integrámo-lo em menos de uma hora. Este agente de apoio vai transformar a forma como os programadores interagem com a nossa documentação, tornando-a uma experiência conversacional e facilitando a criação de aplicações e integrações no Canva."
— Canva

O ChatKit já é utilizado em vários casos, desde assistentes de conhecimento internos e guias de integração a agentes de apoio ao cliente e de pesquisa. O agente de apoio ao cliente da HubSpot(abre numa nova janela) é um exemplo:

Vista do painel de controlo da plataforma Ramp, mostrando uma interface de gestão de despesas. O painel principal saúda o utilizador, Daniel, e lista pedidos como "Pedido do ChatGPT Business" (pendente de revisão) e "Pedido do HubSpot" (rascunho), juntamente com despesas recentes com companhias aéreas, serviços de transporte por aplicação e software. À direita, encontra-se um formulário de pedido de software para o ChatGPT Business, detalhando 5 licenças a 125 dólares por mês, de 1 de outubro de 2025 a 1 de outubro de 2026, com um botão amarelo "Enviar pedido".

Mede o desempenho do agente com as novas capacidades do Evals.

A criação de agentes fiáveis e prontos para a produção exige avaliações de desempenho rigorosas. No ano passado, lançámos Evals(abre numa nova janela) para ajudar os desenvolvedores a testar prompts e medir o comportamento do modelo. Agora vamos adicionar quatro novas funcionalidades que tornam ainda mais fácil criar avaliações:

  • Conjuntos de dados – cria rapidamente avaliações de agentes a partir do zero e expande-as ao longo do tempo com classificadores automáticos e anotações humanas.
  • Classificação de funcionamento – executa avaliações completas de fluxos de trabalho com agentes e automatiza a classificação para identificar problemas.
  • Otimização automatizada de prompts – gera prompts melhorados com base em anotações humanas e resultados dos avaliadores.
  • Compatibilidade com modelos de terceiros – avalia modelos de outros fornecedores dentro da plataforma OpenAI Evals.

Já vimos grandes ganhos de desempenho de clientes que utilizam Evals.

"A plataforma de avaliação reduziu o tempo de desenvolvimento no nosso framework de due diligence multiagente em mais de 50% e aumentou a precisão dos agentes em 30%."
— Carlyle
Interface que mostra uma tabela de dados com colunas para Avaliação, Tom, Feedback e Precisão. As linhas mostram entradas com ícones de polegar para cima ou para baixo, etiquetas de tom como Profissional, Amigável, Rude e Mau, e resultados de precisão rotulados como Aprovado ou Reprovado com uma pontuação de 3,5. A barra de ferramentas superior inclui opções para Carregar, Colunas, Avaliar, Gerar resultado e Guardar.

Impulsiona o desempenho do agente com ajuste fino por reforço

Ajuste fino por reforço(abre numa nova janela) (RFT) permite que os desenvolvedores personalizem os nossos modelos de raciocínio. Está geralmente disponível no OpenAI o4-mini e em versão beta privada para o GPT‑5. Estamos a trabalhar em estreita colaboração com dezenas de clientes para melhorar o RFT para o GPT‑5 antes do lançamento em larga escala.

Hoje apresentamos duas novas funcionalidades na versão beta do RFT, concebidas para impulsionar ainda mais o desempenho dos agentes:

  • Chamadas de ferramentas personalizadas – treina modelos para chamar as ferramentas certas no momento certo para um melhor raciocínio 
  • Classificadores personalizados –define critérios de avaliação personalizados para o que é mais importante no teu caso de utilização

Preços e disponibilidade

A partir de hoje, o ChatKit e as novas funcionalidades de Evals estão disponíveis para todos os programadores. O Agent Builder está disponível em versão beta, e o Connector Registry está a iniciar a sua implementação beta para alguns clientes de API, ChatGPT Enterprise e Edu com uma Global Admin Console(abre numa nova janela) (onde os proprietários globais podem gerir domínios, SSO e APIs de várias organizações). A consola Global Admin é um pré-requisito para ativar o Connector Registry. Todas estas ferramentas estão incluídas no preço normal do modelo de API.

Planeamos adicionar uma API Workflows autónoma e opções de implementação de agente ao ChatGPT em breve.

Mal podemos esperar para ver o que vais construir.

Autor

OpenAI