Hoje lançamos o AgentKit, um conjunto completo de ferramentas para os programadores e empresas criarem, implementarem e otimizarem agentes. Até agora, criar agentes significava lidar com ferramentas fragmentadas — orquestração complexa sem controlo de versões, conetores personalizados, pipelines de avaliação manual, ajustes rápidos e semanas de trabalho de front-end antes do lançamento. Com o AgentKit, os programadores já podem conceber fluxos de trabalho visualmente e incorporar interfaces de utilizador de agentes mais rapidamente, utilizando novos blocos de construção como:
- Agent Builder: um ecrã visual para criar e gerir versões de fluxos de trabalho de vários agentes.
- Connector Registry: um local central para os administradores gerirem a forma como os dados e as ferramentas se ligam entre os produtos OpenAI.
- ChatKit: um kit de ferramentas para integrar experiências de agente personalizáveis baseadas em chat no teu produto
Estamos também a expandir as capacidades de avaliação com novas funcionalidades, tais como conjuntos de dados, classificação de funcionamento, otimização automática de prompts e compatibilidade com modelos de terceiros para medir e melhorar o desempenho de agentes.
Desde o lançamento da API responses e do SDK Agents em março, temos visto os programadores e as empresas a criarem fluxos de trabalho de agentes completos para deep research, apoio ao cliente e muito mais. A Klarna criou um agente de apoio que trata de dois terços de todos os pedidos de apoio e a Clay multiplicou o seu crescimento por 10 com um agente de vendas. O AgentKit baseia-se na API de Respostas para ajudar os desenvolvedores a criar agentes de forma mais eficiente e fiável.
À medida que os fluxos de trabalho dos agentes se tornam mais complexos, os programadores precisam de uma visibilidade mais clara de como funcionam. O Agent Builder(abre numa nova janela) oferece um canvas visual para compor lógica com nós de arrastar e largar, ligar ferramentas e configurar proteções personalizadas. Permite execuções de pré-visualização, configuração de avaliação incorporada e gestão de versões completo — ideal para iterações rápidas.

Os construtores podem começar com uma tela em branco ou com modelos pré-fabricados.
Na Ramp, a equipa passou de um canvas em branco para um agente em apenas algumas horas:
O Agent Builder transformou o que antes requeria meses de orquestração complexa, código personalizado e otimizações manuais em apenas algumas horas. O canvas visual mantém as equipas de produto, jurídica e de engenharia alinhadas, reduzindo os ciclos de iteração em 70% e permitindo que um agente seja implementado em dois sprints em vez de dois trimestres."
Da mesma forma, a LY Corporation — uma empresa japonesa líder em tecnologia e serviços de internet — criou um agente assistente de trabalho com o Agent Builder em menos de duas horas.
"O Agent Builder permitiu-nos orquestrar os agentes de uma forma totalmente nova, com engenheiros e especialistas no assunto a colaborar numa única interface. Criámos o nosso primeiro fluxo de trabalho de vários agentes e executámo-lo em menos de duas horas, acelerando drasticamente o tempo de criação e implementação de agentes."
Lançamos também um Connector Registry para que as empresas possam gerir e manter dados em vários espaços de trabalho e organizações. O Connector Registry(abre numa nova janela) consolida as origens de dados num único painel de administração para o ChatGPT e a API. O registo inclui todos os conetores pré-criados, como Dropbox, Google Drive, SharePoint e Microsoft Teams, bem como MCPs terceiros.
Os programadores também podem ativar Guardrails(abre numa nova janela) no Agent Builder — uma camada de segurança modular de código aberto que ajuda a proteger os agentes contra comportamentos indesejados ou maliciosos. Os guardrails podem mascarar ou sinalizar informações pessoais identificáveis (PII), detetar intrusões de sistemas e aplicar outras salvaguardas, facilitando a criação e a implementação de agentes fiáveis e seguros. Os guardrails podem ser implementados de forma autónoma ou através da biblioteca de guardrails para Python(abre numa nova janela) e JavaScript(abre numa nova janela).
Implementar interfaces de chat para agentes pode ser surpreendentemente complexo — lidar com respostas em fluxo contínuo, gerir tópicos, mostrar o raciocínio do modelo e criar experiências envolventes no chat. O ChatKit(abre numa nova janela) torna simples a integração de agentes baseados em chat que parecem nativos do teu produto. Pode ser integrado em aplicações ou sites e personalizado para combinar com o teu tema ou marca.
"Economizámos mais de duas semanas no desenvolvimento de um agente de apoio ao cliente para a nossa comunidade de programadores do Canva com o ChatKit e integrámo-lo em menos de uma hora. Este agente de apoio vai transformar a forma como os programadores interagem com a nossa documentação, tornando-a uma experiência conversacional e facilitando a criação de aplicações e integrações no Canva."
O ChatKit já é utilizado em vários casos, desde assistentes de conhecimento internos e guias de integração a agentes de apoio ao cliente e de pesquisa. O agente de apoio ao cliente da HubSpot(abre numa nova janela) é um exemplo:

A criação de agentes fiáveis e prontos para a produção exige avaliações de desempenho rigorosas. No ano passado, lançámos Evals(abre numa nova janela) para ajudar os desenvolvedores a testar prompts e medir o comportamento do modelo. Agora vamos adicionar quatro novas funcionalidades que tornam ainda mais fácil criar avaliações:
- Conjuntos de dados – cria rapidamente avaliações de agentes a partir do zero e expande-as ao longo do tempo com classificadores automáticos e anotações humanas.
- Classificação de funcionamento – executa avaliações completas de fluxos de trabalho com agentes e automatiza a classificação para identificar problemas.
- Otimização automatizada de prompts – gera prompts melhorados com base em anotações humanas e resultados dos avaliadores.
- Compatibilidade com modelos de terceiros – avalia modelos de outros fornecedores dentro da plataforma OpenAI Evals.
Já vimos grandes ganhos de desempenho de clientes que utilizam Evals.
"A plataforma de avaliação reduziu o tempo de desenvolvimento no nosso framework de due diligence multiagente em mais de 50% e aumentou a precisão dos agentes em 30%."

Ajuste fino por reforço(abre numa nova janela) (RFT) permite que os desenvolvedores personalizem os nossos modelos de raciocínio. Está geralmente disponível no OpenAI o4-mini e em versão beta privada para o GPT‑5. Estamos a trabalhar em estreita colaboração com dezenas de clientes para melhorar o RFT para o GPT‑5 antes do lançamento em larga escala.
Hoje apresentamos duas novas funcionalidades na versão beta do RFT, concebidas para impulsionar ainda mais o desempenho dos agentes:
- Chamadas de ferramentas personalizadas – treina modelos para chamar as ferramentas certas no momento certo para um melhor raciocínio
- Classificadores personalizados –define critérios de avaliação personalizados para o que é mais importante no teu caso de utilização
A partir de hoje, o ChatKit e as novas funcionalidades de Evals estão disponíveis para todos os programadores. O Agent Builder está disponível em versão beta, e o Connector Registry está a iniciar a sua implementação beta para alguns clientes de API, ChatGPT Enterprise e Edu com uma Global Admin Console(abre numa nova janela) (onde os proprietários globais podem gerir domínios, SSO e APIs de várias organizações). A consola Global Admin é um pré-requisito para ativar o Connector Registry. Todas estas ferramentas estão incluídas no preço normal do modelo de API.
Planeamos adicionar uma API Workflows autónoma e opções de implementação de agente ao ChatGPT em breve.
Mal podemos esperar para ver o que vais construir.


