6 de outubro de 2025

Apresentamos o AgentKit

Novas ferramentas para criar, implementar e otimizar agentes.

A carregar…

Hoje lançamos o AgentKit, um conjunto completo de ferramentas para os programadores e empresas criarem, implementarem e otimizarem agentes. Até agora, criar agentes significava lidar com ferramentas fragmentadas — orquestração complexa sem controlo de versões, conetores personalizados, pipelines de avaliação manual, ajustes rápidos e semanas de trabalho de front-end antes do lançamento. Com o AgentKit, os programadores já podem conceber fluxos de trabalho visualmente e incorporar interfaces de utilizador de agentes mais rapidamente, utilizando novos blocos de construção como:

Agent Builder: um ecrã visual para criar e gerir versões de fluxos de trabalho de vários agentes.
Connector Registry: um local central para os administradores gerirem a forma como os dados e as ferramentas se ligam entre os produtos OpenAI.
ChatKit: um kit de ferramentas para integrar experiências de agente personalizáveis baseadas em chat no teu produto

Estamos também a expandir as capacidades de avaliação com novas funcionalidades, tais como conjuntos de dados, classificação de funcionamento, otimização automática de prompts e compatibilidade com modelos de terceiros para medir e melhorar o desempenho de agentes.

Desde o lançamento da API responses e do SDK Agents⁠ em março, temos visto os programadores e as empresas a criarem fluxos de trabalho de agentes completos para deep research, apoio ao cliente e muito mais. A Klarna criou um agente de apoio⁠ que trata de dois terços de todos os pedidos de apoio e a Clay multiplicou o seu crescimento por 10⁠ com um agente de vendas. O AgentKit baseia-se na API de Respostas para ajudar os desenvolvedores a criar agentes de forma mais eficiente e fiável.

Criar fluxos de trabalho com o construtor de agentes

À medida que os fluxos de trabalho dos agentes se tornam mais complexos, os programadores precisam de uma visibilidade mais clara de como funcionam. O Agent Builder⁠(abre numa nova janela) oferece um canvas visual para compor lógica com nós de arrastar e largar, ligar ferramentas e configurar proteções personalizadas. Permite execuções de pré-visualização, configuração de avaliação incorporada e gestão de versões completo — ideal para iterações rápidas.

Vista da interface de um fluxo de automatização do apoio ao cliente num construtor visual. O ecrã mostra nós ligados com os rótulos Início, Proteção contra jailbreak, Agente de classificação, If/else, Agente de retorno, Agente de retenção, Agente de informação, Guardrail contra distorções e Fim. Uma barra lateral à esquerda lista os tipos de nós disponíveis, como Agente, Nota, Pesquisa de Ficheiros, Guardrails, MCP e Aprovação do Utilizador. Os controlos principais incluem opções para Avaliar, Codificar, Pré-visualizar e Publicar.

Os construtores podem começar com uma tela em branco ou com modelos pré-fabricados.

Na Ramp, a equipa passou de um canvas em branco para um agente em apenas algumas horas:

O Agent Builder transformou o que antes requeria meses de orquestração complexa, código personalizado e otimizações manuais em apenas algumas horas. O canvas visual mantém as equipas de produto, jurídica e de engenharia alinhadas, reduzindo os ciclos de iteração em 70% e permitindo que um agente seja implementado em dois sprints em vez de dois trimestres."

— Ramp

Da mesma forma, a LY Corporation — uma empresa japonesa líder em tecnologia e serviços de internet — criou um agente assistente de trabalho com o Agent Builder em menos de duas horas.

"O Agent Builder permitiu-nos orquestrar os agentes de uma forma totalmente nova, com engenheiros e especialistas no assunto a colaborar numa única interface. Criámos o nosso primeiro fluxo de trabalho de vários agentes e executámo-lo em menos de duas horas, acelerando drasticamente o tempo de criação e implementação de agentes."

— LY Corporation

Lançamos também um Connector Registry para que as empresas possam gerir e manter dados em vários espaços de trabalho e organizações. O Connector Registry⁠(abre numa nova janela) consolida as origens de dados num único painel de administração para o ChatGPT e a API. O registo inclui todos os conetores pré-criados, como Dropbox, Google Drive, SharePoint e Microsoft Teams, bem como MCPs terceiros.

Os programadores também podem ativar Guardrails⁠(abre numa nova janela) no Agent Builder — uma camada de segurança modular de código aberto que ajuda a proteger os agentes contra comportamentos indesejados ou maliciosos. Os guardrails podem mascarar ou sinalizar informações pessoais identificáveis (PII), detetar intrusões de sistemas e aplicar outras salvaguardas, facilitando a criação e a implementação de agentes fiáveis e seguros. Os guardrails podem ser implementados de forma autónoma ou através da biblioteca de guardrails para Python⁠(abre numa nova janela) e JavaScript⁠(abre numa nova janela).

Integra experiências de agente com o ChatKit

Implementar interfaces de chat para agentes pode ser surpreendentemente complexo — lidar com respostas em fluxo contínuo, gerir tópicos, mostrar o raciocínio do modelo e criar experiências envolventes no chat. O ChatKit⁠(abre numa nova janela) torna simples a integração de agentes baseados em chat que parecem nativos do teu produto. Pode ser integrado em aplicações ou sites e personalizado para combinar com o teu tema ou marca.

"Economizámos mais de duas semanas no desenvolvimento de um agente de apoio ao cliente para a nossa comunidade de programadores do Canva com o ChatKit e integrámo-lo em menos de uma hora. Este agente de apoio vai transformar a forma como os programadores interagem com a nossa documentação, tornando-a uma experiência conversacional e facilitando a criação de aplicações e integrações no Canva."

— Canva

O ChatKit já é utilizado em vários casos, desde assistentes de conhecimento internos e guias de integração a agentes de apoio ao cliente e de pesquisa. O agente de apoio ao cliente da HubSpot⁠(abre numa nova janela) é um exemplo:

Vista do painel de controlo da plataforma Ramp, mostrando uma interface de gestão de despesas. O painel principal saúda o utilizador, Daniel, e lista pedidos como "Pedido do ChatGPT Business" (pendente de revisão) e "Pedido do HubSpot" (rascunho), juntamente com despesas recentes com companhias aéreas, serviços de transporte por aplicação e software. À direita, encontra-se um formulário de pedido de software para o ChatGPT Business, detalhando 5 licenças a 125 dólares por mês, de 1 de outubro de 2025 a 1 de outubro de 2026, com um botão amarelo "Enviar pedido".

Mede o desempenho do agente com as novas capacidades do Evals.

A criação de agentes fiáveis e prontos para a produção exige avaliações de desempenho rigorosas. No ano passado, lançámos Evals⁠(abre numa nova janela) para ajudar os desenvolvedores a testar prompts e medir o comportamento do modelo. Agora vamos adicionar quatro novas funcionalidades que tornam ainda mais fácil criar avaliações:

Conjuntos de dados – cria rapidamente avaliações de agentes a partir do zero e expande-as ao longo do tempo com classificadores automáticos e anotações humanas.
Classificação de funcionamento – executa avaliações completas de fluxos de trabalho com agentes e automatiza a classificação para identificar problemas.
Otimização automatizada de prompts – gera prompts melhorados com base em anotações humanas e resultados dos avaliadores.
Compatibilidade com modelos de terceiros – avalia modelos de outros fornecedores dentro da plataforma OpenAI Evals.

Já vimos grandes ganhos de desempenho de clientes que utilizam Evals.

"A plataforma de avaliação reduziu o tempo de desenvolvimento no nosso framework de due diligence multiagente em mais de 50% e aumentou a precisão dos agentes em 30%."

— Carlyle

Interface que mostra uma tabela de dados com colunas para Avaliação, Tom, Feedback e Precisão. As linhas mostram entradas com ícones de polegar para cima ou para baixo, etiquetas de tom como Profissional, Amigável, Rude e Mau, e resultados de precisão rotulados como Aprovado ou Reprovado com uma pontuação de 3,5. A barra de ferramentas superior inclui opções para Carregar, Colunas, Avaliar, Gerar resultado e Guardar.

Impulsiona o desempenho do agente com ajuste fino por reforço

Ajuste fino por reforço⁠(abre numa nova janela) (RFT) permite que os desenvolvedores personalizem os nossos modelos de raciocínio. Está geralmente disponível no OpenAI o4-mini e em versão beta privada para o GPT‑5. Estamos a trabalhar em estreita colaboração com dezenas de clientes para melhorar o RFT para o GPT‑5 antes do lançamento em larga escala.

Hoje apresentamos duas novas funcionalidades na versão beta do RFT, concebidas para impulsionar ainda mais o desempenho dos agentes:

Chamadas de ferramentas personalizadas – treina modelos para chamar as ferramentas certas no momento certo para um melhor raciocínio
Classificadores personalizados –define critérios de avaliação personalizados para o que é mais importante no teu caso de utilização

Preços e disponibilidade

A partir de hoje, o ChatKit e as novas funcionalidades de Evals estão disponíveis para todos os programadores. O Agent Builder está disponível em versão beta, e o Connector Registry está a iniciar a sua implementação beta para alguns clientes de API, ChatGPT Enterprise e Edu com uma Global Admin Console⁠(abre numa nova janela) (onde os proprietários globais podem gerir domínios, SSO e APIs de várias organizações). A consola Global Admin é um pré-requisito para ativar o Connector Registry. Todas estas ferramentas estão incluídas no preço normal do modelo de API.

Planeamos adicionar uma API Workflows autónoma e opções de implementação de agente ao ChatGPT em breve.

Mal podemos esperar para ver o que vais construir.

Autor

OpenAI

Continuar a ler

Ver tudo

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

O GPT-5.6 é agora o modelo preferido no Microsoft 365 Copilot

Produto9/07/2026

GPT-5.6: inteligência de fronteira que acompanha a sua ambição

Produto9/07/2026

O ChatGPT é agora um parceiro para o seu trabalho mais ambicioso

Produto9/07/2026