Hoje, estamos lançando o AgentKit, um conjunto completo de ferramentas que ajuda desenvolvedores e empresas a criar, implantar e otimizar agentes. Até agora, para criar agentes era preciso lidar com ferramentas heterogêneas: orquestração complexa sem controle de versão, conectores e pipelines de avaliação manual, ajuste de prompts e semanas de trabalho de front-end antes do lançamento. Com o AgentKit, os desenvolvedores já podem acelerar a criação visual de fluxos de trabalho e a incorporação de IUs agênticas usando novas ferramentas de criação, como:
- Agent Builder: uma interface visual para criação e controle de versão de fluxos de trabalho multiagente
- Connector Registry: recurso que permite gerenciar de forma centralizada a conexão entre dados e ferramentas nos produtos da OpenAI
- ChatKit: um kit de ferramentas para incorporar aos produtos experiências de agente baseadas em chat e personalizáveis
Além disso, estamos ampliando as funções de avaliação com novos recursos, como conjuntos de dados, pontuação de rastreio, otimização automática de prompts e suporte a modelos de terceiros para medir e aprimorar o desempenho de agentes.
Desde o lançamento da API Responses e o SDK Agents em março, desenvolvedores e empresas criaram fluxos de trabalho agênticos completos de deep research, atendimento ao cliente e muitos outros recursos. A Klarna desenvolveu um agente de suporte que resolve dois terços dos tíquetes, e a Clay cresceu dez vezes com um agente de vendas. O AgentKit usa a API Responses para ajudar os desenvolvedores a criar agentes com mais eficiência e confiabilidade.
Com a crescente complexidade dos fluxos de trabalho, os desenvolvedores precisam de uma visibilidade mais clara dos processos de trabalho. O Agent Builder(abre em uma nova janela) oferece uma interface visual para compor lógica com nós usando recursos de arrastar e soltar, além de conectar ferramentas e configurar proteções personalizadas. Ele permite execuções de prévias, configuração de avaliações em linha e controle completo de versões, recursos ideais para iterações rápidas.

Os desenvolvedores podem começar com uma tela em branco ou usar modelos incorporados.
Partindo de uma tela em branco, a equipe da Ramp desenvolveu um agente de compras em apenas algumas horas:
O Agent Builder transformou meses de orquestração complexa, programação personalizada e otimizações manuais em um trabalho de apenas algumas horas. A interface visual mantém as equipes de produtos, jurídica e de engenharia alinhadas, reduzindo em 70% os ciclos de interação e implementando um agente em produção em dois sprints, em vez de dois trimestres."
Da mesma forma, a LY Corporation, empresa líder de serviços de tecnologia e internet no Japão, usou o Agent Builder para criar um agente de assistente de trabalho em menos de duas horas.
"Com o Agent Builder, podemos inovar na orquestração de agentes, com engenheiros e especialistas colaborando na mesma interface. Criamos e executamos o nosso primeiro fluxo de trabalho multiagêntico em menos de duas horas, acelerando drasticamente a criação e implantação de agentes."
Além disso, estamos lançando um Connector Registry para que empresas controlem e mantenham dados em diversos espaços de trabalho e organizações. O Connector Registry(abre em uma nova janela) consolida fontes de dados em um único painel de administração para o ChatGPT e as APIs. O registro inclui todos os conectores incorporados, como Dropbox, Google Drive, Sharepoint e Microsoft Teams, além de MCPs de terceiros.
Os desenvolvedores também podem habilitar proteções(abre em uma nova janela) no Agent Builder, uma camada de segurança modular de código aberto que ajuda a proteger agentes contra comportamentos acidentais ou maliciosos. As proteções podem mascarar ou sinalizar dados pessoalmente identificáveis (PII), detectar jailbreaks e aplicar outras proteções, facilitando o desenvolvimento e a implantação de agentes confiáveis e seguros. Elas podem ser implantadas independentemente ou usando a biblioteca de proteções para Python(abre em uma nova janela) e JavaScript(abre em uma nova janela).
A implantação de interfaces de usuário de chat para agentes pode apresentar uma complexidade inesperada: lidar com fluxos de respostas, gerenciar tópicos, expor o pensamento dos modelos e desenvolver experiências de chat envolventes. O ChatKit simplifica a incorporação de agentes de chat que aparentam ser nativos do seu produto. Os agentes podem ser incorporados em aplicativos ou sites e personalizados de acordo com um tema ou marca.
"Usando o ChatKit, economizamos mais de duas semanas na criação de um agente de suporte para a nossa comunidade de desenvolvedores do Canva e integramos esse agente em menos de uma hora. Esse agente de suporte transforma a interação dos desenvolvedores com a documentação em uma experiência conversacional, facilitando a criação de aplicativos e as integrações no Canva."
O ChatKit já viabiliza diversos casos de uso, desde assistentes de conhecimento interno e guias de integração até agentes de atendimento ao cliente e pesquisa. O agente de atendimento ao cliente do HubSpot(abre em uma nova janela) é um exemplo:

A criação de agentes confiáveis e adequados para produção exige avaliações de desempenho rigorosas. Lançamos as avaliações(abre em uma nova janela) no ano passado para ajudar os desenvolvedores a testar prompts e medir o comportamento de modelos. Agora, estamos adicionando quatro novos recursos que facilitam ainda mais a criação de avaliações:
- Conjuntos de dados: crie rapidamente avaliações de agentes a partir do zero e amplie-as ao longo do tempo com avaliadores automatizados e anotações humanas.
- Pontuação de rastreio: realize análises completas de fluxos de trabalho agênticos e automatize as pontuações para identificar insuficiências.
- Otimização automática de prompts: gere prompts aprimorados com base em anotações humanas e resultados de avaliadores.
- Suporte a modelos de terceiros: avalie modelos de outros provedores na plataforma de avaliações da OpenAI.
Já observamos ganhos de desempenho importantes nos clientes que usam as avaliações.
"A plataforma de avaliação reduziu em mais de 50% o tempo de desenvolvimento de nossa estrutura multiagente de due diligence, além de aumentar em 30% a precisão dos agentes."

O ajuste fino por reforço(abre em uma nova janela) (RFT) permite que os desenvolvedores personalizem nossos modelos de raciocínio. Ele está disponível para o público em geral no OpenAI o4-mini e em beta privado no GPT‑5. Estamos trabalhando em conjunto com dezenas de clientes no refinamento do RFT para o GPT‑5 antes do lançamento para um público mais amplo.
Hoje, estamos apresentando dois novos recursos dessa versão beta do RFT para aumentar ainda mais o desempenho dos agentes:
- Chamadas personalizadas de ferramentas: treine modelos para chamar as ferramentas adequadas no momento certo para aprimorar a reflexão
- Avaliadores personalizados: defina critérios de avaliação personalizados para os aspectos mais importantes do seu caso de uso
A partir de hoje, o ChatKit e os novos recursos de avaliações estão disponíveis para todos os desenvolvedores. O Agent Builder está disponível na versão beta. Iniciamos o lançamento do Connector Registry na versão beta para alguns clientes de APIs, ChatGPT Enterprise e Edu com um console global do administrador (que permite aos proprietários globais gerenciar domínios, logins únicos e várias organizações de API). O console global do administrador é um (abre em uma nova janela)pré-requisito para habilitar o Connector Registry. Todas essas ferramentas estão incluídas no preço dos modelos de API padrão.
Pretendemos adicionar em breve ao ChatGPT uma API Workflows independente e opções de implantação de agentes.
Estamos ansiosos para ver o que você vai desenvolver!


