6 d’octubre del 2025

Presentem AgentKit

Noves eines per crear, desplegar i optimitzar agents.

S'està carregant…

Avui llancem AgentKit, un conjunt complet d'eines perquè desenvolupadors i empreses puguin crear, desplegar i optimitzar agents. Fins ara, crear agents significava fer malabars amb eines fragmentades: orquestració complexa sense versionat, connectors personalitzats, canals d'evals manuals, ajust d'indicacions i setmanes de feina de frontend abans del llançament. Amb AgentKit, ara els desenvolupadors poden dissenyar fluxos de treball visualment i incrustar interfícies agentic més ràpid amb nous components bàsics com:

Agent Builder: un llenç visual per crear i versionar fluxos de treball multiagent
Connector Registry: un lloc central perquè els administradors gestionin com es connecten les dades i les eines entre els productes d'OpenAI
ChatKit: un conjunt d'eines per incrustar experiències d'agent basades en xat i personalitzables al teu producte

També estem ampliant les capacitats d'avaluació amb noves funcions com conjunts de dades, qualificació de traces, optimització automatitzada d'indicacions i suport per a models de tercers per mesurar i millorar el rendiment dels agents.

Des que vam llançar l'API Responses i l'Agents SDK⁠ al març, hem vist desenvolupadors i empreses crear fluxos de treball agentic de cap a cap per a recerca profunda, assistència al client i molt més. Klarna va crear un agent d'assistència⁠ que gestiona dos terços de tots els tiquets i Clay va multiplicar per 10 el creixement⁠ amb un agent de vendes. AgentKit es basa en l'API Responses per ajudar els desenvolupadors a crear agents de manera més eficient i fiable.

Dissenya fluxos de treball amb Agent Builder

A mesura que els fluxos de treball d'agents es tornen més complexos, els desenvolupadors necessiten una visibilitat més clara de com funcionen. Agent Builder⁠(s'obre en una finestra nova) ofereix un llenç visual per compondre lògica amb nodes d'arrossegar i deixar anar, connectar eines i configurar guardrails personalitzats. Admet execucions de previsualització, configuració d'evals en línia i versionat complet: ideal per iterar ràpidament.

Vista d'interfície d'un flux d'automatització d'atenció al client en una eina visual de creació. El llenç mostra nodes connectats etiquetats com Start, Jailbreak guardrail, Classification agent, If/else, Return agent, Retention agent, Information agent, Hallucination guardrail i End. Una barra lateral a l'esquerra enumera tipus de node disponibles com Agent, Note, File search, Guardrails, MCP i User approval. Els controls superiors inclouen opcions per a Evaluate, Code, Preview i Publish.

Els creadors poden començar amb un llenç en blanc o amb plantilles predefinides.

A Ramp, l'equip va passar d'un llenç en blanc a un agent comprador en només unes hores:

Agent Builder va transformar el que abans requeria mesos d'orquestració complexa, codi personalitzat i optimitzacions manuals en només un parell d'hores. El llenç visual manté producte, legal i enginyeria alineats, reduint els cicles d'iteració en un 70% i posant un agent en producció en dos sprints en lloc de dos trimestres.»

— Ramp

De manera similar, LY Corporation —una empresa japonesa líder en tecnologia i serveis d'internet— va crear un agent assistent de feina amb Agent Builder en menys de dues hores.

«Agent Builder ens va permetre orquestrar agents d'una manera completament nova, amb enginyers i experts en la matèria col·laborant en una sola interfície. Vam crear el nostre primer flux de treball multiagentic i el vam executar en menys de dues hores, accelerant de manera espectacular el temps necessari per crear i desplegar agents.»

— LY Corporation

També llancem un Connector Registry perquè les empreses governin i mantinguin les dades en diversos espais de treball i organitzacions. El Connector Registry⁠(s'obre en una finestra nova) consolida les fonts de dades en un únic panell d'administració entre ChatGPT i l'API. El registre inclou tots els connectors preconfigurats com Dropbox, Google Drive, Sharepoint i Microsoft Teams, així com MCP de tercers.

Els desenvolupadors també poden activar Guardrails⁠(s'obre en una finestra nova) a Agent Builder, una capa de seguretat modular i de codi obert que ajuda a protegir els agents contra comportaments no desitjats o maliciosos. Guardrails pot emmascarar o marcar PII, detectar jailbreaks i aplicar altres salvaguardes, cosa que facilita crear i desplegar agents fiables i segurs. Guardrails es pot desplegar de manera independent o mitjançant la biblioteca guardrails per a Python⁠(s'obre en una finestra nova) i JavaScript⁠(s'obre en una finestra nova).

Incrusta experiències de xat agentic amb ChatKit

Desplegar interfícies de xat per a agents pot ser sorprenentment complex: gestionar respostes en streaming, gestionar fils, mostrar el model pensant i dissenyar experiències atractives dins del xat. ChatKit⁠(s'obre en una finestra nova) facilita incrustar agents basats en xat que semblen natius del teu producte. Es pot incrustar en aplicacions o llocs web i personalitzar-se perquè encaixi amb el teu tema o marca.

«Vam estalviar més de dues setmanes de temps creant un agent d'assistència per a la nostra comunitat de Canva Developers amb ChatKit, i el vam integrar en menys d'una hora. Aquest agent d'assistència transformarà la manera com els desenvolupadors interactuen amb la nostra documentació en convertir-la en una experiència conversacional, facilitant la creació d'aplicacions i integracions a Canva.»

— Canva

ChatKit ja impulsa una sèrie de casos d'ús, des d'assistents interns de coneixement i guies d'incorporació fins a assistència al client i agents de recerca. L'agent d'assistència al client de HubSpot⁠(s'obre en una finestra nova) n'és un exemple:

Vista del tauler de la plataforma Ramp que mostra una interfície de gestió de despeses. El panell principal saluda l'usuari, Daniel, i enumera sol·licituds com «Request for ChatGPT Business» (pendent de revisió) i «Request for HubSpot» (esborrany), juntament amb despeses recents d'aerolínies, viatges compartits i programari. A la dreta, hi ha obert un formulari de sol·licitud de programari per a ChatGPT Business, amb 5 llicències a 125 $ al mes des de l'1 d'octubre de 2025 fins a l'1 d'octubre de 2026, amb un botó groc «Submit request».

Mesura el rendiment dels agents amb les noves capacitats d'Evals

Crear agents fiables i preparats per a producció requereix avaluacions de rendiment rigoroses. L'any passat vam llançar Evals⁠(s'obre en una finestra nova) per ajudar els desenvolupadors a provar indicacions i mesurar el comportament del model. Ara hi afegim quatre noves capacitats que fan encara més fàcil crear evals:

Conjunts de dades: crea ràpidament evals d'agents des de zero i amplia'ls amb el temps amb qualificadors automatitzats i anotacions humanes.
Qualificació de traces: executa avaluacions de cap a cap de fluxos de treball agentic i automatitza la qualificació per identificar mancances.
Optimització automatitzada d'indicacions: genera indicacions millorades a partir d'anotacions humanes i resultats dels qualificadors.
Suport per a models de tercers: avalua models d'altres proveïdors dins la plataforma OpenAI Evals.

Ja hem vist grans millores de rendiment en clients que fan servir Evals.

«La plataforma d'avaluació va reduir en més d'un 50% el temps de desenvolupament del nostre marc de due diligence multiagent i va augmentar la precisió dels agents en un 30%.»

— Carlyle

Interfície que mostra una taula de conjunt de dades amb columnes de Valoració, To, Comentaris i Precisió. Les files mostren entrades amb icones de polze amunt o avall, etiquetes de to com ara Professional, Friendly, Rude i Bad, i resultats de precisió marcats com a Pass o Fail amb una puntuació de 3,5. La barra d'eines superior inclou opcions per a Upload, Columns, Grade, Generate output i Save.

Impulsa el rendiment dels agents amb l'afinament per reforç

Afinament per reforç⁠(s'obre en una finestra nova) (RFT) permet als desenvolupadors personalitzar els nostres models de raonament. Està disponible de manera general a OpenAI o4-mini i en beta privada per a GPT‑5. Estem treballant estretament amb desenes de clients per perfeccionar l'RFT per a GPT‑5 abans d'una disponibilitat més àmplia.

Avui presentem dues funcions noves en aquesta beta d'RFT dissenyades per impulsar encara més el rendiment dels agents:

Crides d'eines personalitzades: entrena models perquè facin servir les eines adequades en el moment adequat per obtenir un millor raonament
Qualificadors personalitzats: estableix criteris d'avaluació personalitzats per al que més importa en el teu cas d'ús

Preus i disponibilitat

A partir d'avui, ChatKit i les noves capacitats d'Evals estan disponibles de manera general per a tots els desenvolupadors. Agent Builder està disponible en beta, i Connector Registry comença el seu desplegament beta per a alguns clients de l'API, ChatGPT Enterprise i Edu amb una Global Admin Console⁠(s'obre en una finestra nova) (on els Global Owners poden gestionar dominis, SSO i múltiples organitzacions d'API). La Global Admin Console és un requisit previ per activar Connector Registry. Totes aquestes eines s'inclouen amb el preu estàndard dels models de l'API.

Tenim previst afegir aviat una API de Workflows independent i opcions de desplegament d'agents a ChatGPT.

Tenim moltes ganes de veure què creeu.

Autor

OpenAI

Continuar llegint

Veure-ho tot

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 ja és el model preferit a Microsoft 365 Copilot

Producte9 de jul. del 2026

GPT-5.6: Intel·ligència d’avantguarda que escala amb la teva ambició

Producte9 de jul. del 2026

ChatGPT Work ara és un aliat per a la teva feina més ambiciosa

Producte9 de jul. del 2026