Presentación de AgentKit
Nuevas herramientas para construir, implementar y optimizar agentes.
Hoy lanzamos AgentKit, un juego completo de herramientas para desarrolladores y empresas diseñado para construir, implementar y optimizar agentes. Hasta ahora, construir agentes significaba hacer malabares con distintas herramientas por separado, lo que implicaba una orquestación compleja sin versionado, la personalización de conectores, tuberías de evaluación manual, refinamiento de comandos y semanas de diseño de la interfaz de usuario antes del lanzamiento. Con AgentKit, los desarrolladores ahora pueden diseñar flujos de trabajo de manera visual e incrustar interfaces de usuario agénticas con más rapidez por medio de bloques de construcción nuevos como:
- Constructor de agentes: un lienzo visual para crear y versionar flujos de trabajo con múltiples agentes
- Registro de conectores: un espacio central para que los administradores gestionen la manera en que los datos y las herramientas se conectan a través de los productos de OpenAI
- ChatKit: un conjunto de herramientas para incrustar experiencias personalizables de agentes conversacionales en tu producto.
También estamos ampliando las funcionalidades de evaluación con características nuevas como conjuntos de datos, calificación mediante trazas, optimización automática de comandos y soporte para modelos de terceros, a fin de medir y mejorar el rendimiento de los agentes.
Desde que lanzamos la API de Respuesta y el SDK de agentes en marzo, hemos visto a los desarrolladores y las empresas construir flujos de trabajo agénticos de extremo a extremo para investigación a fondo, atención al cliente y más. Klarna creó un agente de soporte que maneja dos tercios de todas las solicitudes de soporte y Clay multiplicó su crecimiento por 10 con un agente de ventas. AgentKit construye sobre la API de Respuestas para ayudar a los desarrolladores a construir agentes con más eficiencia y confiabilidad.
A medida que los flujos de trabajo se complican, los desarrolladores necesitan tener una visión más clara de la forma en que trabajan. El Constructor de agentes(se abre en una nueva ventana) proporciona un lienzo de programación visual para construir la lógica mediante nodos de arrastrar y soltar, conectar herramientas y configurar medidas de protección personalizadas. Admite ejecuciones de vista previa, configuración de evaluación integrada y control de versiones completo, ideal para iterar rápidamente.

Los constructores pueden empezar con un lienzo en blanco o con plantillas prediseñadas.
En Ramp, el equipo pasó de un lienzo en blanco a un agente de adquisiciones en cuestión de pocas horas:
El Constructor de agentes transformó un proceso que antes requería meses de orquestación compleja, código personalizado y optimizaciones manuales en uno que requiere solo un par de horas. El lienzo visual mantiene a los equipos de producto, asuntos legales e ingeniería alineados, reduciendo los ciclos de iteración en un 70 % y permitiendo poner en marcha un agente en dos ciclos en lugar de dos trimestres.
De modo similar, LY Corporation —una empresa japonesa líder en servicios tecnológicos y de internet— construyó un agente para asistir el trabajo con el Constructor de agentes en menos de dos horas.
"El constructor de agentes nos permitió orquestar a los agentes de una manera completamente nueva, con los ingenieros y los expertos en cada materia trabajando en conjunto en una sola interfaz. Construimos nuestro primer flujo de trabajo multiagéntico y lo ejecutamos en menos de dos horas, lo que significa que aceleramos el tiempo de creación e implementación de agentes de forma espectacular".
También lanzamos un Registro de conectores para que las empresas puedan gestionar y mantener los datos a través de múltiples espacios de trabajo y organizaciones. El Registro de conectores(se abre en una nueva ventana) consolida fuentes de datos en un solo panel de administrador a través de ChatGPT y la API. El registro incluye todos los conectores preconstruidos como Dropbox, Google Drive, Sharepoint y Microsoft Teams, así como MCP de terceros.
Los desarrolladores también pueden habilitar Medidas de protección(se abre en una nueva ventana) en el Constructor de agentes —una capa de seguridad modular y de código abierto que contribuye a proteger a los agentes contra errores accidentales o comportamientos maliciosos. Las medidas de protección pueden enmascarar o dar aviso de la existencia de información personal identificable (PII) detectar jailbreaks y aplicar otras salvaguardas, lo que facilita la construcción y la implementación de agentes más confiables y seguros. Las medidas de protección pueden implementarse en forma independiente o mediante la biblioteca de medidas de protección para Python(se abre en una nueva ventana) y JavaScript(se abre en una nueva ventana).
La implementación de interfaces de usuario de chat puede ser sorprendentemente compleja, ya que implica manejar el flujo de respuestas, gestionar los hilos de conversación, mostrar el razonamiento del modelo y diseñar experiencias atractivas dentro del chat. ChatKit hace que sea muy simple incrustar agentes conversacionales que se perciban como nativos de tu producto. Puede incrustarse en aplicaciones o sitios web y personalizarse para que combine con tu tema o tu marca.
"Ahorramos más de dos semanas en el tiempo de construcción de un agente de soporte para nuestra comunidad de desarrolladores de Canva con ChatKit, y lo integramos en menos de una hora. Este agente de soporte transformará la manera en que los desarrolladores interactúan con nuestros documentos, al convertirla en una experiencia conversacional, y esto hace que construir aplicaciones e integraciones en Canva sea muy fácil".
ChatKit ya impulsa una gama de casos de uso, desde asistentes de conocimientos internos y guías de incorporación hasta atención al cliente y agentes para investigación. El agente del servicio de atención al cliente deHubSpot(se abre en una nueva ventana) es un ejemplo:

La construcción de agentes confiables y listos para la producción requiere evaluaciones de desempeño rigurosas. El año pasado, lanzamos Evaluaciones(se abre en una nueva ventana) para ayudar a los desarrolladores a probar los comandos y a medir el comportamiento del modelo. Ahora estamos agregando cuatro funcionalidades nuevas que facilitan aún más la construcción de evaluaciones:
- Conjuntos de datos: construye evaluaciones de agentes con rapidez desde cero y extiéndelas a lo largo del tiempo con calificadores automatizados y anotaciones hechas por humanos.
- Calificación mediante trazas: ejecuta evaluaciones de flujos de trabajo agénticos de extremo a extremo y automatiza las calificaciones para identificar las deficiencias.
- Optimización automática de comandos: genera comandos mejorados sobre la base de anotaciones hechas por humanos y los resultados de los calificadores.
- Soporte para modelos de terceros: evalúa los modelos de otros proveedores dentro de la plataforma de evaluaciones de OpenAI.
Ya hemos visto grandes beneficios en el rendimiento de los clientes que usan las evaluaciones.
"La plataforma de evaluación redujo en más de un 50 % el tiempo de desarrollo de nuestro marco de debida diligencia con múltiples agentes y aumentó la precisión de los agentes en un 30 %."

Ajuste fino de refuerzo(se abre en una nueva ventana) (RFT) permite que los desarrolladores personalicen nuestros modelos de razonamiento. Está disponible de forma general en OpenAI o4-mini y en la versión beta privada para GPT‑5. Estamos trabajando en estrecha colaboración con docenas de clientes para refinar el RFT para GPT‑5 antes de ampliar su lanzamiento.
Hoy presentamos dos funciones nuevas en esa versión beta de RFT diseñadas para llevar el rendimiento del agente a un nivel superior:
- Llamadas a herramientas personalizadas: entrena a los modelos para que llamen a las herramientas adecuadas en el momento correcto para lograr una mejor calidad de razonamiento
- Calificadores personalizados: fija criterios de evaluación personalizados para aquello que sea lo más importante en tu caso de uso
A partir de hoy, ChatKit y las nuevas funcionalidades de evaluación estarán disponibles en general para todos los desarrolladores. El Constructor de agentes está disponible en versión beta y el Registro de conectores ha comenzado su lanzamiento beta para algunos clientes de API, ChatGPT Enterprise y Edu que disponen de una Consola de Administrador Global (donde los Propietarios globales pueden gestionar dominios, SSO y múltiples organizaciones de API). La consola de Administrador Global es (se abre en una nueva ventana)un prerrequisito para la habilitación del Registro de Conectores. Todas estas herramientas están incluidas dentro de la tarifa estándar de los modelos de la API.
Tenemos pensado agregar pronto a ChatGPT una API independiente para flujos de trabajo y opciones para la implementación de agentes.
No podemos esperar a ver lo que construyes.


