6 de octubre de 2025

Presentamos AgentKit

Nuevas herramientas para crear, implementar y optimizar agentes.

Cargando…

Hoy lanzamos AgentKit, un conjunto completo de herramientas para que desarrolladores y empresas puedan crear, implementar y optimizar agentes. Hasta ahora, crear agentes implicaba lidiar con herramientas fragmentadas: orquestación compleja sin control de versiones, conectores personalizados, procesos manuales de evaluación, ajuste de indicaciones y semanas de trabajo en la interfaz antes del lanzamiento. Con AgentKit, los desarrolladores pueden ahora diseñar flujos de trabajo de forma visual e integrar interfaces con agentes mucho más rápido usando estos nuevos bloques de construcción:

Constructor de agentes: un lienzo visual para crear y versionar flujos de trabajo con varios agentes.
Registro de conectores: un lugar centralizado para que los administradores gestionen cómo se conectan los datos y las herramientas en todos los productos de OpenAI.
ChatKit: un conjunto de herramientas para integrar experiencias de agentes conversacionales personalizables en tu producto.

También estamos ampliando nuestras capacidades de evaluación con nuevas funciones como conjuntos de datos, evaluación por muestreo, optimización automática de indicaciones y compatibilidad con modelos de terceros para medir y mejorar el rendimiento de los agentes.

Desde el lanzamiento de la API de respuestas y el SDK de agentes⁠ en marzo, hemos visto a desarrolladores y empresas crear flujos de trabajo de agentes de extremo a extremo para investigación en profundidad, asistencia al cliente y mucho más. Klarna creó un agente de soporte⁠ que gestiona dos tercios de todas las incidencias y Clay multiplicó por 10 su crecimiento⁠ con un agente de ventas. AgentKit se basa en la API de respuestas para ayudar a los desarrolladores a crear agentes de forma más eficiente y fiable.

Diseña flujos de trabajo con el Agent Builder

A medida que los flujos de trabajo de agentes se vuelven más complejos, los desarrolladores necesitan una visión más clara de cómo funcionan. Agent Builder⁠(se abre en una ventana nueva) ofrece un lienzo visual para componer la lógica con nodos de arrastrar y soltar, conectar herramientas y configurar medidas de protección personalizadas. Permite ejecutar pruebas previas, configurar evaluaciones integradas y gestionar versiones completas, lo que lo hace ideal para iterar con rapidez.

Vista de interfaz de un flujo de automatización de atención al cliente en una herramienta de diseño visual. El lienzo muestra nodos conectados con las etiquetas Inicio, Medida de protección contra elusión, Agente de clasificación, Condicional, Agente de retorno, Agente de retención, Agente de información, Medida de protección contra alucinaciones y Fin. Una barra lateral a la izquierda muestra los tipos de nodo disponibles como Agente, Nota, Búsqueda en archivos, Medidas de protección, MCP y Aprobación del usuario. Los controles superiores incluyen opciones para Evaluar, Código, Vista previa y Publicar.

Puedes empezar con un lienzo en blanco o con plantillas predefinidas.

En Ramp, el equipo pasó de una hoja en blanco a un agente de compras en solo unas horas.

El Creador de agentes transformó lo que antes requería meses de orquestación compleja, código personalizado y optimizaciones manuales en solo un par de horas. El lienzo visual permite que los equipos de producto, normativa e ingeniería trabajen con una visión común, lo que reduce los ciclos de iteración en un 70 % y permite poner en marcha un agente en dos ciclos de desarrollo en lugar de dos trimestres.

— Ramp

De forma similar, LY Corporation, una empresa líder japonesa de tecnología y servicios de Internet, creó un asistente de trabajo con el Creador de agentes en menos de dos horas.

«Agent Builder nos permitió orquestar agentes de una forma completamente nueva, con ingenieros y expertos colaborando en una sola interfaz. Creamos nuestro primer flujo basado en múltiples agentes y lo ejecutamos en menos de dos horas, acelerando radicalmente el proceso de creación y despliegue de agentes».

— LY Corporation

También lanzamos un Registro de conectores para que las empresas gestionen y mantengan los datos entre múltiples áreas de trabajo y organizaciones. El Registro de conectores⁠(se abre en una ventana nueva) consolida las fuentes de datos en un único panel de administración para ChatGPT y la API. El registro incluye todos los conectores preconfigurados como Dropbox, Google Drive, Sharepoint y Microsoft Teams, así como MCP de terceros.

Los desarrolladores también pueden activar el sistema de protección Guardrails⁠(se abre en una ventana nueva) en Agent Builder: una capa de seguridad modular y de código abierto que ayuda a proteger a los agentes frente a comportamientos no deseados o malintencionados. El sistema de protección puede enmascarar o marcar información personal, detectar intentos de elusión y aplicar otras medidas de protección, lo que facilita la creación y el despliegue de agentes seguros y fiables. Este sistema puede implementarse de forma independiente o mediante la biblioteca correspondiente para Python⁠(se abre en una ventana nueva) y JavaScript⁠(se abre en una ventana nueva).

Incorpora experiencias de chat basadas en agentes con ChatKit

Implementar interfaces de chat para agentes puede resultar sorprendentemente complejo: gestionar respuestas en tiempo real, manejar conversaciones, mostrar el razonamiento del modelo y diseñar interacciones atractivas en el propio chat. ChatKit simplifica la integración de agentes conversacionales que se sienten nativos en tu producto. Puede integrarse en aplicaciones o sitios web y personalizarse para adaptarse a tu estilo o marca.

«Nos ahorramos más de dos semanas creando un agente de soporte para la comunidad de desarrolladores de Canva con ChatKit y lo integramos en menos de una hora. Este agente de soporte transformará la forma en que los desarrolladores interactúan con nuestra documentación, convirtiéndola en una experiencia conversacional que facilita la creación de aplicaciones e integraciones en Canva».

— Canva

ChatKit ya da soporte a una amplia variedad de casos de uso, desde asistentes de conocimiento internos y guías de incorporación hasta agentes de asistencia al cliente y de investigación. El agente de atención al cliente de HubSpot⁠(se abre en una ventana nueva) es un ejemplo:

Vista del panel de control de la plataforma Ramp que muestra una interfaz de gestión de gastos. El panel principal da la bienvenida al usuario, Daniel, y enumera solicitudes como «Solicitud para ChatGPT Business» (pendiente de revisión) y «Solicitud para HubSpot» (borrador), junto con los gastos recientes en aerolíneas, transporte y software. A la derecha, se muestra un formulario de solicitud de software para ChatGPT Business, con 5 licencias por 125 USD al mes desde el 1 de octubre de 2025 hasta el 1 de octubre de 2026, y un botón amarillo que dice «Enviar solicitud».

Evalúa el rendimiento de los agentes con las nuevas funciones de Evals

Crear agentes fiables y listos para producción requiere evaluaciones de rendimiento rigurosas. El año pasado, lanzamos Evals⁠(se abre en una ventana nueva) para ayudar a los desarrolladores a probar indicaciones y medir el comportamiento del modelo. Ahora añadimos cuatro funciones nuevas que facilitan aún más la creación de evaluaciones:

Conjuntos de datos: crea evaluaciones para agentes desde cero y amplíalas con el tiempo gracias a calificadores automáticos y anotaciones humanas.
Evaluación por muestreo: ejecuta análisis de principio a fin sobre los flujos basados en agentes y automatiza la evaluación para detectar puntos débiles.
Optimización automática de indicaciones: genera indicaciones mejoradas a partir de anotaciones humanas y resultados de evaluación.
Compatibilidad con modelos de terceros: evalúa modelos de otros proveedores dentro de la plataforma Evals de OpenAI.

Ya hemos observado mejoras significativas en el rendimiento por parte de los clientes que usan Evals.

«La plataforma de evaluación redujo el tiempo de desarrollo de nuestro sistema de validación con múltiples agentes en más del 50 % y aumentó la precisión del agente en un 30 %».

— Carlyle

Interfaz que muestra una tabla con columnas de calificación, estilo, comentarios y precisión. Las filas contienen iconos de pulgar hacia arriba o abajo, etiquetas de estilo como «Profesional», «Cercano», «Grosero» y «Malo», y resultados de precisión marcados como «Aprobado» o «Suspenso» con una puntuación de 3,5. La barra superior incluye opciones para cargar, columnas, evaluar, generar resultados y guardar.

Mejora el rendimiento de los agentes con optimización por refuerzo

La optimización por refuerzo⁠(se abre en una ventana nueva) (RFT, por sus siglas en inglés) permite a los desarrolladores personalizar nuestros modelos razonadores. Está disponible de forma general para OpenAI o4-mini y en beta privada para GPT‑5. Estamos colaborando estrechamente con decenas de clientes para perfeccionar la RFT de GPT‑5 antes del lanzamiento general.

Hoy presentamos dos funciones nuevas en esa beta de RFT diseñadas para mejorar aún más el rendimiento de los agentes:

Llamadas personalizadas a herramientas: entrena a los modelos para que llamen a las herramientas adecuadas en el momento oportuno y mejoren la capacidad de razonamiento
Evaluadores personalizados: define criterios de evaluación a medida en función de lo que más importa en tu caso de uso

Precios y disponibilidad

Desde hoy, ChatKit y las nuevas funciones de Evals están disponibles para todos los desarrolladores. Agent Builder está disponible en beta y el Registro de conectores ha comenzado el despliegue beta para algunos clientes de API, ChatGPT Enterprise y ChatGPT Edu que cuenten con un Panel de administración global (donde los propietarios globales pueden gestionar dominios, inicio de sesión único y varias organizaciones de API). El Panel de administración global es un ⁠(se abre en una ventana nueva)requisito previo para activar el Registro de conectores. Todas estas herramientas están incluidas con los precios estándar de los modelos de API.

Pronto incorporaremos una API independiente para flujos de trabajo y opciones de implementación de agentes en ChatGPT.

Estamos deseando ver qué lo que creas.

Autor

OpenAI

Sigue leyendo

Ver todo

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 ya es el modelo preferido en Microsoft 365 Copilot

Producto9 jul 2026

GPT-5.6: inteligencia de vanguardia que crece con tu ambición

Producto9 jul 2026

ChatGPT es ahora un aliado para tu trabajo más ambicioso

Producto9 jul 2026