6 de octubre de 2025

Presentación de AgentKit

Nuevas herramientas para construir, implementar y optimizar agentes.

Cargando...

Hoy lanzamos AgentKit, un juego completo de herramientas para desarrolladores y empresas diseñado para construir, implementar y optimizar agentes. Hasta ahora, construir agentes significaba hacer malabares con distintas herramientas por separado, lo que implicaba una orquestación compleja sin versionado, la personalización de conectores, tuberías de evaluación manual, refinamiento de comandos y semanas de diseño de la interfaz de usuario antes del lanzamiento. Con AgentKit, los desarrolladores ahora pueden diseñar flujos de trabajo de manera visual e incrustar interfaces de usuario agénticas con más rapidez por medio de bloques de construcción nuevos como:

Constructor de agentes: un lienzo visual para crear y versionar flujos de trabajo con múltiples agentes
Registro de conectores: un espacio central para que los administradores gestionen la manera en que los datos y las herramientas se conectan a través de los productos de OpenAI
ChatKit: un conjunto de herramientas para incrustar experiencias personalizables de agentes conversacionales en tu producto.

También estamos ampliando las funcionalidades de evaluación con características nuevas como conjuntos de datos, calificación mediante trazas, optimización automática de comandos y soporte para modelos de terceros, a fin de medir y mejorar el rendimiento de los agentes.

Desde que lanzamos la API de Respuesta y el SDK de agentes⁠ en marzo, hemos visto a los desarrolladores y las empresas construir flujos de trabajo agénticos de extremo a extremo para investigación a fondo, atención al cliente y más. Klarna creó un agente de soporte⁠ que maneja dos tercios de todas las solicitudes de soporte y Clay multiplicó su crecimiento por 10⁠ con un agente de ventas. AgentKit construye sobre la API de Respuestas para ayudar a los desarrolladores a construir agentes con más eficiencia y confiabilidad.

Diseña flujos de trabajo con el Constructor de agentes

A medida que los flujos de trabajo se complican, los desarrolladores necesitan tener una visión más clara de la forma en que trabajan. El Constructor de agentes⁠(se abre en una nueva ventana) proporciona un lienzo de programación visual para construir la lógica mediante nodos de arrastrar y soltar, conectar herramientas y configurar medidas de protección personalizadas. Admite ejecuciones de vista previa, configuración de evaluación integrada y control de versiones completo, ideal para iterar rápidamente.

Vista de la interfaz de un flujo de automatización de servicio al cliente en una herramienta de programación visual. El lienzo muestra nodos conectados etiquetados como Iniciar, Medida de protección contra jailbreak, Agente de clasificación, Si/otra, Agente de devoluciones, Agente de retención, Agente de información, Medida de protección contra alucinaciones y Finalizar. Una barra lateral a la izquierda contiene una lista de los tipos de nodos disponibles, como Agente, Nota, Búsqueda de archivos, Medidas de protección, MCP y Aprobación del usuario. Los controles de la parte superior incluyen opciones de Evaluación, Código, Vista previa y Publicar.

Los constructores pueden empezar con un lienzo en blanco o con plantillas prediseñadas.

En Ramp, el equipo pasó de un lienzo en blanco a un agente de adquisiciones en cuestión de pocas horas:

El Constructor de agentes transformó un proceso que antes requería meses de orquestación compleja, código personalizado y optimizaciones manuales en uno que requiere solo un par de horas. El lienzo visual mantiene a los equipos de producto, asuntos legales e ingeniería alineados, reduciendo los ciclos de iteración en un 70 % y permitiendo poner en marcha un agente en dos ciclos en lugar de dos trimestres.

— Ramp

De modo similar, LY Corporation —una empresa japonesa líder en servicios tecnológicos y de internet— construyó un agente para asistir el trabajo con el Constructor de agentes en menos de dos horas.

"El constructor de agentes nos permitió orquestar a los agentes de una manera completamente nueva, con los ingenieros y los expertos en cada materia trabajando en conjunto en una sola interfaz. Construimos nuestro primer flujo de trabajo multiagéntico y lo ejecutamos en menos de dos horas, lo que significa que aceleramos el tiempo de creación e implementación de agentes de forma espectacular".

— LY Corporation

También lanzamos un Registro de conectores para que las empresas puedan gestionar y mantener los datos a través de múltiples espacios de trabajo y organizaciones. El Registro de conectores⁠(se abre en una nueva ventana) consolida fuentes de datos en un solo panel de administrador a través de ChatGPT y la API. El registro incluye todos los conectores preconstruidos como Dropbox, Google Drive, Sharepoint y Microsoft Teams, así como MCP de terceros.

Los desarrolladores también pueden habilitar Medidas de protección⁠(se abre en una nueva ventana) en el Constructor de agentes —una capa de seguridad modular y de código abierto que contribuye a proteger a los agentes contra errores accidentales o comportamientos maliciosos. Las medidas de protección pueden enmascarar o dar aviso de la existencia de información personal identificable (PII) detectar jailbreaks y aplicar otras salvaguardas, lo que facilita la construcción y la implementación de agentes más confiables y seguros. Las medidas de protección pueden implementarse en forma independiente o mediante la biblioteca de medidas de protección para Python⁠(se abre en una nueva ventana) y JavaScript⁠(se abre en una nueva ventana).

Integra experiencias de chat con agentes mediante ChatKit

La implementación de interfaces de usuario de chat puede ser sorprendentemente compleja, ya que implica manejar el flujo de respuestas, gestionar los hilos de conversación, mostrar el razonamiento del modelo y diseñar experiencias atractivas dentro del chat. ChatKit hace que sea muy simple incrustar agentes conversacionales que se perciban como nativos de tu producto. Puede incrustarse en aplicaciones o sitios web y personalizarse para que combine con tu tema o tu marca.

"Ahorramos más de dos semanas en el tiempo de construcción de un agente de soporte para nuestra comunidad de desarrolladores de Canva con ChatKit, y lo integramos en menos de una hora. Este agente de soporte transformará la manera en que los desarrolladores interactúan con nuestros documentos, al convertirla en una experiencia conversacional, y esto hace que construir aplicaciones e integraciones en Canva sea muy fácil".

— Canva

ChatKit ya impulsa una gama de casos de uso, desde asistentes de conocimientos internos y guías de incorporación hasta atención al cliente y agentes para investigación. El agente del servicio de atención al cliente deHubSpot⁠(se abre en una nueva ventana) es un ejemplo:

Vista del panel de la plataforma de Ramp que muestra una interfaz de gestión de gastos. El panel principal saluda al usuario, Daniel, y da una lista de solicitudes como “Solicitud de ChatGPT Business” (revisión pendiente) y “Solicitud de HubSpot” (borrador), junto con gastos recientes en aerolíneas, viáticos y software. A la derecha, un formulario de solicitud de software se abre para ChatGPT Business, con el detalle de 5 asientos a $125 por mes desde el 1 de octubre de 2025 al 1 de octubre de 2026, con el botón amarillo de “Enviar solicitud”.

Mide el rendimiento de los agentes con las nuevas funcionalidades de evaluación

La construcción de agentes confiables y listos para la producción requiere evaluaciones de desempeño rigurosas. El año pasado, lanzamos Evaluaciones⁠(se abre en una nueva ventana) para ayudar a los desarrolladores a probar los comandos y a medir el comportamiento del modelo. Ahora estamos agregando cuatro funcionalidades nuevas que facilitan aún más la construcción de evaluaciones:

Conjuntos de datos: construye evaluaciones de agentes con rapidez desde cero y extiéndelas a lo largo del tiempo con calificadores automatizados y anotaciones hechas por humanos.
Calificación mediante trazas: ejecuta evaluaciones de flujos de trabajo agénticos de extremo a extremo y automatiza las calificaciones para identificar las deficiencias.
Optimización automática de comandos: genera comandos mejorados sobre la base de anotaciones hechas por humanos y los resultados de los calificadores.
Soporte para modelos de terceros: evalúa los modelos de otros proveedores dentro de la plataforma de evaluaciones de OpenAI.

Ya hemos visto grandes beneficios en el rendimiento de los clientes que usan las evaluaciones.

"La plataforma de evaluación redujo en más de un 50 % el tiempo de desarrollo de nuestro marco de debida diligencia con múltiples agentes y aumentó la precisión de los agentes en un 30 %."

— Carlyle

Interfaz que muestra una tabla con un conjunto de datos con columnas para Clasificación, Tono, Retroalimentación y Precisión. Las filas muestran entradas con íconos de pulgares hacia arriba o pulgares hacia abajo, etiquetas de tono como Profesional, Amistoso, Grosero y Malo, y resultados sobre la precisión etiquetados como Aprobado o Desaprobado con un puntaje de 3,5. La barra de herramientas de arriba incluye opciones para Cargar, Columnas, Calificación, Generar resultado y Guardar.

Empuja los límites del rendimiento agéntico con el ajuste fino de refuerzo

Ajuste fino de refuerzo⁠(se abre en una nueva ventana) (RFT) permite que los desarrolladores personalicen nuestros modelos de razonamiento. Está disponible de forma general en OpenAI o4-mini y en la versión beta privada para GPT‑5. Estamos trabajando en estrecha colaboración con docenas de clientes para refinar el RFT para GPT‑5 antes de ampliar su lanzamiento.

Hoy presentamos dos funciones nuevas en esa versión beta de RFT diseñadas para llevar el rendimiento del agente a un nivel superior:

Llamadas a herramientas personalizadas: entrena a los modelos para que llamen a las herramientas adecuadas en el momento correcto para lograr una mejor calidad de razonamiento
Calificadores personalizados: fija criterios de evaluación personalizados para aquello que sea lo más importante en tu caso de uso

Precios y disponibilidad

A partir de hoy, ChatKit y las nuevas funcionalidades de evaluación estarán disponibles en general para todos los desarrolladores. El Constructor de agentes está disponible en versión beta y el Registro de conectores ha comenzado su lanzamiento beta para algunos clientes de API, ChatGPT Enterprise y Edu que disponen de una Consola de Administrador Global (donde los Propietarios globales pueden gestionar dominios, SSO y múltiples organizaciones de API). La consola de Administrador Global es ⁠(se abre en una nueva ventana)un prerrequisito para la habilitación del Registro de Conectores. Todas estas herramientas están incluidas dentro de la tarifa estándar de los modelos de la API.

Tenemos pensado agregar pronto a ChatGPT una API independiente para flujos de trabajo y opciones para la implementación de agentes.

No podemos esperar a ver lo que construyes.

Autor

OpenAI

Sigue leyendo

Ver todos

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 ya es el modelo preferido en Microsoft 365 Copilot

Producto9 jul 2026

GPT-5.6: inteligencia de vanguardia que escala con tu ambición

Producto9 jul 2026

ChatGPT ahora es un aliado para tu trabajo más ambicioso

Producto9 jul 2026