Ir al contenido principal
OpenAI

15 de abril de 2026

Producto

La próxima evolución del SDK de agentes

El SDK de agentes actualizado ayuda a los desarrolladores a crear agentes que pueden inspeccionar archivos, ejecutar comandos, editar código y trabajar en tareas de largo plazo dentro de entornos sandbox controlados.

Cargando…

Estamos añadiendo nuevas capacidades al SDK de agentes que ofrecen a los desarrolladores una infraestructura estandarizada, fácil de usar y diseñada para los modelos de OpenAI. Incluye un arnés con ejecución nativa del modelo que permite a los agentes trabajar con archivos y herramientas en un equipo, junto con ejecución en sandbox para hacerlo de forma segura.

Por ejemplo, los desarrolladores pueden dar a un agente un área de trabajo controlada, instrucciones claras y las herramientas que necesita para analizar la información:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Los desarrolladores necesitan más que los mejores modelos para crear agentes útiles: necesitan sistemas que respalden cómo los agentes analizan archivos, ejecutan comandos, escriben código y siguen funcionando a lo largo de muchos pasos.

Los sistemas actuales implican concesiones cuando los equipos pasan de prototipos a producción. Los marcos de trabajo independientes del modelo son flexibles, pero no aprovechan al máximo las capacidades de los modelos más avanzados; los SDK de proveedores pueden estar más cerca del modelo, pero suelen ofrecer poca visibilidad del entorno de ejecución; y las API de agentes gestionadas simplifican la implementación, pero limitan dónde se ejecutan los agentes y cómo acceden a datos sensibles.

Esto es lo que comentan algunos de los clientes que han probado el nuevo SDK con nosotros:

«GPT-5.4 establece un nuevo estándar para el trabajo legal intensivo en documentos. En nuestra evaluación BigLaw Bench, obtuvo un puntaje del 91 %. En comparación con otros modelos, GPT-5.4 es actualmente mejor para estructurar análisis transaccionales complejos, mantener la precisión en contratos extensos y ofrecer el alto nivel de detalle que requieren los profesionales del derecho».
— Niko Grupen, jefe de investigación aplicada en Harvey

Un arnés más capaz para el ciclo del agente

Con el lanzamiento de hoy, el arnés del SDK de agentes es más eficiente para los agentes que trabajan con documentos, archivos y sistemas. Ahora incorpora memoria configurable, orquestación adaptada a entornos sandbox, herramientas de sistema de archivos similares a las de Codex e integraciones estandarizadas con componentes que ya son comunes en los sistemas de agentes más avanzados.

Estos elementos básicos incluyen el uso de herramientas a través de MCP(se abre en una ventana nueva), la divulgación progresiva a través de skills(se abre en una ventana nueva), instrucciones personalizadas a través de AGENTS.md(se abre en una ventana nueva), ejecución de código usando la herramienta shell(se abre en una ventana nueva), edición de archivos usando la herramienta apply patch(se abre en una ventana nueva) y más. El arnés seguirá incorporando nuevos patrones y componentes para agentes, de modo que los desarrolladores dediquen menos tiempo a actualizar la infraestructura central y más a la lógica específica del dominio que hace útiles a sus agentes.

Diagrama que muestra cómo el Agent SDK conecta la entrada del usuario, los modelos y las herramientas para crear agentes de IA.
Diagrama que muestra cómo crear agentes de IA con el SDK de agentes usando modelos, herramientas y orquestación.

El arnés también ayuda a los desarrolladores a sacar mejor provecho de las capacidades de los modelos de vanguardia al alinear la ejecución con la forma en que estos modelos rinden mejor. Esto mantiene a los agentes más cerca de su modo natural de operación, lo que mejora la fiabilidad y el rendimiento en tareas complejas, especialmente cuando el trabajo es prolongado o se coordina entre diversas herramientas y sistemas.

Además, somos conscientes de que cada producto es único y rara vez encaja perfectamente en un molde. Por eso, hemos diseñado el SDK de agentes para adaptarse a esta diversidad. Los desarrolladores disponen de una base lista para usar, pero flexible, lo que facilita su integración en su propia pila tecnológica, incluido el uso de herramientas, la memoria y el entorno sandbox.

Ejecución nativa en sandbox

El SDK de agentes actualizado admite la ejecución en entorno aislado de forma nativa, por lo que los agentes pueden ejecutarse en entornos informáticos controlados con los archivos, herramientas y dependencias que necesitan para una tarea.

Muchos agentes necesitan un área de trabajo donde puedan leer y escribir archivos, instalar dependencias, ejecutar código y utilizar herramientas de forma segura. La compatibilidad integrada con entornos sandbox proporciona a los desarrolladores esa capa de ejecución desde el inicio, sin tener que configurarla por su cuenta.

Los desarrolladores pueden traer su propio sandbox o usar la compatibilidad integrada con Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop y Vercel.

Para hacer que esos entornos sean portátiles entre proveedores, el SDK también introduce una abstracción de archivo de manifiesto para describir el espacio de trabajo del agente. Los desarrolladores pueden montar archivos locales, definir directorios de salida e incorporar datos de proveedores de almacenamiento, incluidos AWS S3, Google Cloud Storage, Azure Blob Storage y Cloudflare R2.

Esto proporciona a los desarrolladores una forma coherente de configurar el entorno del agente, desde el prototipo en local hasta su despliegue en producción. También ofrece al modelo un entorno de trabajo predecible: dónde encontrar las entradas, dónde generar las salidas y cómo mantener el trabajo organizado durante tareas de larga duración.

Logotipos de Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Separar el arnés del cómputo para mejorar la seguridad, la resiliencia y la escalabilidad.

Los sistemas de agentes deben diseñarse asumiendo intentos de inyección de prompts y exfiltración. Separar el arnés de ejecución del cómputo permite mantener las credenciales fuera de los entornos donde se ejecuta código generado por el modelo.

También permite ejecuciones de larga duración. Cuando el estado del agente se externaliza, la pérdida de un contenedor sandbox no implica perder la ejecución. Gracias a las capturas de estado y a la rehidratación nativas, el SDK de agentes puede restaurar el estado del agente en un contenedor nuevo y retomar la ejecución desde el último punto de control si el entorno original falla o caduca.

Por último, hace que los agentes sean más escalables. Las ejecuciones de agentes pueden usar uno o varios sandboxes, invocarlos solo cuando sea necesario, enrutar subagentes a entornos aislados y ejecutar el trabajo en paralelo entre contenedores para lograr una ejecución más rápida.

Diagrama de flujo que ilustra cómo el SDK de agente permite a los agentes de IA utilizar recursos de cómputo adicionales para tareas más complejas.
Diagrama que muestra cómo los agentes de IA creados con el SDK de agentes pueden orquestar sistemas de computación independientes, permitiendo que las cargas de trabajo se ejecuten de forma autónoma mientras admiten tareas más avanzadas.

Precios y disponibilidad

Estas nuevas capacidades del SDK de agentes están disponibles de forma general para todos los clientes a través de la API y usan la tarifa estándar de la API, en función de los tokens y el uso de herramientas.

Próximos pasos

A medida que seguimos desarrollando el SDK de agentes, ampliamos las posibilidades de creación, lo que facilita llevar agentes más avanzados a producción con menos infraestructura personalizada, sin perder la flexibilidad y el control necesarios para adaptarlos a tus propios entornos.

Las nuevas capacidades de arnés y sandbox se lanzarán primero en Python, con soporte para TypeScript previsto en una versión futura. También añadiremos capacidades adicionales de los agentes, como el modo de código y los subagentes, tanto en Python como en TypeScript.

Además, queremos contribuir a integrar, con el tiempo, el ecosistema más amplio de agentes, con soporte para más proveedores de sandbox, más integraciones y más formas de que los desarrolladores incorporen el SDK en las herramientas y sistemas que ya utilizan.

Autor

OpenAI