La propera evolució de l’Agents SDK
L’Agents SDK actualitzat ajuda els desenvolupadors a crear agents que poden inspeccionar fitxers, executar ordres, editar codi i treballar en tasques de llarg abast dins d’entorns sandbox controlats.
Presentem noves capacitats per a l’Agents SDK que ofereixen als desenvolupadors una infraestructura estandarditzada, fàcil per començar i construïda correctament per als models d’OpenAI: un harness natiu del model que permet als agents treballar entre fitxers i eines en un ordinador, a més d’execució sandbox nativa per fer aquest treball amb seguretat.
Per exemple, els desenvolupadors poden donar a un agent un espai de treball controlat, instruccions explícites i les eines que necessita per inspeccionar proves:
Els desenvolupadors necessiten més que els millors models per crear agents útils: necessiten sistemes que admetin com els agents inspeccionen fitxers, executen ordres, escriuen codi i continuen treballant al llarg de molts passos.
Els sistemes que existeixen avui comporten compensacions a mesura que els equips passen de prototips a producció. Els frameworks agnòstics respecte del model són flexibles, però no aprofiten del tot les capacitats dels models d’avantguarda; els SDK dels proveïdors de models poden estar més a prop del model, però sovint no ofereixen prou visibilitat sobre el harness; i les API d’agents gestionats poden simplificar el desplegament, però limiten on s’executen els agents i com accedeixen a dades sensibles.
Això és el que han dit alguns dels clients que van provar el nou SDK amb nosaltres:
«L’Agents SDK actualitzat ens ha permès automatitzar en producció un flux de treball crític de registres clínics que els enfocaments anteriors no podien gestionar amb prou fiabilitat. Per a nosaltres, la diferència no era només extreure les metadades correctes, sinó entendre correctament els límits de cada episodi en registres llargs i complexos. Com a resultat, podem entendre més ràpidament què passa amb cada pacient en una visita determinada, ajudant els membres amb les seves necessitats assistencials i millorant la seva experiència amb nosaltres.»
Amb el llançament d’avui, el harness de l’Agents SDK esdevé més capaç per a agents que treballen amb documents, fitxers i sistemes. Ara afegeix memòria configurable, orquestració conscient del sandbox, eines de sistema de fitxers semblants a Codex i integracions estandarditzades amb primitives que s’estan convertint en habituals en els sistemes d’agents d’avantguarda.
Aquestes primitives inclouen l’ús d’eines mitjançant MCP(s'obre en una finestra nova), divulgació progressiva mitjançant habilitats(s'obre en una finestra nova), instruccions personalitzades mitjançant AGENTS.md(s'obre en una finestra nova), execució de codi amb l’eina shell(s'obre en una finestra nova), edició de fitxers amb l’eina apply patch(s'obre en una finestra nova) i més. El harness continuarà incorporant nous patrons i primitives agentives amb el temps, de manera que els desenvolupadors puguin dedicar menys temps a actualitzacions de la infraestructura bàsica i més temps a la lògica específica del domini que fa útils els seus agents.
El harness també ajuda els desenvolupadors a desbloquejar més capacitat d’un model d’avantguarda alineant l’execució amb la manera com aquests models rendeixen millor. Això manté els agents més a prop del patró operatiu natural del model i millora la fiabilitat i el rendiment en tasques complexes, especialment quan el treball és de llarga durada o es coordina entre un conjunt divers d’eines i sistemes.
A més, entenem que cada producte és únic i poques vegades encaixa perfectament en un motlle. Hem dissenyat l’Agents SDK per donar suport a aquesta diversitat. Els desenvolupadors obtenen un harness llest per usar però flexible, cosa que facilita adaptar-lo a la seva pròpia pila, incloent-hi l’ús d’eines, la memòria i l’entorn sandbox.
L’Agents SDK actualitzat admet l’execució sandbox de manera nativa, de manera que els agents poden executar-se en entorns informàtics controlats amb els fitxers, les eines i les dependències que necessiten per a una tasca.
Molts agents útils necessiten un espai de treball on puguin llegir i escriure fitxers, instal·lar dependències, executar codi i utilitzar eines amb seguretat. El suport sandbox natiu ofereix als desenvolupadors aquesta capa d’execució de sèrie, en lloc d’obligar-los a muntar-la ells mateixos.
Els desenvolupadors poden portar el seu propi sandbox o utilitzar el suport integrat per a Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop i Vercel.
Per fer que aquests entorns siguin portables entre proveïdors, l’SDK també introdueix una abstracció de manifest per descriure l’espai de treball de l’agent. Els desenvolupadors poden muntar fitxers locals, definir directoris de sortida i incorporar dades de proveïdors d’emmagatzematge, com ara AWS S3, Google Cloud Storage, Azure Blob Storage i Cloudflare R2.
Això ofereix als desenvolupadors una manera coherent de configurar l’entorn de l’agent, des del prototip local fins al desplegament en producció. També proporciona al model un espai de treball previsible: on trobar les entrades, on escriure les sortides i com mantenir la feina organitzada al llarg d’una tasca de llarga durada.

Els sistemes d’agents s’han de dissenyar assumint intents d’injecció d’indicacions i d’exfiltració. Separar el harness del càlcul ajuda a mantenir les credencials fora dels entorns on s’executa codi generat pel model.
Això també permet una execució duradora. Quan l’estat de l’agent s’externalitza, perdre un contenidor sandbox no significa perdre l’execució. Amb snapshots i rehidratació integrats, l’Agents SDK pot restaurar l’estat de l’agent en un contenidor nou i continuar des de l’últim punt de control si l’entorn original falla o caduca.
Finalment, fa que els agents siguin més escalables. Les execucions d’agents poden utilitzar un sandbox o molts, invocar sandboxes només quan calgui, dirigir subagents a entorns aïllats i paral·lelitzar treball entre contenidors per accelerar l’execució.
Aquestes noves capacitats de l’Agents SDK estan generalment disponibles per a tots els clients a través de l’API i utilitzen els preus estàndard de l’API, basats en segments i ús d’eines.
Mentre continuem desenvolupant l’Agents SDK, seguirem ampliant el que els desenvolupadors poden construir-hi, facilitant portar agents més capaços a producció amb menys infraestructura personalitzada, tot preservant la flexibilitat i el control que els desenvolupadors necessiten per integrar agents en els seus propis entorns.
Les noves capacitats de harness i sandbox es llancen primer en Python, amb suport per a TypeScript previst per a una futura versió. També estem treballant per portar capacitats addicionals d’agent, incloent-hi mode de codi i subagents, tant a Python com a TypeScript.
A més, volem ajudar a unir amb el temps l’ecosistema d’agents més ampli, amb suport per a més proveïdors de sandbox, més integracions i més maneres perquè els desenvolupadors connectin l’SDK a les eines i sistemes que ja utilitzen.


