Următoarea evoluție a SDK-ului Agents
SDK-ul Agents actualizat îi ajută pe dezvoltatori să creeze agenți care pot inspecta fișiere, rula comenzi, edita cod și lucra la sarcini pe termen lung în medii de testare controlate.
Introducem funcții noi în SDK-ul Agents, care le oferă dezvoltatorilor o infrastructură standardizată, ușor de adoptat și construită corect pentru modelele OpenAI: un cadru de execuție nativ pentru model, care le permite agenților să lucreze cu fișiere și instrumente pe un calculator, plus execuție nativă în medii de testare pentru a rula această activitate în siguranță.
De exemplu, dezvoltatorii pot oferi unui agent un spațiu de lucru controlat, instrucțiuni clare și instrumentele de care are nevoie pentru a inspecta probele:
Dezvoltatorii au nevoie de mai mult decât cele mai bune modele pentru a crea agenți utili: au nevoie de sisteme care să susțină modul în care agenții inspectează fișierele, execută comenzi, scriu cod și continuă să funcționeze pe parcursul mai multor etape.
Sistemele care există astăzi implică compromisuri pe măsură ce echipele trec de la prototipuri la producție. Cadrele independente de model sunt flexibile, dar nu exploatează pe deplin capacitățile modelelor de ultimă generație; SDK-urile furnizorilor de modele pot fi mai strâns legate de model, dar adesea nu oferă o vizibilitate suficientă asupra infrastructurii; iar API-urile agenților gestionați pot simplifica implementarea, dar impun restricții privind locul în care agenții rulează și modul în care aceștia accesează datele sensibile.
Iată ce au avut de spus unii dintre clienții care au testat noul SDK împreună cu noi:
„GPT-5.4 stabilește un nou standard pentru munca juridică cu multe documente. În cadrul evaluării noastre BigLaw Bench, a obținut un scor de 91%. Comparativ cu alte modele, GPT-5.4 este în prezent mai eficient în structurarea analizelor tranzacționale complexe, menținerea preciziei pe parcursul contractelor lungi și furnizarea nivelului ridicat de detaliu necesar specialiștilor juridici.”
Odată cu lansarea de astăzi, sistemul SDK-ului Agents devine mai puternic pentru agenții care lucrează cu documente, fișiere și sisteme. Acum include memorie configurabilă, coordonare compatibilă cu mediile de testare, instrumente de sistem de fișiere similare cu Codex și integrări standardizate cu elemente de bază care devin tot mai frecvente în sistemele de agenți de ultimă generație.
Aceste primitive includ utilizarea instrumentelor prin MCP(se deschide într-o fereastră nouă), dezvăluirea progresivă prin abilități(se deschide într-o fereastră nouă), instrucțiuni personalizate prin AGENTS.md(se deschide într-o fereastră nouă), executarea codului folosind instrumentul shell(se deschide într-o fereastră nouă), editarea fișierelor folosind instrumentul apply patch(se deschide într-o fereastră nouă) și altele. Sistemul va continua să încorporeze în timp noi tipare și primitive agentice, astfel încât dezvoltatorii să petreacă mai puțin timp cu actualizările infrastructurii de bază și mai mult timp cu logica specifică domeniului care face agenții utili.
De asemenea, acest sistem le permite dezvoltatorilor să valorifice mai bine potențialul unui model de vârf, prin alinierea execuției la modul în care aceste modele funcționează cel mai bine. Acest lucru menține agenții mai aproape de tiparul natural de funcționare al modelului, îmbunătățind fiabilitatea și performanța în sarcini complexe, în special atunci când activitatea este de lungă durată sau coordonată într-un set divers de instrumente și sisteme.
În plus, ne dăm seama că fiecare produs este unic și rareori se încadrează perfect într-un tipar. Am conceput SDK-ul Agents pentru a susține această diversitate. Dezvoltatorii beneficiază de un sistem gata de utilizare, dar flexibil, care se adaptează cu ușurință la propria lor infrastructură tehnologică, incluzând utilizarea instrumentelor, memoria și mediul de testare.
SDK-ul Agents actualizat acceptă nativ execuția în medii de testare, astfel încât agenții să poată rula în medii de calcul controlate, cu fișierele, instrumentele și dependențele de care au nevoie pentru o sarcină.
Mulți agenți utili au nevoie de un spațiu de lucru în care să poată citi și scrie fișiere, instala dependențe, rula cod și folosi instrumente în siguranță. Compatibilitatea nativă pentru medii de testare le oferă dezvoltatorilor acest strat de execuție gata de utilizare, în loc să-i oblige să-l construiască singuri.
Dezvoltatorii pot folosi propriile medii de testare sau utiliza funcții compatibile încorporate pentru Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop și Vercel.
Pentru a face acele medii portabile între furnizori, SDK-ul introduce și o abstracție de tip manifest pentru a descrie spațiul de lucru al agentului. Dezvoltatorii pot monta fișiere locale, defini directoare de ieșire și importa date de la furnizori de stocare, inclusiv AWS S3, Google Cloud Storage, Azure Blob Storage și Cloudflare R2.
Aceste funcții le asigură dezvoltatorilor o metodă uniformă de a configura mediul agentului, de la prototipul local până la implementarea în producție. De asemenea, modelul beneficiază de un spațiu de lucru previzibil: unde să găsească datele de intrare, unde să scrie datele de ieșire și cum să mențină lucrul organizat pe parcursul unei activități de lungă durată.

Sistemele de agenți ar trebui proiectate ținând cont de posibilitatea unor tentative de injectare imediată și exfiltrare. Separarea sistemului de execuție de resursele de calcul ajută la păstrarea datelor de autentificare în afara mediilor în care se execută cod generat de model.
De asemenea, permite execuția durabilă. Când starea agentului este externalizată, pierderea unui mediu de testare izolat nu înseamnă pierderea rulării. Datorită funcțiilor integrate de creare a instantaneelor și de rehidratare, SDK-ul Agents poate restabili starea agentului într-un mediu nou și poate continua de la ultimul punct de control în cazul în care mediul inițial se defectează sau expiră.
În cele din urmă, face agenții mai scalabili. Execuțiile de agenți pot utiliza un singur mediu de testare sau mai multe, pot activa mediile de testare doar atunci când este necesar, pot direcționa subagenții către medii izolate și pot distribui sarcinile în paralel între medii pentru o execuție mai rapidă.
Aceste noi funcții ale SDK-ului Agents sunt disponibile la nivel general pentru toți clienții prin API și folosesc prețul API standard, bazat pe tokenuri și utilizarea instrumentelor.
Pe măsură ce continuăm să dezvoltăm SDK-ul Agents, vom extinde în continuare posibilitățile de creare ale dezvoltatorilor, facilitând punerea în funcțiune a unor agenți mai performanți cu o infrastructură personalizată redusă, păstrând totodată flexibilitatea și controlul de care dezvoltatorii au nevoie pentru a integra agenții în propriile medii.
Noile funcționalități legate de sistemul de execuție și de mediul de testare vor fi lansate mai întâi în Python, iar compatibilitatea pentru TypeScript este prevăzută pentru o versiune viitoare. De asemenea, lucrăm pentru a implementa funcții suplimentare de agent, inclusiv modul de cod și subagenți, atât în Python, cât și în TypeScript.
În plus, ne dorim să contribuim la consolidarea ecosistemului mai larg al agenților pe parcursul timpului, prin sprijinirea unui număr mai mare de furnizori de medii de testare, a mai multor integrări și a mai multor modalități prin care dezvoltatorii pot integra SDK-ul în instrumentele și sistemele pe care le utilizează deja.


