Sljedeća evolucija SDK-a za agente
Ažurirani Agents SDK pomaže programerima da izgrade agente koji mogu pregledati datoteke, pokretati komande, uređivati kod i raditi na dugoročnim zadacima unutar kontrolisanih testnih okruženja.
Predstavljamo nove mogućnosti za SDK za agente koje programerima pružaju standardizovanu infrastrukturu koja je jednostavna za početak i pravilno izgrađena za OpenAI modele: model-native okvir koji omogućava agentima rad sa datotekama i alatima na računaru, uz nativno izvršavanje u sandboxu za sigurno obavljanje tog rada.
Na primjer, programeri mogu dati agentu kontrolisani radni prostor, eksplicitne upute i alate koji su mu potrebni da pregleda dokaze:
Programerima treba više od najboljih modela da bi kreirali korisne agente—potrebni su im sistemi koji podržavaju način na koji agenti pregledaju datoteke, izvršavaju naredbe, pišu kod i nastavljaju rad kroz mnoge korake.
Sistemi koji danas postoje dolaze s određenim kompromisima dok timovi prelaze iz prototipova u produkciju. Okviri neovisni o modelu su fleksibilni, ali ne koriste u potpunosti mogućnosti naprednih modela; SDK-ovi dobavljača modela mogu biti bliži modelu, ali često nemaju dovoljno uvida u okruženje; a upravljani agent API-ji mogu pojednostaviti implementaciju, ali ograničavaju gdje se agenti izvršavaju i kako pristupaju osjetljivim podacima.
Evo šta su neki od korisnika koji su s nama testirali novi SDK imali reći:
„GPT-5.4 postavlja novi standard za pravni rad sa velikim brojem dokumenata. Na našoj BigLaw Bench evaluaciji, postigao je 91%. U poređenju s drugim modelima, GPT-5.4 je trenutno bolji u strukturiranju složene transakcijske analize, održavanju tačnosti kroz dugačke ugovore i isporučivanju visokog nivoa detalja koji pravni praktičari zahtijevaju.”
Današnjim izdanjem, Agents SDK postaje sposobniji za agente koji rade sa dokumentima, datotekama i sistemima. Sada dodaje podesivu memoriju, orkestraciju prilagođenu sandboxu, alate za datotečni sistem nalik Codexu i standardizovane integracije s osnovnim elementima koji postaju uobičajeni u naprednim agentskim sistemima.
Ovi primitivi uključuju korištenje alata putem MCP(otvara se u novom prozoru), postepeno otkrivanje putem vještine(otvara se u novom prozoru), prilagođene upute putem AGENTS.md(otvara se u novom prozoru), izvršavanje koda pomoću alata shell(otvara se u novom prozoru), uređivanje datoteka pomoću alata apply patch(otvara se u novom prozoru) i još mnogo toga. Harness će s vremenom nastaviti uključivati nove agentske obrasce i primitive, tako da programeri mogu provoditi manje vremena na ažuriranja osnovne infrastrukture, a više vremena na logiku specifičnu za domenu koja njihove agente čini korisnim.
Ovaj harness također pomaže programerima da otključaju više mogućnosti naprednih modela tako što usklađuje izvršavanje sa načinom na koji ti modeli najbolje rade. To drži agente bliže prirodnom načinu rada modela, pa poboljšava pouzdanost i performanse na složenim zadacima—posebno kada je posao dugotrajan ili koordiniran kroz raznovrstan skup alata i sistema.
Osim toga, svjesni smo da je svaki proizvod jedinstven i da se rijetko može uredno uklopiti u neki kalup. Osmislili smo Agents SDK da podrži ovu raznolikost. Programeri dobijaju okvir koji je spreman za upotrebu, a ipak fleksibilan — što olakšava njegovo prilagođavanje vlastitom tehnološkom stacku — uključujući upotrebu alata, memoriju i sandbox okruženje.
Ažurirani Agents SDK nativno podržava izvršavanje u sandbox okruženju, tako da agenti mogu raditi u kontrolisanim računarskim okruženjima sa datotekama, alatima i zavisnostima koje su im potrebne za zadatak.
Mnogim korisnim agentima potreban je radni prostor u kojem mogu čitati i pisati datoteke, instalirati zavisnosti, pokretati kod i sigurno koristiti alate. Nativna podrška za sandbox daje programerima taj izvršni sloj odmah, umjesto da ih prisiljava da ga sami sastavljaju.
Programeri mogu koristiti vlastiti sandbox ili ugrađenu podršku za Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop i Vercel.
Kako bi ta okruženja bila prenosiva među različitim pružaocima usluga, SDK takođe uvodi apstrakciju manifest za opisivanje radnog prostora agenta. Programeri mogu montirati lokalne datoteke, definirati izlazne direktorije i uvoziti podatke od pružalaca usluga pohrane, uključujući AWS S3, Google Cloud Storage, Azure Blob Storage i Cloudflare R2.
Ovo programerima daje dosljedan način da oblikuju okruženje agenta, od lokalnog prototipa do produkcijskog okruženja. To također daje modelu predvidljiv radni prostor: gdje pronaći unose, gdje upisati izlaze i kako održavati rad organizovanim tokom dugotrajnog zadatka.

Sistemi agenata trebaju biti dizajnirani uz pretpostavku pokušaja ubrizgavanja upita i eksfiltracije. Odvajanje upravljačkog sistema i računalnih resursa pomaže da akreditivi ne dospiju u okruženja u kojima se izvršava kod koji generira model.
Također omogućava trajno izvršavanje. Kada je stanje agenta eksternalizirano, gubitak sandbox kontejnera ne znači gubitak izvršavanja. Uz ugrađeno pravljenje snimaka stanja i rehidraciju, Agents SDK može vratiti stanje agenta u novom kontejneru i nastaviti od posljednje kontrolne tačke ako originalno okruženje otkaže ili istekne.
Konačno, to čini agente skalabilnijim. Pokretanja agenata mogu koristiti jedan sandbox ili više njih, pokretati sandboxe samo kada su potrebni, usmjeravati podagente u izolirana okruženja i paralelizirati rad kroz kontejnere radi bržeg izvršavanja.
Ove nove mogućnosti Agents SDK-a općenito su dostupne svim korisnicima putem API-ja i koriste standardnu cijenu API-ja, na osnovu tokena i upotrebe alata.
Kako budemo nastavili razvijati Agents SDK, nastavit ćemo širiti ono što programeri mogu izgraditi pomoću njega, olakšavajući uvođenje sposobnijih agenata u produkciju uz manje prilagođene infrastrukture, uz očuvanje fleksibilnosti i kontrole koje su programerima potrebne da uklope agente u vlastita okruženja.
Nove mogućnosti okruženja i sandboxa prvo se pokreću za Python, dok je podrška za TypeScript planirana za buduće izdanje. Također radimo na tome da dodatne mogućnosti agenta, uključujući način rada za kod i podagente, uvedemo i u Python i TypeScript.
Takođe, želimo vremenom okupiti širi ekosistem agent, uz podršku za više pružalaca sandbox okruženja, više integracija i više načina da programeri integrišu SDK u alate i sisteme koje već koriste.


