Kita agentų SDK evoliucijos pakopa
Atnaujintas agentų SDK padeda kūrėjams konstruoti agentus, galinčius peržiūrėti failus, paleisti komandas, redaguoti kodą ir dirbti su ilgalaikėmis užduotimis kontroliuojamose bandomosiose aplinkose.
Pristatome naujas agentų SDK galimybes. Kūrėjams suteikiama standartizuota, lengvai perprantama infrastruktūra, optimaliai veikianti su „OpenAI“ modeliais: tai modeliui pritaikyta infrastruktūra, leidžianti agentams dirbti su kompiuteryje esančiais failais ir įrankiais, bei integruotas vykdymas bandomojoje aplinkoje saugiam darbui užtikrinti.
Pavyzdžiui, kūrėjai gali suteikti agentui kontroliuojamą darbo erdvę, aiškias instrukcijas ir įrankius, reikalingus duomenims nagrinėti:
Norint sukurti naudingus agentus, kūrėjams nepakanka vien geriausių modelių – jiems reikia sistemų, palaikančių agentų gebėjimą peržiūrėti failus, vykdyti komandas, rašyti kodą ir toliau tęsti darbą per daugybę žingsnių.
Šiandieninėse sistemose neišvengiama kompromisų, kai komandos nuo prototipų pereina prie realaus naudojimo. Nuo modelio nepriklausomos struktūros yra lanksčios, tačiau nevisiškai išnaudoja priešakinių modelių galimybes. Modelių teikėjų SDK gali būti geriau pritaikyti modeliui, bet dažnai nesuteikia pakankamai informacijos apie infrastruktūros veikimą. Tuo tarpu valdomų agentų API supaprastina diegimą, bet riboja agentų veikimo vietą ir prieigą prie jautrių duomenų.
Štai ką pasakė keli klientai, kartu su mumis išbandę naująjį SDK:
„GPT-5.4 nustato naują kartelę daug dokumentų reikalaujančiam teisiniam darbui. Mūsų „BigLaw Bench“ vertinime jis surinko 91 proc. Palyginti su kitais modeliais, GPT-5.4 šiuo metu geriau sistemina sudėtingą sandorių analizę, išlaiko tikslumą ilguose languose ir užtikrina aukštą detalumo lygį, kurio reikalauja teisininkai.“
Su šiandieniniu leidimu agentų SDK infrastruktūra tampa geriau pritaikyta agentams, dirbantiems su dokumentais, failais ir sistemomis. Dabar ji papildyta konfigūruojama atmintimi, bandomajai aplinkai pritaikytu orkestravimu, į „Codex“ panašiais failų sistemos įrankiais ir standartizuotomis integracijomis su primityvais, kurie tampa įprasti priešakinėse agentų sistemose.
Šie primityvai apima įrankių naudojimą per MCP(atsidaro naujame lange), laipsnišką atskleidimą per įgūdžius(atsidaro naujame lange), pasirinktines instrukcijas per AGENTS.md(atsidaro naujame lange), kodo vykdymą naudojant shell(atsidaro naujame lange) įrankį, failų redagavimą naudojant apply patch(atsidaro naujame lange) įrankį ir kt. Laikui bėgant, į infrastruktūrą bus toliau integruojami nauji agentų veiklos modeliai ir primityvai, tad kūrėjai galės skirti mažiau laiko pagrindinės infrastruktūros atnaujinimams ir daugiau dėmesio konkrečios srities logikai, kuri ir paverčia jų agentus naudingais.
Be to, infrastruktūra padeda kūrėjams išnaudoti daugiau priešakinio modelio galimybių, nes vykdymas suderinamas su geriausiu šių modelių veikimo būdu. Taip agentai išlaiko artimesnį modeliui natūralų veikimo modelį, o tai pagerina patikimumą ir našumą atliekant sudėtingas užduotis – ypač tuomet, kai darbas trunka ilgai arba yra koordinuojamas naudojant įvairius įrankius ir sistemas.
Be to, suprantame, kad kiekvienas produktas yra unikalus ir retai tobulai atitinka vieną šabloną. Agentų SDK sukūrėme taip, kad palaikytų šią įvairovę. Kūrėjai gauna paruoštą naudoti, bet lanksčią infrastruktūrą, kurią lengva pritaikyti prie savo technologijų dėklo – įskaitant įrankių naudojimą, atmintį ir bandomąją aplinką.
Atnaujintas agentų SDK standartiškai palaiko vykdymą bandomojoje aplinkoje, todėl agentai gali veikti kontroliuojamose kompiuterinėse aplinkose su failais, įrankiais ir priklausomybėmis, kurių jiems reikia užduočiai atlikti.
Daugeliui naudingų agentų reikalinga darbo erdvė, kurioje jie galėtų saugiai skaityti ir rašyti failus, įdiegti priklausomybes, vykdyti kodą bei naudoti įrankius. Integruotas bandomosios aplinkos palaikymas suteikia kūrėjams šį vykdymo sluoksnį iš karto, užuot vertus juos jį konstruoti patiems.
Kūrėjai gali naudoti savo bandomąją aplinką arba pasinaudoti integruotu „Blaxel“, „Cloudflare“, „Daytona“, E2B, „Modal“, „Runloop“ ir „Vercel“ palaikymu.
Kad šias aplinkas būtų galima lengvai perkelti tarp skirtingų teikėjų sistemų, SDK taip pat pristato manifesto abstrakciją, skirtą agento darbo erdvei aprašyti. Kūrėjai gali prijungti vietinius failus, nurodyti išvesties katalogus ir įkelti duomenis iš tokių saugyklų teikėjų kaip „AWS S3“, „Google Cloud Storage“, „Azure Blob Storage“ ir „Cloudflare R2“.
Tai suteikia kūrėjams nuoseklų būdą formuoti agento aplinką nuo vietinio prototipo iki diegimo realiose sistemose. Tai taip pat suteikia modeliui nuspėjamą darbo erdvę: jis žino, kur rasti įvesties duomenis, kur įrašyti išvestį ir kaip palaikyti darbo tvarką vykdant ilgalaikę užduotį.

Agentų sistemos turėtų būti kuriamos atsižvelgiant į galimus užklausų įterpimo ir slaptus duomenų išsiuntimo bandymus. Infrastruktūros ir skaičiavimo resursų atskyrimas padeda apsaugoti prisijungimo duomenis nuo aplinkų, kuriose vykdomas modelio sugeneruotas kodas.
Tai taip pat užtikrina sklandų ir patikimą vykdymą. Kai agento būsena perkeliama į išorę, praradus bandomąją programinę vykdymo aplinką neprarandamas pats procesas. Naudojant integruotas momentinių kopijų (angl. „snapshotting“) ir atnaujinimo (angl. „rehydration“) funkcijas, agentų SDK gali atkurti agento būseną naujoje programinėje vykdymo aplinkoje ir tęsti darbą nuo paskutinio kontrolinio taško, jei pradinė aplinka sugenda ar baigiasi jos galiojimo laikas.
Galiausiai tai leidžia lengviau keisti agentų mastelį. Vykdant agentus, galima naudoti vieną arba kelias bandomąsias aplinkas, jas iškviesti tik tada, kai reikia, nukreipti antrinius agentus į izoliuotas aplinkas ir lygiagrečiai paskirstyti darbą skirtingose programinėse vykdymo aplinkose siekiant greitesnio vykdymo.
Šios naujos agentų SDK galimybės per API yra prieinamos visiems klientams ir joms taikoma standartinė API kainodara, pagrįsta žetonais bei įrankių naudojimu.
Toliau plėtodami agentų SDK, ir toliau plėsime tai, ką kūrėjai gali su juo sukurti. Sieksime, kad būtų lengviau diegti našesnius agentus realiose sistemose su mažiau pritaikytos infrastruktūros poreikio, išlaikant lankstumą ir kontrolę, kurios kūrėjams reikia norint integruoti agentus į savo aplinkas.
Naujos infrastruktūros ir bandomosios aplinkos galimybės pirmiausia pristatomos „Python“ kalboje, o „TypeScript“ palaikymą planuojama pridėti būsimame leidime. Taip pat dirbame siekdami įtraukti papildomas agentų galimybes, tokias kaip kodo režimas ir antriniai agentai, tiek į „Python“, tiek į „TypeScript“.
Be to, ilgainiui siekiame sujungti platesnę agentų ekosistemą, palaikydami daugiau bandomųjų aplinkų teikėjų, daugiau integracijų ir suteikdami kūrėjams daugiau būdų sujungti SDK su jau naudojamais įrankiais bei sistemomis.


