Evolucioni i ardhshëm i Agents SDK
Agents SDK e përditësuar i ndihmon zhvilluesit të ndërtojnë agjentë që mund të inspektojnë skedarë, të ekzekutojnë komanda, të redaktojnë kod dhe të punojnë në detyra afatgjata brenda mjediseve të izoluara të kontrolluara.
Po prezantojmë aftësi të reja në Agents SDK që u ofrojnë zhvilluesve një infrastrukturë të standardizuar, praktike dhe të ndërtuar posaçërisht për modelet e OpenAI: një strukturë të përshtatshme për modele që u mundëson agjentëve të punojnë me skedarë dhe mjete në një kompjuter, si dhe një ekzekutim të sigurt në mjedis të izoluar për të kryer këtë punë.
Për shembull, zhvilluesit mund t'i japin një agjenti një hapësirë pune të kontrolluar, udhëzime të qarta dhe mjetet që i nevojiten për të shqyrtuar provat:
Zhvilluesit kanë nevojë për më shumë se modelet më të mira për të ndërtuar agjentë të dobishëm - ata kanë nevojë për sisteme që mbështesin mënyrën se si agjentët inspektojnë skedarët, ekzekutojnë komanda, shkruajnë kod dhe vazhdojnë të punojnë në shumë hapa.
Sistemet që ekzistojnë sot sjellin kompromise ndërsa ekipet kalojnë nga prototipat në prodhim. Kornizat e pavarura nga modeli janë fleksibël, por nuk i shfrytëzojnë plotësisht aftësitë e modeleve avangardë; SDK e ofruesve të modeleve mund të jenë më afër modelit, por shpesh nuk ofrojnë dukshmëri të mjaftueshme mbi sistemin; dhe API e menaxhuara të agjentëve mund ta thjeshtojnë vendosjen në përdorim, por e kufizojnë vendin ku ekzekutohen agjentët dhe mënyrën se si ata aksesojnë të dhëna delikate.
Ja çfarë kishin për të thënë disa nga klientët që testuan SDK e re me ne:
“GPT-5.4 vendos një standard të ri për punën ligjore me shumë dokumente. Në vlerësimin tonë BigLaw Bench, shënoi 91%. Krahasuar me modelet e tjera, GPT-5.4 aktualisht është më i mirë në strukturimin e analizës komplekse të transaksioneve, ruajtjen e saktësisë nëpër kontrata të gjata dhe ofrimin e nivelit të lartë të detajeve që kërkojnë praktikuesit e së drejtës.”
Me publikimin e sotëm, harness i Agents SDK bëhet më i aftë për agjentët që punojnë me dokumente, skedarë dhe sisteme. Tani shton memorie të konfigurueshme, orkestrim të vetëdijshëm për mjedis të izoluar, mjete të sistemit të skedarëve të ngjashme me Codex dhe integrime të standardizuara me primitivë që po bëhen të zakonshëm në sistemet avangardë të agjentëve.
Këta primitivë përfshijnë përdorimin e mjeteve përmes MCP(hapet në një dritare të re), zbulimin progresiv përmes aftësive(hapet në një dritare të re), udhëzime të personalizuara përmes AGENTS.md(hapet në një dritare të re), ekzekutim kodi duke përdorur mjetin shell(hapet në një dritare të re), modifikime skedarësh duke përdorur mjetin apply patch(hapet në një dritare të re) e më tej. Korniza do të vazhdojë të përfshijë modele dhe primitivë të rinj agjentikë me kalimin e kohës, që zhvilluesit të shpenzojnë më pak kohë për përditësimet e infrastrukturës bazë e më tej kohë për logjikën specifike të fushës që i bën agjentët e tyre të dobishëm.
Infrastruktura gjithashtu i ndihmon zhvilluesit të shkyçin më shumë nga aftësitë e një modeli avangardë duke përafruar ekzekutimin me mënyrën se si këto modele performojnë më mirë. Kjo i mban agjentët më afër modelit natyror të funksionimit, duke përmirësuar besueshmërinë dhe performancën në detyra komplekse - veçanërisht kur puna është afatgjatë ose e koordinuar në një grup të larmishëm mjetesh dhe sistemesh.
Përveç kësaj, ne e kuptojmë se çdo produkt është unik dhe rrallë përshtatet plotësisht me një model. Ne projektuam Agents SDK për të mbështetur këtë larmi. Zhvilluesit marrin një sistem që është gati për përdorim, por fleksibël - duke e bërë të lehtë përshtatjen e tij me strukturën e tyre, duke përfshirë përdorimin e mjeteve, memorien dhe mjedisin e izoluar.
Agents SDK e përditësuar mbështet vetishëm ekzekutimin në mjedis të izoluar, ndaj agjentët mund të ekzekutohen në mjedise kompjuterike të kontrolluara me skedarët, mjetet dhe varësitë që u nevojiten për një detyrë.
Shumë agjentë të dobishëm kanë nevojë për një hapësirë pune ku mund të lexojnë dhe shkruajnë skedarë, instalojnë varësi, ekzekutojnë kod dhe përdorin mjete në mënyrë të sigurt. Mbështetja e vetishme për mjedis të izoluar u ofron zhvilluesve atë shtresë të gatshme ekzekutimi, në vend që t'i detyrojë ta formojnë vetë pjesë-pjesë.
Zhvilluesit mund të sjellin mjedisin e tyre të izoluar ose të përdorin mbështetjen e integruar për Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop dhe Vercel.
Për t'i bërë ato mjedise portative ndërmjet ofruesve, SDK sjell gjithashtu një abstragim manifesti për përshkrimin e hapësirës së punës së agjentit. Zhvilluesit mund të montojnë skedarë lokalë, të përcaktojnë direktoritë e outputit dhe të sjellin të dhëna nga ofrues të hapësirës ruajtëse, duke përfshirë AWS S3, Google Cloud Storage, Azure Blob Storage dhe Cloudflare R2.
Kjo u ofron zhvilluesve një mënyrë të qëndrueshme për të formësuar mjedisin e agjentit nga prototipi lokal deri te vënia në prodhim. Gjithashtu, i ofron modelit një hapësirë pune të parashikueshme: ku të gjejë inputet, ku të shkruajë outputet dhe si ta mbajë punën të organizuar gjatë një detyre afatgjatë.

Sistemet agjentike duhet të projektohen duke supozuar përpjekje për injektim i kërkesave dhe eksfiltrim. Ndarja e harness dhe e fuqisë llogaritëse ndihmon që kredencialet të mbahen jashtë mjediseve ku ekzekutohet kodi i gjeneruar nga modeli.
Ajo gjithashtu mundëson ekzekutim të qëndrueshëm. Kur gjendja e agjentit eksternalizohet, humbja e një kontejneri të izoluar nuk do të thotë humbjen e ekzekutimit. Me snapshotting dhe rehydration të integruar, Agents SDK mund të rikthejë gjendjen e agjentit në një kontejner të ri dhe të vazhdojë nga pika e fundit e kontrollit nëse mjedisi origjinal dështon ose skadon.
Së fundi, kjo i bën agjentët më të shkallëzueshëm. Ekzekutimet e agjentëve mund të përdorin një mjedis të izoluar ose disa të tillë, të thërrasin mjedisin e izoluar vetëm kur nevojiten, të drejtojnë nënagjentët në mjedise të izoluara dhe të paralelizojnë punën nëpër kontejnerë për ekzekutim më të shpejtë.
Këto aftësi të reja të Agents SDK janë përgjithësisht të disponueshme për të gjithë klientët përmes API dhe përdorin çmimet standarde të API, bazuar në tokenë dhe përdorimin e mjeteve.
Ndërsa vazhdojmë të zhvillojmë Agents SDK, do të vazhdojmë të zgjerojmë atë që zhvilluesit mund të ndërtojnë me të, duke e bërë më të lehtë sjelljen në prodhim të agjentëve më të aftë me më pak infrastrukturë të personalizuar, ndërsa ruajmë fleksibilitetin dhe kontrollin që u nevojiten zhvilluesve për t'i përshtatur agjentët në mjediset e tyre.
Aftësitë e reja të harness dhe mjedisit të izoluar po qarkullohen fillimisht në Python, me mbështetjen për TypeScript të planifikuar për një version të ardhshëm. Ne po punojmë gjithashtu për të sjellë aftësi shtesë si agjent, duke përfshirë modalitetin e kodit dhe nënagjentë, si në Python ashtu edhe në TypeScript.
Përveç kësaj, duam të ndihmojmë që me kalimin e kohës të bashkojmë ekosistemin më të gjerë të agjentëve, me mbështetje për më shumë ofrues mjedisi të izoluar, më shumë integrime e më tej mënyra që zhvilluesit të integrojnë SDK në mjetet dhe sistemet që përdorin tashmë.


