Næsta þróun Agents SDK
Uppfærða Agents SDK hjálpar forriturum að búa til fulltrúa sem geta skoðað skrár, keyrt skipanir, breytt kóða og unnið að langtímaverkefnum í stýrðu sandkassaumhverfi.
Við kynnum nýja möguleika í Agents SDK sem veita forriturum staðlaða innviði sem eru auðveldir í notkun og rétt hannaðir fyrir OpenAI-líkön: líkanainnbyggða umgjörð sem gerir fulltrúum kleift að vinna með skrár og verkfæri í tölvu, auk innbyggðrar sandkassakeyrslu til að tryggja örugga framkvæmd.
Til dæmis geta forritarar veitt fulltrúa stýrt vinnusvæði, skýrar leiðbeiningar og þau verkfæri sem hann þarf til að skoða gögn:
Forritarar þurfa meira en bara bestu líkönin til að smíða nytsama fulltrúa — þeir þurfa kerfi sem styðja það hvernig slíkir fulltrúar skoða skrár, keyra skipanir, skrifa kóða og halda áfram að vinna í gegnum mörg skref.
Kerfin sem eru til staðar í dag hafa sína kosti og galla þegar teymi fara frá frumgerðum yfir í framleiðslu. Líkanóháðir rammar eru sveigjanlegir en nýta ekki að fullu möguleika framarlegra líkana. SDK-pakkar líkanaþjónustuaðila geta verið nær líkaninu en skortir oft nægilegt innsæi í keyrsluumhverfið. Stýrð fulltrúa-API einfalda uppsetningu en takmarka hvar fulltrúar keyra og hvernig þeir fá aðgang að viðkvæmum gögnum.
Hér er það sem nokkrir viðskiptavinir sem prófuðu nýja SDK með okkur höfðu að segja:
„GPT-5.4 setur ný viðmið fyrir skjalamiðaða lögfræðivinnu. Í BigLaw Bench-matinu okkar náði það 91%. Í samanburði við önnur líkön er GPT-5.4 um þessar mundir betra í að setja flókna viðskiptagreiningu í skýra uppbyggingu, viðhalda nákvæmni yfir langa samninga og skila því mikla smáatriðastigi sem lögfræðingar krefjast.”
Með útgáfu dagsins verður Agents SDK beislið öflugra fyrir fulltrúa sem vinna með skjöl, skrár og kerfi. Það bætir nú við stillanlegu minni, samhæfingu sem er meðvituð um sandkassa, Codex-líkum skráakerfisverkfærum og stöðluðum samþættingum við frumþætti sem eru að verða algengir í framarlegu fulltrúakerfum.
Þessir grunnþættir fela í sér notkun verkfæra í gegnum MCP(opnast í nýjum glugga), stigvaxandi upplýsingagjöf í gegnum skills(opnast í nýjum glugga), sérsniðnar leiðbeiningar í gegnum AGENTS.md(opnast í nýjum glugga), keyrsla kóða með skeljaverkfærinu(opnast í nýjum glugga), breytingar á skrám með apply patch(opnast í nýjum glugga) verkfærinu og fleira. Umhverfið mun halda áfram að innleiða ný fulltrúamynstur og grunneiningar með tímanum, þannig að forritarar geti varið minni tíma í uppfærslur á grunninnviðum og meiri tíma í þá lénsértæku rökfræði sem gerir fulltrúa þeirra gagnlega.
Vinnsluramminn hjálpar einnig forriturum að nýta betur getu framarlegra líkana með því að samræma framkvæmd við það hvernig slík líkön virka best. Það heldur fulltrúum nær náttúrulegu vinnslumynstri líkansins og bætir þannig áreiðanleika og frammistöðu í flóknum verkefnum, sérstaklega þegar vinna er langvarandi eða samhæfð yfir fjölbreytt safn verkfæra og kerfa.
Auk þess gerum við okkur grein fyrir að hver vara er einstök og fellur sjaldan snyrtilega að einhverju móti. Við hönnuðum Agents SDK til að styðja við þennan fjölbreytileika. Forritarar fá umhverfi sem er tilbúið til notkunar en jafnframt sveigjanlegt—sem gerir þeim auðvelt að aðlaga það að eigin tæknistafla—þar á meðal notkun verkfæra, minni og sandkassaumhverfi.
Uppfærða Agents SDK styður innbyggða keyrslu í sandkassa, þannig að fulltrúar geta keyrt í stýrðu tölvuumhverfi með skrám, verkfærum og kerfisháðum íhlutum sem þeir þurfa fyrir verkefni.
Margir nytsamlegir fulltrúar þurfa vinnusvæði þar sem þeir geta lesið og skrifað skrár, sett upp viðbætur, keyrt kóða og notað verkfæri á öruggan hátt. Innbyggður stuðningur við sandkassaumhverfi veitir forriturum keyrslulagið strax, í stað þess að neyða þá til að setja það saman sjálfir.
Forritarar geta komið með eigið sandkassaumhverfi eða nýtt sér innbyggðan stuðning fyrir Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop og Vercel.
Til að gera þessi umhverfi færanleg milli þjónustuveitenda kynnir SDK einnig Manifest-hugtak til að lýsa vinnusvæði fulltrúans. Forritarar geta tengt staðbundnar skrár, skilgreint úttaksmöppur og flutt inn gögn frá geymsluveitum, þar á meðal AWS S3, Google Cloud Storage, Azure Blob Storage og Cloudflare R2.
Þetta gefur forriturum samræmda leið til að móta umhverfi fulltrúa frá staðbundinni frumgerð til framleiðsluuppsetningar. Það gefur líkaninu einnig fyrirsjáanlegt vinnusvæði: hvar hægt er að finna inntök, hvar skrifa á frálög og hvernig hægt er að halda vinnunni skipulagðri í gegnum langvarandi verkefni.

Fulltrúakerfi ætti að vera hönnuð með þeirri forsendu að reynt verði að beita kvaðningarvörpun og gagnastuldi. Að aðskilja stjórnun og reikniafl hjálpar til við að halda aðgangsupplýsingum utan umhverfa þar sem kóði, sem líkan býr til, er keyrður.
Það gerir einnig kleift að framkvæma á varanlegan hátt. Þegar staða fulltrúans er vistuð utan hans þýðir það ekki að keyrslan glatist þótt sandkassageymur tapist. Með innbyggðri skyndimyndatöku og endurhleðslu getur Agents SDK endurheimt stöðu fulltrúans í nýju geymaumhverfi og haldið áfram frá síðasta vistunarpunkti ef upprunalega umhverfið bilar eða rennur út.
Að lokum gerir það fulltrúa stigstærðanlegri. Keyrslur fulltrúa geta notað einn sandkassa eða marga, virkjað sandkassa aðeins þegar þeirra er þörf, beint undirfulltrúum í einangruð umhverfi og samhliða unnið milli gáma til að flýta keyrslu.
Þessir nýju eiginleikar Agents SDK eru almennt aðgengilegir öllum viðskiptavinum í gegnum API og nota staðlaða API-verðlagningu, byggt á tókum og notkun verkfæra.
Eftir því sem við höldum áfram að þróa Agents SDK munum við auka möguleika forritara til að byggja með því, gera það auðveldara að koma öflugri fulltrúum í framleiðslu með minni þörf fyrir sérsniðna innviði, á sama tíma og viðhaldið er sveigjanleika og stjórn sem forritarar þurfa til að laga fulltrúa að sínu eigin umhverfi.
Ný geta fyrir keyrsluumhverfi og sandkassa verða fyrst sett á markað í Python, en stuðningur við TypeScript er fyrirhugaður í síðari útgáfu. Við erum einnig að vinna að því að færa viðbótargetu fulltrúa, þar á meðal kóðastillingu og undirfulltrúa, yfir í bæði Python og TypeScript.
Að auki viljum við með tímanum hjálpa til við að sameina víðara vistkerfi fulltrúa, með stuðningi við fleiri veitendur sandkassaumhverfa, fleiri samþættingar og fleiri leiðir fyrir þróunaraðila til að tengja SDK við þau verkfæri og kerfi sem þeir nota nú þegar.


