Az Agents SDK következő evolúciója
A frissített Agents SDK segít a fejlesztőknek olyan ügynököket építeni, amelyek fájlokat vizsgálhatnak meg, parancsokat futtathatnak, kódot szerkeszthetnek, és hosszabb távú feladatokon dolgozhatnak szabályozott sandbox környezetekben.
Új képességeket vezetünk be az Agents SDK-ba, amelyek a fejlesztők számára olyan szabványosított infrastruktúrát biztosítanak, amelynek használatával könnyű elindulni, és amely megfelelően az OpenAI modellekhez lett kialakítva: egy modellnatív keretrendszert, amely lehetővé teszi, hogy az ügynökök a számítógépen fájlokon és eszközökön átívelően dolgozzanak, valamint natív sandbox-végrehajtást e munka biztonságos futtatásához.
Például a fejlesztők egy ügynöknek biztosíthatnak ellenőrzött munkaterületet, egyértelmű utasításokat és a bizonyítékok megvizsgálásához szükséges eszközöket:
A fejlesztőknek nemcsak a legjobb modellekre van szükségük ahhoz, hogy hasznos ügynököket hozzanak létre, hanem olyan rendszerekre is, amelyek lehetővé teszik az ügynökök számára, hogy fájlokat vizsgáljanak, parancsokat futtassanak, kódot írjanak, és több lépésen keresztül folytassák a munkát.
A ma létező rendszerek kompromisszumokkal járnak, miközben a csapatok a prototípusoktól az éles rendszerig jutnak el. A modellfüggetlen keretrendszerek rugalmasak, de nem használják ki teljes mértékben az élvonalbeli modellek képességeit; a modellszolgáltatók SDK-i közelebb állhatnak a modellhez, de gyakran nem biztosítanak kellő betekintést a környezetbe; a felügyelt ügynök API-k pedig egyszerűbbé tehetik a telepítést, de korlátozzák, hogy hol futnak az ügynökök, és hogyan férnek hozzá az érzékeny adatokhoz.
Íme néhány vélemény az új SDK-t velünk együtt tesztelő ügyfeleinktől:
„A GPT-5.4 új mércét állít a dokumentumoktól terhes jogi munkában. A BigLaw Bench értékelésünkön 91%-ot ért el. Más modellekkel összehasonlítva a GPT-5.4 jelenleg jobb a komplex tranzakciós elemzések strukturálásában, a pontosság fenntartásában hosszú szerződések esetén, valamint abban, hogy a jogi szakemberek által megkövetelt magas részletességi szintet nyújtsa.”
A mai kiadással az Agents SDK keretrendszere még hatékonyabbá válik a dokumentumokkal, fájlokkal és rendszerekkel dolgozó ügynökök számára. Mostantól konfigurálható memóriát, sandbox-tudatos összehangolást, Codex-szerű fájlrendszer-eszközöket, valamint szabványosított integrációkat kínál az élvonalbeli ügynökrendszerekben egyre gyakoribb primitívekkel.
Ezek az alapvető elemek magukban foglalják az eszközhasználatot az MCP(új ablakban nyílik meg)-n keresztül, a fokozatos feltárást a készségek(új ablakban nyílik meg) révén, az egyéni utasításokat az AGENTS.md(új ablakban nyílik meg) segítségével, kódvégrehajtás a shell(új ablakban nyílik meg) eszközzel, fájlszerkesztés az apply patch(új ablakban nyílik meg) eszközzel, és még sok más. A keretrendszer idővel folyamatosan új agentikus mintákkal és primitívekkel bővül, így a fejlesztők kevesebb időt tölthetnek az alapinfrastruktúra frissítésével, és többet az ügynökeiket hasznossá tevő, adott területre szabott logikával.
A keretrendszer abban is segít a fejlesztőknek, hogy jobban kiaknázhassák az élvonalbeli modellek képességeit azáltal, hogy a végrehajtást ahhoz igazítja, ahogyan ezek a modellek a legjobban teljesítenek. Ez közelebb tartja az ügynököket a modell természetes működési mintájához, javítva a megbízhatóságot és a teljesítményt az összetett feladatoknál – különösen, ha a munka hosszú távú, vagy különféle eszközök és rendszerek között összehangolt.
Emellett tisztában vagyunk vele, hogy minden termék egyedi, és ritkán illeszthető bele maradéktalanul egy sablonba. Azért terveztük az Agents SDK-t, hogy támogassa ezt a sokféleséget. A fejlesztők egy azonnal használható, mégis rugalmas harness-t kapnak – így könnyen a saját stackjükhöz igazíthatják, beleértve az eszközhasználatot, a memóriát és a sandbox környezetet.
A frissített Agents SDK natívan támogatja a sandboxos végrehajtást, így az ügynökök szabályozott számítógépes környezetekben futtathatók a feladathoz szükséges fájlokkal, eszközökkel és függőségekkel.
Sok hasznos ügynöknek egy munkaterületre van szüksége, ahol fájlokat olvashatnak és írhatnak, függőségeket telepíthetnek, kódot futtathatnak és biztonságosan használhatnak eszközöket. A natív sandbox-támogatás alapból biztosítja a fejlesztők számára ezt a végrehajtási réteget, ahelyett hogy nekik maguknak kellene azt összerakniuk.
A fejlesztők használhatják saját sandboxukat, vagy igénybe vehetik a Blaxel, a Cloudflare, a Daytona, az E2B, a Modal, a Runloop és a Vercel beépített támogatását.
Annak érdekében, hogy ezek a környezetek szolgáltatók között is hordozhatók legyenek, az SDK egy Manifest absztrakciót is bevezet az ügynök munkaterületének leírására. A fejlesztők helyi fájlokat csatlakoztathatnak, megadhatják a kimeneti könyvtárakat, valamint adatokat hozhatnak be olyan tárhelyszolgáltatóktól, mint az AWS S3, a Google Cloud Storage, az Azure Blob Storage és a Cloudflare R2.
Ez következetes módot biztosít a fejlesztők számára, hogy a helyi prototípustól az éles üzembe helyezésig kialakítsák az ügynök környezetét. Emellett a modell számára kiszámítható munkaterületet biztosít: hol találja meg a bemeneteket, hová írja a kimeneteket, és hogyan tartsa rendszerezetten a munkát egy hosszú távú feladat során.

Az ügynöki rendszereket úgy kell megtervezni, hogy feltételezzük az utasítás injekcióra és az adatkiszivárogtatásra irányuló kísérleteket. A harness és a számítási kapacitás szétválasztása segít távol tartani a hitelesítő adatokat azoktól a környezetektől, ahol a modell által generált kód fut.
Emellett lehetővé teszi a tartós végrehajtást. Ha az ügynök állapota externalizálva van, egy sandboxkonténer elvesztése nem jelenti a futás megszakadását. A beépített pillanatkép-készítés és rehidratálás segítségével az Agents SDK képes visszaállítani az ügynök állapotát egy új konténerben, és az utolsó ellenőrzőponttól folytatni a működést, ha az eredeti környezet meghibásodik vagy lejár.
Végül ezáltal az ügynökök jobban méretezhetők lesznek. Az ügynökfuttatások használhatnak egy vagy több sandboxot, a sandboxokat csak szükség esetén indíthatják el, az alügynököket elszigetelt környezetekbe irányíthatják, és a gyorsabb végrehajtás érdekében a feladatokat a konténerek között párhuzamosíthatják.
Az Agents SDK új funkciói az API-n keresztül minden ügyfél számára elérhetők, és a standard API-árazást alkalmazzák, a token és az eszközhasználat alapján.
Ahogy tovább fejlesztjük az Agents SDK-t, folyamatosan bővítjük majd azt is, hogy a fejlesztők mit építhetnek vele. Így könnyebbé válik fejlettebb ügynököket kevesebb egyedi infrastruktúrával éles környezetbe állítani, miközben megőrizzük azt a rugalmasságot és irányítást, amelyre a fejlesztőknek szükségük van ahhoz, hogy az ügynököket saját környezeteikbe illesszék.
Az új harness- és sandbox-funkciók először Pythonban lesznek elérhetők, a TypeScript támogatás pedig egy későbbi kiadásban várható. Dolgozunk azon is, hogy további ügynökfunkciókat, köztük a kódmódot és az alügynököket, elérhetővé tegyük Pythonban és TypeScriptben is.
Emellett szeretnénk idővel közelebb hozni egymáshoz a tágabb ügynök-ökoszisztémát, több sandboxszolgáltató, integráció és lehetőség támogatásával, hogy a fejlesztők az SDK-t összekapcsolhassák az általuk már használt eszközökkel és rendszerekkel.


