Ugrás a fő tartalomra
OpenAI

2026. április 15.

Termék

Az Agents SDK következő evolúciója

A frissített Agents SDK segít a fejlesztőknek olyan ügynököket építeni, amelyek fájlokat vizsgálhatnak meg, parancsokat futtathatnak, kódot szerkeszthetnek, és hosszabb távú feladatokon dolgozhatnak szabályozott sandbox környezetekben.

Betöltés…

Új képességeket vezetünk be az Agents SDK-ba, amelyek a fejlesztők számára olyan szabványosított infrastruktúrát biztosítanak, amelynek használatával könnyű elindulni, és amely megfelelően az OpenAI modellekhez lett kialakítva: egy modellnatív keretrendszert, amely lehetővé teszi, hogy az ügynökök a számítógépen fájlokon és eszközökön átívelően dolgozzanak, valamint natív sandbox-végrehajtást e munka biztonságos futtatásához.

Például a fejlesztők egy ügynöknek biztosíthatnak ellenőrzött munkaterületet, egyértelmű utasításokat és a bizonyítékok megvizsgálásához szükséges eszközöket:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

A fejlesztőknek nemcsak a legjobb modellekre van szükségük ahhoz, hogy hasznos ügynököket hozzanak létre, hanem olyan rendszerekre is, amelyek lehetővé teszik az ügynökök számára, hogy fájlokat vizsgáljanak, parancsokat futtassanak, kódot írjanak, és több lépésen keresztül folytassák a munkát.

A ma létező rendszerek kompromisszumokkal járnak, miközben a csapatok a prototípusoktól az éles rendszerig jutnak el. A modellfüggetlen keretrendszerek rugalmasak, de nem használják ki teljes mértékben az élvonalbeli modellek képességeit; a modellszolgáltatók SDK-i közelebb állhatnak a modellhez, de gyakran nem biztosítanak kellő betekintést a környezetbe; a felügyelt ügynök API-k pedig egyszerűbbé tehetik a telepítést, de korlátozzák, hogy hol futnak az ügynökök, és hogyan férnek hozzá az érzékeny adatokhoz.

Íme néhány vélemény az új SDK-t velünk együtt tesztelő ügyfeleinktől:

„A GPT-5.4 új mércét állít a dokumentumoktól terhes jogi munkában. A BigLaw Bench értékelésünkön 91%-ot ért el. Más modellekkel összehasonlítva a GPT-5.4 jelenleg jobb a komplex tranzakciós elemzések strukturálásában, a pontosság fenntartásában hosszú szerződések esetén, valamint abban, hogy a jogi szakemberek által megkövetelt magas részletességi szintet nyújtsa.”
— Niko Grupen, Harvey, alkalmazott kutatások vezetője

Egy fejlettebb keret az ügynök ciklusához

A mai kiadással az Agents SDK keretrendszere még hatékonyabbá válik a dokumentumokkal, fájlokkal és rendszerekkel dolgozó ügynökök számára. Mostantól konfigurálható memóriát, sandbox-tudatos összehangolást, Codex-szerű fájlrendszer-eszközöket, valamint szabványosított integrációkat kínál az élvonalbeli ügynökrendszerekben egyre gyakoribb primitívekkel.

Ezek az alapvető elemek magukban foglalják az eszközhasználatot az MCP(új ablakban nyílik meg)-n keresztül, a fokozatos feltárást a készségek(új ablakban nyílik meg) révén, az egyéni utasításokat az AGENTS.md(új ablakban nyílik meg) segítségével, kódvégrehajtás a shell(új ablakban nyílik meg) eszközzel, fájlszerkesztés az apply patch(új ablakban nyílik meg) eszközzel, és még sok más. A keretrendszer idővel folyamatosan új agentikus mintákkal és primitívekkel bővül, így a fejlesztők kevesebb időt tölthetnek az alapinfrastruktúra frissítésével, és többet az ügynökeiket hasznossá tevő, adott területre szabott logikával.

Egy diagram, amely bemutatja, hogyan kapcsolja össze az Agent SDK a felhasználói bemenetet, a modelleket és az eszközöket az AI-ügynökök létrehozásához.
Egy diagram bemutatja, hogyan lehet AI-ügynököket létrehozni az Agent SDK segítségével, modellekkel, eszközökkel és vezényléssel.

A keretrendszer abban is segít a fejlesztőknek, hogy jobban kiaknázhassák az élvonalbeli modellek képességeit azáltal, hogy a végrehajtást ahhoz igazítja, ahogyan ezek a modellek a legjobban teljesítenek. Ez közelebb tartja az ügynököket a modell természetes működési mintájához, javítva a megbízhatóságot és a teljesítményt az összetett feladatoknál – különösen, ha a munka hosszú távú, vagy különféle eszközök és rendszerek között összehangolt.

Emellett tisztában vagyunk vele, hogy minden termék egyedi, és ritkán illeszthető bele maradéktalanul egy sablonba. Azért terveztük az Agents SDK-t, hogy támogassa ezt a sokféleséget. A fejlesztők egy azonnal használható, mégis rugalmas harness-t kapnak – így könnyen a saját stackjükhöz igazíthatják, beleértve az eszközhasználatot, a memóriát és a sandbox környezetet.

Natív homokozó-futtatás

A frissített Agents SDK natívan támogatja a sandboxos végrehajtást, így az ügynökök szabályozott számítógépes környezetekben futtathatók a feladathoz szükséges fájlokkal, eszközökkel és függőségekkel.

Sok hasznos ügynöknek egy munkaterületre van szüksége, ahol fájlokat olvashatnak és írhatnak, függőségeket telepíthetnek, kódot futtathatnak és biztonságosan használhatnak eszközöket. A natív sandbox-támogatás alapból biztosítja a fejlesztők számára ezt a végrehajtási réteget, ahelyett hogy nekik maguknak kellene azt összerakniuk.

A fejlesztők használhatják saját sandboxukat, vagy igénybe vehetik a Blaxel, a Cloudflare, a Daytona, az E2B, a Modal, a Runloop és a Vercel beépített támogatását.

Annak érdekében, hogy ezek a környezetek szolgáltatók között is hordozhatók legyenek, az SDK egy Manifest absztrakciót is bevezet az ügynök munkaterületének leírására. A fejlesztők helyi fájlokat csatlakoztathatnak, megadhatják a kimeneti könyvtárakat, valamint adatokat hozhatnak be olyan tárhelyszolgáltatóktól, mint az AWS S3, a Google Cloud Storage, az Azure Blob Storage és a Cloudflare R2.

Ez következetes módot biztosít a fejlesztők számára, hogy a helyi prototípustól az éles üzembe helyezésig kialakítsák az ügynök környezetét. Emellett a modell számára kiszámítható munkaterületet biztosít: hol találja meg a bemeneteket, hová írja a kimeneteket, és hogyan tartsa rendszerezetten a munkát egy hosszú távú feladat során.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop logók

A keretrendszer leválasztása a számítási kapacitásról a biztonság, a tartósság és a méretezhetőség érdekében

Az ügynöki rendszereket úgy kell megtervezni, hogy feltételezzük az utasítás injekcióra és az adatkiszivárogtatásra irányuló kísérleteket. A harness és a számítási kapacitás szétválasztása segít távol tartani a hitelesítő adatokat azoktól a környezetektől, ahol a modell által generált kód fut.

Emellett lehetővé teszi a tartós végrehajtást. Ha az ügynök állapota externalizálva van, egy sandboxkonténer elvesztése nem jelenti a futás megszakadását. A beépített pillanatkép-készítés és rehidratálás segítségével az Agents SDK képes visszaállítani az ügynök állapotát egy új konténerben, és az utolsó ellenőrzőponttól folytatni a működést, ha az eredeti környezet meghibásodik vagy lejár.

Végül ezáltal az ügynökök jobban méretezhetők lesznek. Az ügynökfuttatások használhatnak egy vagy több sandboxot, a sandboxokat csak szükség esetén indíthatják el, az alügynököket elszigetelt környezetekbe irányíthatják, és a gyorsabb végrehajtás érdekében a feladatokat a konténerek között párhuzamosíthatják.

Folyamatábra, amely bemutatja, hogyan teszi lehetővé az Agent SDK, hogy az AI-ügynökök további számítási kapacitást használjanak az összetettebb feladatokhoz.
Egy diagram bemutatja, hogyan képesek az Agent SDK-val épített AI-ügynökök különálló számítási rendszereket összehangolni, lehetővé téve a munkaterhelések önálló futását, miközben támogatják az összetettebb feladatokat.

Árképzés és elérhetőség

Az Agents SDK új funkciói az API-n keresztül minden ügyfél számára elérhetők, és a standard API-árazást alkalmazzák, a token és az eszközhasználat alapján.

Mi következik?

Ahogy tovább fejlesztjük az Agents SDK-t, folyamatosan bővítjük majd azt is, hogy a fejlesztők mit építhetnek vele. Így könnyebbé válik fejlettebb ügynököket kevesebb egyedi infrastruktúrával éles környezetbe állítani, miközben megőrizzük azt a rugalmasságot és irányítást, amelyre a fejlesztőknek szükségük van ahhoz, hogy az ügynököket saját környezeteikbe illesszék.

Az új harness- és sandbox-funkciók először Pythonban lesznek elérhetők, a TypeScript támogatás pedig egy későbbi kiadásban várható. Dolgozunk azon is, hogy további ügynökfunkciókat, köztük a kódmódot és az alügynököket, elérhetővé tegyük Pythonban és TypeScriptben is.

Emellett szeretnénk idővel közelebb hozni egymáshoz a tágabb ügynök-ökoszisztémát, több sandboxszolgáltató, integráció és lehetőség támogatásával, hogy a fejlesztők az SDK-t összekapcsolhassák az általuk már használt eszközökkel és rendszerekkel.

Szerző

OpenAI