Przejdź do treści głównej
OpenAI

15 kwietnia 2026

Produkt

Nowa wersja zestawu Agents SDK

Ulepszony zestaw Agents SDK pomaga programistom tworzyć agenty, które mogą sprawdzać pliki, uruchamiać polecenia, edytować kod i realizować długotrwałe zadania w kontrolowanych, odizolowanych środowiskach.

Ładowanie…

W tej wersji wprowadzamy nowe możliwości zapewniające programistom ustandaryzowaną infrastrukturę, którą ułatwia rozpoczęcie pracy i jest przygotowana z myślą o modelach OpenAI: jest to natywne środowisko sterujące, które pozwala agentom pracować na plikach i narzędziach na komputerze, a także zapewnia natywne wykonywanie zadań w odizolowanym środowisku, co zapewnia bezpiecznie uruchamianie zadań.

Na przykład: programiści mogą zapewnić agentowi kontrolowaną przestrzeń roboczą, wyraźne instrukcje oraz narzędzia potrzebne do analizowania dowodów:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Programiści potrzebują nie tylko najlepszych modeli, aby tworzyć użyteczne agenty, ale wymagają również systemów obsługujących sposoby, w jakie agenty przeglądają pliki, uruchamiają polecenia, piszą kod i wykonują wieloetapowe zadania.

Istniejące dziś systemy są obarczone niedoskonałościami, które ujawniają się, gdy zespoły przechodzą od prototypów do wdrożenia w środowisku produkcyjnym. Frameworki niezależne od modelu są elastyczne, ale nie wykorzystują w pełni możliwości modeli pionierskich; zestawy SDK dostawców modeli mogą być bliższe modelowi, ale często nie zapewniają wystarczającej dostępności środowiska sterującego; a zarządzane interfejsy API agentów mogą upraszczać wdrażanie, ale ograniczają obszar działania agentów i ich sposób uzyskiwania dostępu do danych wrażliwych.

Poniżej zamieszczamy kilka opinii klientów, którzy testowali z nami nowy pakiet SDK:

„GPT-5.4 wyznacza nowy standard w zakresie prawniczej pracy z dokumentami. W naszej ocenie BigLaw Bench uzyskał wynik 91%. W porównaniu z innymi modelami GPT-5.4 obecnie lepiej radzi sobie ze strukturyzowaniem złożonych analiz transakcyjnych, utrzymywaniem dokładności w długich umowach oraz dostarczaniem wysokiego poziomu szczegółowości, jakiego wymagają prawnicy.”
— Niko Grupen, kierownik ds. badań stosowanych w Harvey.

Bardziej zaawansowane środowisko sterujące dla pętli agenta

Przedstawiamy dziś nową wersję rozwiązania, która w środowisku sterującym dla agentów w Agents SDK zapewnia nowe możliwości agentom obsługującym dokumenty, pliki i systemy. Użytkownicy otrzymują teraz funkcje konfigurowalnej pamięci, koordynacji uwzględniającej tryb odizolowanego środowiska, narzędzi systemu plików podobnych do tych w Codex oraz ustandaryzowanych integracji z elementami składowymi, które stają się powszechne w pionierskich systemach agentowych.

Te obszary obejmują użycie narzędzi za pośrednictwem MCP(otwiera nowe okno), progresywne ujawnianie za pośrednictwem umiejętności(otwiera nowe okno), niestandardowe instrukcje za pośrednictwem AGENTS.md(otwiera nowe okno), wykonywanie kodu za pomocą narzędzia shell(otwiera nowe okno), edycję plików za pomocą narzędzia apply patch(otwiera nowe okno) i wiele innych. Środowisko sterujące będzie z czasem rozwijane o nowe wzorce i obszary związane z agentami, dzięki czemu programiści będą mogli szybciej aktualizować podstawową infrastrukturę i więcej czasu poświęcać logice danej dziedziny, dzięki której ich agenci są użyteczni.

Schemat pokazujący, w jaki sposób zestaw Agents SDK łączy dane wejściowe użytkownika, modele i narzędzia w celu tworzenia agentów AI.
Schemat przedstawiający tworzenie agentów AI przy użyciu Agents SDK z wykorzystaniem modeli, narzędzi i mechanizmów zarządzania.

Środowisko to pomaga również lepiej wykorzystać możliwości modelu pionierskiego poprzez dostosowanie wykonywania do trybu, w jakim te modele działają najlepiej. W ten sposób agenty będą operować w sposób bardziej zbliżony do naturalnego działania modelu, co poprawi niezawodność i wydajność w złożonych zadaniach, szczególnie jeśli wykonywane są długotrwałe działania lub operacje są koordynowane z użyciem różnorodnego zestawu narzędzi i systemów.

Rozumiemy też, że każdy produkt jest wyjątkowy i rzadko daje się łatwo wtłoczyć w jeden schemat, dlatego zaprojektowaliśmy zestaw Agents SDK z myślą o tej różnorodności. Programiści otrzymują środowisko sterujące, które jest gotowe do użycia, a zarazem elastyczne, dzięki czemu można je łatwo dostosować do własnego stosu technologicznego, co obejmuje korzystanie z narzędzi, pamięci i środowiska odizolowanego.

Natywne wykonywanie w środowisku odizolowanym

Zaktualizowany zestaw Agents SDK natywnie obsługuje wykonywanie w środowisku odizolowanym, dzięki czemu agenty mogą działać w kontrolowanych środowiskach komputerowych, obsługując pliki, narzędzia i zależności potrzebne do wykonania zadania.

Wiele użytecznych agentów wymaga przestrzeni roboczej, w której mogą odczytywać i zapisywać pliki, instalować zależności, uruchamiać kod i bezpiecznie korzystać z narzędzi. Natywna obsługa środowiska odizolowanego zapewnia programistom tę warstwę wykonawczą od razu, a nie zmusza ich do samodzielnego składania jej z różnych elementów.

Programiści mogą korzystać z własnego środowiska odizolowanego lub z wbudowanej obsługi Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop i Vercel.

Aby te środowiska można było przenosić między dostawcami, zestaw SDK wprowadza również abstrakcję manifestu do opisywania przestrzeni roboczej agenta. Programiści mogą montować pliki lokalne, definiować katalogi wyjściowe i importować dane od dostawców pamięci masowej, w tym AWS S3, Google Cloud Storage, Azure Blob Storage i Cloudflare R2.

Oferuje to programistom spójny sposób kształtowania środowiska agenta – od lokalnego prototypu po wdrożenie produkcyjne. Zapewnia też modelowi przewidywalną przestrzeń roboczą pozwalającą na określenie, gdzie znaleźć dane wejściowe, gdzie zapisywać dane wyjściowe i jak utrzymać porządek w pracy w ramach długotrwałego zadania.

Logotypy Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Oddzielenie warstwy sterującej od mocy obliczeniowej oznacza bezpieczeństwo, niezawodność i skalowalność

Systemy agentowe należy projektować przy założeniu występowania ataków polegających na wstrzykiwaniu poleceń i eksfiltracji danych. Oddzielenie warstwy sterującej od mocy obliczeniowej pomaga nie dopuszczać do tego, by poświadczenia trafiały do środowisk, w których wykonywany jest kod generowany przez model.

Pozwala to również na długotrwałe wykonywanie. Gdy stan agenta jest eksternalizowany, utrata kontenera środowiska odizolowanego nie oznacza utraty przebiegu działania. Dzięki wbudowanym funkcjom tworzenia migawek i rehydratacji zestaw Agents SDK może przywrócić stan agenta w nowym kontenerze i wznowić działanie od ostatniego punktu kontrolnego, jeśli pierwotne środowisko ulegnie awarii lub wygaśnie.

Ponadto agenty zapewniają lepsze skalowanie. Przebiegi agentów mogą korzystać z jednego środowiska odizolowanego lub z wielu, uruchamiać środowiska odizolowane tylko wtedy, gdy są potrzebne, kierować podagentów do odizolowanych środowisk i równolegle realizować zadania w wielu kontenerach, aby przyspieszyć wykonywanie.

Diagram przepływu ilustrujący, jak zestaw Agents SDK umożliwia agentom AI korzystanie z dodatkowych zasobów obliczeniowych w celu wykonywania bardziej złożonych zadań.
Diagram przedstawiający, jak agenty AI zbudowane przy użyciu Agents SDK mogą zarządzać oddzielnymi systemami obliczeniowymi, umożliwiając niezależne uruchamianie obciążeń roboczych i jednocześnie obsługując bardziej zaawansowane zadania.

Cennik i dostępność

Te nowe możliwości zestawu SDK Agents są ogólnie dostępne dla wszystkich klientów za pośrednictwem interfejsu API i podlegają standardowym stawkom API w oparciu o wykorzystane tokenów i zakres używania narzędzi.

Dalsze działania

W miarę dalszego rozwoju będziemy nadal rozszerzać możliwości zestawu Agents SDK, jakie daje on programistom, ułatwiając wdrażanie do środowiska produkcyjnego coraz bardziej zaawansowanych agentów przy użyciu mniejszej ilości niestandardowej infrastruktury oraz przy jednoczesnym zachowaniu elastyczności i poziomu kontroli niezbędnych programistom do dopasowania agentów do własnych środowisk.

Nowe funkcje środowiska sterującego i odizolowanego są najpierw udostępniane w Pythonie, a obsługa TypeScript jest planowana w jednej z przyszłych wersji. Pracujemy również nad udostępnieniem dodatkowych możliwości agenta, w tym trybu kodowania i agentów podrzędnych, zarówno w Pythonie, jak i w TypeScript.

Dodatkowo chcemy z czasem pomóc zintegrować szerszy ekosystem agentów, zapewniając obsługę większej liczby dostawców środowisk odizolowanych, integracji i sposobów, dzięki którym programiści będą mogli podłączać SDK do narzędzi i systemów, z których już korzystają.