Үндсэн агуулга руу алгасах
OpenAI

2026 оны дөрөвдүгээр сарын 15

Бүтээгдэхүүн

Agents SDK-ийн дараагийн хувьсал

Шинэчлэгдсэн Agents SDK нь хөгжүүлэгчдэд хяналттай sandbox орчинд файл шалгах, команд ажиллуулах, код засах, урт хугацааны даалгавар дээр ажиллах агентууд бүтээхэд тусалдаг.

Ачаалж байна…

Бид хөгжүүлэгчдэд эхлэхэд хялбар, OpenAI загваруудад зөвөөр бүтээгдсэн стандартчилсан дэд бүтэц өгөх Agents SDK-ийн шинэ боломжуудыг танилцуулж байна: агентуудад компьютер дээрх файл, хэрэгслүүдийн хооронд ажиллах боломж олгох загварын native harness, мөн тэр ажлыг аюулгүй гүйцэтгэх native sandbox execution.

Жишээлбэл, хөгжүүлэгчид агентэд хяналттай ажлын талбар, тодорхой заавар, нотолгоог шалгахад хэрэгтэй хэрэгслүүдийг өгч болно:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Хөгжүүлэгчдэд хэрэгцээтэй агент бүтээхэд зөвхөн хамгийн сайн загварууд хангалтгүй—тэдэнд агентууд файл шалгах, команд ажиллуулах, код бичих, олон алхмын турш үргэлжлүүлэн ажиллахыг дэмжих системүүд хэрэгтэй.

Өнөөдөр байгаа системүүд багууд прототипоос үйлдвэрлэл рүү шилжихэд тодорхой буултуудтай тулгардаг. Загвараас ангид хүрээнүүд уян хатан боловч хил хязгаар загваруудын чадамжийг бүрэн ашиглаж чаддаггүй; загвар нийлүүлэгчийн SDK-ууд загварт илүү ойр байж болох ч harness доторх харагдац ихэнхдээ хангалтгүй; харин managed agent API-ууд байршуулахыг хялбарчилдаг ч агентууд хаана ажиллах, мэдрэмтгий өгөгдөлд хэрхэн хандахыг хязгаарладаг.

Бидэнтэй хамт шинэ SDK-г туршсан хэрэглэгчдийн заримаас юу хэлснийг энд оруулав:

«Шинэчлэгдсэн Agents SDK нь өмнөх аргууд хангалттай найдвартай шийдэж чадаагүй нэг чухал эмнэлзүйн бүртгэлийн ажлын урсгалыг автоматжуулахад бидэнд үйлдвэрлэлд ашиглахуйц болгосон. Бидний хувьд ялгаа нь зөвхөн зөв metadata гаргаж авахад бус, урт бөгөөд төвөгтэй бүртгэл дэх уулзалт бүрийн хил хязгаарыг зөв ойлгоход байсан. Үүний үр дүнд тухайн үзлэгийн үеэр өвчтөн бүрт юу болж байгааг бид илүү хурдан ойлгож, гишүүдийнхээ тусламж үйлчилгээний хэрэгцээг дэмжин, бидэнтэй холбоотой туршлагыг нь сайжруулж чаддаг болсон.»
— Oscar Health

Агентын давталтад зориулсан илүү чадварлаг harness

Өнөөдрийн хувилбараар Agents SDK-ийн harness нь баримт, файл, системүүдтэй ажилладаг агентуудад илүү чадварлаг болж байна. Одоо энэ нь тохируулж болох memory, sandbox-aware orchestration, Codex-тэй төстэй filesystem хэрэгслүүд, мөн хил хязгаар агент системүүдэд түгээмэл болж буй primitives-тай стандартчилсан интеграцуудыг нэмж байна.

Эдгээр primatives-д MCP(шинэ цонхонд нээгдэнэ)-ээр дамжуулсан хэрэгсэл ашиглалт, skills(шинэ цонхонд нээгдэнэ)-ээр дамжуулсан progressive disclosure, AGENTS.md(шинэ цонхонд нээгдэнэ)-ээр дамжуулсан custom instructions, shell(шинэ цонхонд нээгдэнэ) хэрэгслийг ашигласан код ажиллуулалт, apply patch(шинэ цонхонд нээгдэнэ) хэрэгслийг ашигласан файл засвар, болон бусад зүйлс орно. Harness нь цаг хугацааны явцад шинэ agentic pattern-ууд болон primitives-ийг үргэлжлүүлэн шингээх тул хөгжүүлэгчид үндсэн дэд бүтцийн шинэчлэлд бага цаг зарцуулж, агентуудаа хэрэгцээтэй болгодог салбарын онцлог логикт илүү төвлөрөх боломжтой.

Агент SDK нь хэрэглэгчийн оролт, загварууд, хэрэгслүүдийг холбон AI агентууд бүтээхийг харуулсан диаграм.
Загварууд, хэрэгслүүд, зохицуулалтыг ашиглан Agent SDK-ээр AI агентууд хэрхэн бүтээхийг харуулсан диаграм.

Harness нь мөн гүйцэтгэлийг тэдгээр загварууд хамгийн сайн ажилладаг арга барилтай нийцүүлснээр хөгжүүлэгчдэд хил хязгаар загварын чадавхаас илүүг нээж ашиглахад тусалдаг. Ингэснээр агентууд загварын төрөлх ажиллагааны хэв маягт илүү ойр байж, нарийн төвөгтэй даалгаварт найдвартай байдал ба гүйцэтгэлийг сайжруулна—ялангуяа ажил урт хугацаанд үргэлжлэх эсвэл олон төрлийн хэрэгсэл, системүүдийн хооронд уялдуулагдах үед.

Нэмж хэлэхэд, бүтээгдэхүүн бүр өвөрмөц бөгөөд хэвэнд яг таарна гэж бараг үгүйг бид ойлгодог. Бид Agents SDK-ийг энэ олон янз байдлыг дэмжихээр зохиосон. Хөгжүүлэгчид бэлэн мөртлөө уян хатан harness авна—ингэснээр хэрэгсэл ашиглалт, memory, sandbox орчин зэрэг өөрсдийн stack-д тааруулан өөрчлөхөд хялбар болдог.

Native sandbox execution

Шинэчлэгдсэн Agents SDK нь sandbox execution-ийг native байдлаар дэмждэг тул агентууд даалгаварт хэрэгтэй файл, хэрэгсэл, dependencies-тэй хяналттай компьютерийн орчинд ажиллах боломжтой.

Олон хэрэгцээтэй агентуудад файл уншиж бичих, dependencies суулгах, код ажиллуулах, хэрэгслүүдийг аюулгүй ашиглах ажлын талбар хэрэгтэй байдаг. Native sandbox дэмжлэг нь хөгжүүлэгчдэд энэ execution давхаргыг өөрсдөө хэсэгчлэн угсрах шаардлагагүйгээр шууд бэлнээр өгдөг.

Хөгжүүлэгчид өөрсдийн sandbox-оо ашиглах эсвэл Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel-д зориулсан built-in дэмжлэгийг ашиглаж болно.

Эдгээр орчнуудыг provider-уудын хооронд зөөвөрлөх боломжтой болгохын тулд SDK нь мөн агентын ажлын талбарыг дүрслэх манифест abstraction-ийг танилцуулж байна. Хөгжүүлэгчид локал файлуудыг mount хийх, гаралтын сангуудыг тодорхойлох, мөн AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2 зэрэг storage provider-уудаас өгөгдөл оруулж ирэх боломжтой.

Ингэснээр хөгжүүлэгчид агентын орчныг локал прототипоос үйлдвэрлэлийн байршуулалт хүртэл нэгэн жигд байдлаар хэлбэржүүлэх боломжтой болно. Мөн энэ нь загварт урьдчилан таамаглах боломжтой ажлын талбар өгдөг: оролтуудыг хаанаас олох, гаралтуудыг хаана бичих, урт хугацааны даалгаврын турш ажлыг хэрхэн эмх цэгцтэй байлгах.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop логонууд

Аюулгүй байдал, найдвартай үргэлжлэл, хэмжээг тэлэхийн тулд harness-ийг compute-ээс салгах нь

Агент системүүдийг өгөгдөл injection болон мэдээлэл алдагдуулах оролдлого гарна гэсэн таамгаар зохион бүтээх ёстой. Harness болон compute-ийг салгах нь загвараар үүсгэсэн код ажилладаг орчноос нууц мэдээлэл, нэвтрэх эрхүүдийг хол байлгахад тусалдаг.

Энэ нь мөн найдвартай үргэлжлэх execution-ийг боломжтой болгодог. Агентын төлөв гадагш хадгалагдсан үед sandbox контейнер алдагдана гэдэг нь run алдагдана гэсэн үг биш. Built-in snapshotting болон rehydration-ийн тусламжтайгаар Agents SDK нь эх орчин эвдэрсэн эсвэл хугацаа нь дууссан тохиолдолд агентын төлвийг шинэ контейнерт сэргээж, сүүлийн checkpoint-оос үргэлжлүүлэх боломжтой.

Эцэст нь, энэ нь агентуудыг илүү өргөтгөх боломжтой болгодог. Агентын run-ууд нэг sandbox эсвэл олон sandbox ашиглаж, зөвхөн шаардлагатай үед sandbox дуудах, дэд агентуудыг тусгаарлагдсан орчин руу чиглүүлэх, мөн илүү хурдан гүйцэтгэлд хүрэхийн тулд ажлыг контейнерүүдийн хооронд зэрэгцүүлэн ажиллуулах боломжтой.

Agent SDK нь AI агентуудад илүү нарийн төвөгтэй даалгаварт нэмэлт тооцооллын нөөц ашиглах боломж олгодгийг үзүүлсэн урсгал диаграм.
Агент SDK-ээр бүтээсэн AI агентууд тусдаа тооцооллын системүүдийг зохицуулж, илүү дэвшилтэт даалгавруудыг дэмжихийн зэрэгцээ ажлын ачааллыг бие даан ажиллуулах боломжийг харуулсан диаграм.

Үнэ ба хүртээмж

Эдгээр шинэ Agents SDK боломжууд нь API-ээр дамжин бүх хэрэглэгчдэд ерөнхийдөө нээлттэй болсон бөгөөд токен болон хэрэгсэл ашиглалтад суурилсан стандарт API үнийг хэрэглэнэ.

Дараа нь юу вэ

Бид Agents SDK-ийг цаашид хөгжүүлэхийн хэрээр хөгжүүлэгчид үүгээр юу бүтээж болохыг үргэлжлүүлэн өргөжүүлж, илүү чадварлаг агентуудыг үйлдвэрлэлд оруулахыг бага custom дэд бүтэцтэйгээр хялбарчилна, мөн агентуудыг өөрсдийн орчинд нийцүүлэхэд хэрэгтэй уян хатан байдал, хяналтыг хадгална.

Шинэ harness болон sandbox боломжууд эхлээд Python дээр гарч байгаа бөгөөд TypeScript-ийн дэмжлэгийг дараагийн хувилбарт төлөвлөсөн. Мөн бид code mode болон дэд агентуудыг багтаасан нэмэлт агент чадамжуудыг Python болон TypeScript аль алинд нь авчрахаар ажиллаж байна.

Нэмж хэлэхэд, илүү олон sandbox provider, илүү олон интеграци, мөн хөгжүүлэгчид SDK-ийг аль хэдийн ашиглаж буй хэрэгсэл, системүүддээ холбох илүү олон аргаар өргөн хүрээний агент экосистемийг цаг хугацааны явцад илүү нэгдмэл болгоход бид туслахыг хүсэж байна.

Зохиогч

OpenAI