پرش به محتوای اصلی
OpenAI

۲۶ فروردین ۱۴۰۵

محصول

تکامل بعدیِ Agents SDK

Agents SDK به‌روزرسانی‌شده به توسعه‌دهندگان کمک می‌کند عامل‌هایی بسازند که بتوانند فایل‌ها را بررسی کنند، فرمان‌ها را اجرا کنند، کد را ویرایش کنند و در محیط‌های سندباکسِ کنترل‌شده روی وظایف بلندمدت کار کنند.

در حال بارگذاری…

ما در حال معرفی قابلیت‌های جدیدی به SDK عامل‌ها هستیم که زیرساختی استاندارد را در اختیار توسعه‌دهندگان قرار می‌دهد؛ زیرساختی که شروع کار با آن آسان است و به‌درستی برای مدل‌های OpenAI ساخته شده است: یک بستر بومیِ مدل که به عامل‌ها امکان می‌دهد در سراسر فایل‌ها و ابزارهای موجود روی یک رایانه کار کنند و به‌علاوه اجرای بومی در سندباکس برای اجرای ایمن آن کارها است.

برای مثال، توسعه‌دهندگان می‌توانند به یک عامل یک فضای کاری کنترل‌شده، دستورالعمل‌های صریح، و ابزارهای موردنیاز برای بررسی شواهد بدهند:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

توسعه‌دهندگان برای ساخت عامل‌های مفید، به چیزی فراتر از بهترین مدل‌ها نیاز دارند—آن‌ها به سیستم‌هایی نیاز دارند که از نحوه بررسی فایل‌ها، اجرای فرمان‌ها، نوشتن کد و ادامه دادن کار در طول مراحل متعدد توسط عامل‌ها پشتیبانی کنند.

سیستم‌هایی که امروز وجود دارند، با ملاحظاتی همراه‌اند، زیرا تیم‌ها از نمونه‌های اولیه به تولید می‌روند. چارچوب‌های مستقل از مدل انعطاف‌پذیرند، اما به‌طور کامل از قابلیت‌های مدل‌های پیشرو استفاده نمی‌کنند؛ SDKهای ارائه‌دهنده مدل می‌توانند به مدل نزدیک‌تر باشند، اما اغلب دید کافی به بستر ندارند؛ و APIهای عاملِ مدیریت‌شده می‌توانند استقرار را ساده‌تر کنند، اما محل اجرای عامل‌ها و نحوه دسترسی آن‌ها به داده‌های حساس را محدود می‌کنند.

در اینجا نظر برخی از مشتریانی که SDK جدید را همراه ما آزمایش کردند آمده است:

“GPT-5.4 معیار جدیدی برای کارهای حقوقیِ سنگین از نظر اسناد تعیین می‌کند. در ارزیابی BigLaw Bench ما، امتیاز 91% را کسب کرد. در مقایسه با سایر مدل‌ها، GPT-5.4 در حال حاضر در ساختاربندی تحلیل‌های معاملاتی پیچیده، حفظ دقت در سراسر قراردادهای طولانی، و ارائه سطح بالای جزئیاتی که متخصصان حقوقی نیاز دارند بهتر است.”
— نیکو گروپن، رئیس پژوهش‌های کاربردی در Harvey

چارچوبی توانمندتر برای حلقه عامل

با انتشار نسخه امروز، بستر Agents SDK برای عامل‌هایی که با اسناد، فایل‌ها و سیستم‌ها کار می‌کنند، توانمندتر می‌شود. اکنون حافظه قابل‌پیکربندی، هماهنگ‌سازی آگاه از سندباکس، ابزارهای سیستم فایل مشابه Codex و یکپارچه‌سازی‌های استانداردشده با قابلیت‌های پایه‌ای را اضافه می‌کند که در سیستم‌های عامل پیشرو در حال رایج شدن هستند.

این قابلیت‌های پایه شامل استفاده از ابزار از طریق MCP(در یک پنجره جدید باز می‌شود)، افشای تدریجی از طریق مهارت‌ها(در یک پنجره جدید باز می‌شود)، دستورالعمل‌های سفارشی از طریق AGENTS.md(در یک پنجره جدید باز می‌شود)، اجرای کد با استفاده از ابزار شل(در یک پنجره جدید باز می‌شود) ، ویرایش فایل‌ها با استفاده از ابزار اعمال وصله(در یک پنجره جدید باز می‌شود) ، و موارد دیگر. این هسته به مرور زمان همچنان الگوها و سازه‌های بنیادین عامل‌محور جدیدی را در خود جای خواهد داد، تا توسعه‌دهندگان زمان کمتری را صرف به‌روزرسانی‌های زیرساخت اصلی کنند و زمان بیشتری را صرف منطق مختص حوزه‌ای کنند که عامل‌هایشان را مفید می‌کند.

نموداری که نشان می‌دهد Agent SDK چگونه ورودی کاربران، مدل‌ها و ابزارها را برای ساخت عامل‌های هوش مصنوعی به هم متصل می‌کند.
نموداری که نشان می‌دهد چگونه با استفاده از Agent SDK و با مدل‌ها، ابزارها و هماهنگ‌سازی، عامل‌های هوش مصنوعی بسازید.

این بستر همچنین به توسعه‌دهندگان کمک می‌کند تا با هم‌راستا کردن اجرا با شیوه‌ای که آن مدل‌ها در آن بهترین عملکرد را دارند، بخش بیشتری از قابلیت‌های یک مدل پیشرو را آزاد کنند. این کار عامل‌ها را به الگوی طبیعی عملکرد مدل نزدیک‌تر نگه می‌دارد و قابلیت اطمینان و عملکرد را در وظایف پیچیده بهبود می‌بخشد—به‌ویژه زمانی که کار طولانی‌مدت است یا در میان مجموعه متنوعی از ابزارها و سیستم‌ها هماهنگ می‌شود.

علاوه بر این، ما می‌دانیم که هر محصولی منحصربه‌فرد است و به‌ندرت می‌توان آن را دقیقاً در یک قالب گنجاند. ما Agents SDK را طوری طراحی کردیم که از این تنوع پشتیبانی کند. توسعه‌دهندگان یک بستر آماده‌به‌کار و درعین‌حال منعطف دریافت می‌کنند که تطبیق آن با پشته فناوری خودشان را آسان می‌سازد؛ از جمله استفاده از ابزارها، حافظه، و محیط سندباکس.

اجرای بومی در سندباکس

Agents SDK به‌روزرسانی‌شده به‌صورت بومی از اجرای سندباکس پشتیبانی می‌کند، بنابراین عامل‌ها می‌توانند در محیط‌های کنترل‌شده رایانه‌ای با فایل‌ها، ابزارها و وابستگی‌های موردنیازشان برای یک وظیفه اجرا شوند.

بسیاری از عامل‌های مفید به یک فضای کاری نیاز دارند که در آن بتوانند فایل‌ها را بخوانند و بنویسند، موارد وابسته را نصب کنند، کد اجرا کنند و با اطمینان از ابزارها استفاده کنند. پشتیبانی بومی از سندباکس، آن لایه اجرا را به‌صورت آماده در اختیار توسعه‌دهندگان قرار می‌دهد، به‌جای اینکه آن‌ها را مجبور کند خودشان این لایه را کنار هم بسازند.

توسعه‌دهندگان می‌توانند سندباکس خود را بیاورند یا از پشتیبانی داخلی برای Blaxel، Cloudflare، Daytona، E2B، Modal، Runloop و Vercel بهره‌مند شوند.

برای قابل حمل کردن آن محیط‌ها میان ارائه‌دهندگان، SDK همچنین یک انتزاع‌سازی اساس نامه برای توصیف فضای کاری عامل معرفی می‌کند. توسعه‌دهندگان می‌توانند فایل‌های محلی را متصل کنند، پوشه‌های خروجی را تعریف کنند و داده‌ها را از ارائه‌دهندگان ذخیره‌سازی، از جمله AWS S3، Google Cloud Storage، Azure Blob Storage و Cloudflare R2، وارد کنند.

این به توسعه‌دهندگان روشی یکپارچه ارائه می‌دهد تا محیط عامل را از نمونه اولیه محلی تا استقرار در تولید شکل دهند. همچنین به مدل یک فضای کاری قابل پیش‌بینی ارائه می‌دهد: اینکه ورودی‌ها را کجا پیدا کند، خروجی‌ها را کجا بنویسد، و چگونه کار را در طول یک وظیفه طولانی‌مدت سازمان‌یافته نگه دارد.

لوگوهای Daytona، E2B، مودال، Cloudflare، Vercel، Blaxel و Runloop

تفکیک بستر از محاسبات برای امنیت، دوام و مقیاس‌پذیری

سیستم‌های عاملی باید با این فرض طراحی شوند که تلاش‌هایی برای تزریق اعلان و استخراج داده‌ها وجود خواهد داشت. جدا کردن ابزار و توان پردازشی کمک می‌کند اعتبارنامه‌ها وارد محیط‌هایی نشوند که کدی که مدل تولید می‌کند در آن‌ها اجرا می‌شود.

همچنین امکان اجرای پایدار را فراهم می‌کند. وقتی وضعیتِ عامل بیرونی‌سازی شود، از دست رفتن یک کانتینر سندباکس به معنای از دست رفتن اجرا نیست. با قابلیت‌های داخلی snapshotting و rehydration، Agents SDK می‌تواند وضعیت عامل را در یک کانتینر جدید بازیابی کند و اگر محیط اصلی از کار بیفتد یا منقضی شود، از آخرین چک‌پوینت ادامه دهد.

در نهایت، این موضوع عامل‌ها را مقیاس‌پذیرتر می‌کند. اجراهای عامل‌ها می‌توانند از یک سندباکس یا چندین سندباکس استفاده کنند، فقط در صورت نیاز سندباکس‌ها را فراخوانی کنند، عامل‌های فرعی را به محیط‌های ایزوله هدایت کنند و برای اجرای سریع‌تر، کار را در کانتینرها به‌صورت موازی اجرا کنند.

نمودار جریانی که نشان می‌دهد Agent SDK چگونه عامل‌های هوش مصنوعی را قادر می‌سازد برای وظایف پیچیده‌تر از منابع محاسباتی بیشتری استفاده کنند.
نموداری که نشان می‌دهد عامل‌های هوش مصنوعی ساخته‌شده با Agent SDK چگونه می‌توانند سامانه‌های محاسباتی مجزا را هماهنگ‌سازی کنند، به‌گونه‌ای که بارهای کاری به‌صورت مستقل اجرا شوند و در عین حال از وظایف پیشرفته‌تر پشتیبانی شود.

قیمت گذاری و در دسترس بودن

این قابلیت‌های جدید Agents SDK به‌طور عمومی از طریق API برای همه مشتریان در دسترس هستند و از قیمت استاندارد API بر اساس توکن‌ها و استفاده از ابزارها بهره می‌برند.

بعد چه می‌شود؟

هم‌زمان با ادامه توسعه Agents SDK، ما به گسترش قابلیت‌هایی که توسعه‌دهندگان می‌توانند با آن ایجاد کنند ادامه خواهیم داد تا استقرار عامل‌های توانمندتر در محیط تولید را با زیرساخت سفارشی کمتر آسان‌تر کنیم، در عین حال انعطاف‌پذیری و کنترلی که توسعه‌دهندگان برای تطبیق عامل‌ها با محیط‌های خود نیاز دارند، حفظ شود.

قابلیت‌های جدید هارنس و سندباکس ابتدا برای Python عرضه می‌شوند و پشتیبانی از TypeScript برای نسخه‌ای در آینده برنامه‌ریزی شده است. ما همچنین در حال کار هستیم تا قابلیت‌های بیشتری برای عامل، از جمله حالت کدنویسی و زیرعامل‌ها، را به هر دو زبان Python و TypeScript اضافه کنیم.

علاوه بر این، ما می‌خواهیم در گذر زمان به گرد هم آوردن اکوسیستم گسترده‌تر عامل کمک کنیم؛ با پشتیبانی از ارائه‌دهندگان محیط سندباکس بیشتر، یکپارچه‌سازی‌های بیشتر و راه‌های بیشتری برای توسعه‌دهندگان تا بتوانند SDK را به ابزارها و سامانه‌هایی که هم‌اکنون استفاده می‌کنند متصل کنند.

نویسنده

OpenAI