تکامل بعدیِ Agents SDK
Agents SDK بهروزرسانیشده به توسعهدهندگان کمک میکند عاملهایی بسازند که بتوانند فایلها را بررسی کنند، فرمانها را اجرا کنند، کد را ویرایش کنند و در محیطهای سندباکسِ کنترلشده روی وظایف بلندمدت کار کنند.
ما در حال معرفی قابلیتهای جدیدی به SDK عاملها هستیم که زیرساختی استاندارد را در اختیار توسعهدهندگان قرار میدهد؛ زیرساختی که شروع کار با آن آسان است و بهدرستی برای مدلهای OpenAI ساخته شده است: یک بستر بومیِ مدل که به عاملها امکان میدهد در سراسر فایلها و ابزارهای موجود روی یک رایانه کار کنند و بهعلاوه اجرای بومی در سندباکس برای اجرای ایمن آن کارها است.
برای مثال، توسعهدهندگان میتوانند به یک عامل یک فضای کاری کنترلشده، دستورالعملهای صریح، و ابزارهای موردنیاز برای بررسی شواهد بدهند:
توسعهدهندگان برای ساخت عاملهای مفید، به چیزی فراتر از بهترین مدلها نیاز دارند—آنها به سیستمهایی نیاز دارند که از نحوه بررسی فایلها، اجرای فرمانها، نوشتن کد و ادامه دادن کار در طول مراحل متعدد توسط عاملها پشتیبانی کنند.
سیستمهایی که امروز وجود دارند، با ملاحظاتی همراهاند، زیرا تیمها از نمونههای اولیه به تولید میروند. چارچوبهای مستقل از مدل انعطافپذیرند، اما بهطور کامل از قابلیتهای مدلهای پیشرو استفاده نمیکنند؛ SDKهای ارائهدهنده مدل میتوانند به مدل نزدیکتر باشند، اما اغلب دید کافی به بستر ندارند؛ و APIهای عاملِ مدیریتشده میتوانند استقرار را سادهتر کنند، اما محل اجرای عاملها و نحوه دسترسی آنها به دادههای حساس را محدود میکنند.
در اینجا نظر برخی از مشتریانی که SDK جدید را همراه ما آزمایش کردند آمده است:
“GPT-5.4 معیار جدیدی برای کارهای حقوقیِ سنگین از نظر اسناد تعیین میکند. در ارزیابی BigLaw Bench ما، امتیاز 91% را کسب کرد. در مقایسه با سایر مدلها، GPT-5.4 در حال حاضر در ساختاربندی تحلیلهای معاملاتی پیچیده، حفظ دقت در سراسر قراردادهای طولانی، و ارائه سطح بالای جزئیاتی که متخصصان حقوقی نیاز دارند بهتر است.”
با انتشار نسخه امروز، بستر Agents SDK برای عاملهایی که با اسناد، فایلها و سیستمها کار میکنند، توانمندتر میشود. اکنون حافظه قابلپیکربندی، هماهنگسازی آگاه از سندباکس، ابزارهای سیستم فایل مشابه Codex و یکپارچهسازیهای استانداردشده با قابلیتهای پایهای را اضافه میکند که در سیستمهای عامل پیشرو در حال رایج شدن هستند.
این قابلیتهای پایه شامل استفاده از ابزار از طریق MCP(در یک پنجره جدید باز میشود)، افشای تدریجی از طریق مهارتها(در یک پنجره جدید باز میشود)، دستورالعملهای سفارشی از طریق AGENTS.md(در یک پنجره جدید باز میشود)، اجرای کد با استفاده از ابزار شل(در یک پنجره جدید باز میشود) ، ویرایش فایلها با استفاده از ابزار اعمال وصله(در یک پنجره جدید باز میشود) ، و موارد دیگر. این هسته به مرور زمان همچنان الگوها و سازههای بنیادین عاملمحور جدیدی را در خود جای خواهد داد، تا توسعهدهندگان زمان کمتری را صرف بهروزرسانیهای زیرساخت اصلی کنند و زمان بیشتری را صرف منطق مختص حوزهای کنند که عاملهایشان را مفید میکند.
این بستر همچنین به توسعهدهندگان کمک میکند تا با همراستا کردن اجرا با شیوهای که آن مدلها در آن بهترین عملکرد را دارند، بخش بیشتری از قابلیتهای یک مدل پیشرو را آزاد کنند. این کار عاملها را به الگوی طبیعی عملکرد مدل نزدیکتر نگه میدارد و قابلیت اطمینان و عملکرد را در وظایف پیچیده بهبود میبخشد—بهویژه زمانی که کار طولانیمدت است یا در میان مجموعه متنوعی از ابزارها و سیستمها هماهنگ میشود.
علاوه بر این، ما میدانیم که هر محصولی منحصربهفرد است و بهندرت میتوان آن را دقیقاً در یک قالب گنجاند. ما Agents SDK را طوری طراحی کردیم که از این تنوع پشتیبانی کند. توسعهدهندگان یک بستر آمادهبهکار و درعینحال منعطف دریافت میکنند که تطبیق آن با پشته فناوری خودشان را آسان میسازد؛ از جمله استفاده از ابزارها، حافظه، و محیط سندباکس.
Agents SDK بهروزرسانیشده بهصورت بومی از اجرای سندباکس پشتیبانی میکند، بنابراین عاملها میتوانند در محیطهای کنترلشده رایانهای با فایلها، ابزارها و وابستگیهای موردنیازشان برای یک وظیفه اجرا شوند.
بسیاری از عاملهای مفید به یک فضای کاری نیاز دارند که در آن بتوانند فایلها را بخوانند و بنویسند، موارد وابسته را نصب کنند، کد اجرا کنند و با اطمینان از ابزارها استفاده کنند. پشتیبانی بومی از سندباکس، آن لایه اجرا را بهصورت آماده در اختیار توسعهدهندگان قرار میدهد، بهجای اینکه آنها را مجبور کند خودشان این لایه را کنار هم بسازند.
توسعهدهندگان میتوانند سندباکس خود را بیاورند یا از پشتیبانی داخلی برای Blaxel، Cloudflare، Daytona، E2B، Modal، Runloop و Vercel بهرهمند شوند.
برای قابل حمل کردن آن محیطها میان ارائهدهندگان، SDK همچنین یک انتزاعسازی اساس نامه برای توصیف فضای کاری عامل معرفی میکند. توسعهدهندگان میتوانند فایلهای محلی را متصل کنند، پوشههای خروجی را تعریف کنند و دادهها را از ارائهدهندگان ذخیرهسازی، از جمله AWS S3، Google Cloud Storage، Azure Blob Storage و Cloudflare R2، وارد کنند.
این به توسعهدهندگان روشی یکپارچه ارائه میدهد تا محیط عامل را از نمونه اولیه محلی تا استقرار در تولید شکل دهند. همچنین به مدل یک فضای کاری قابل پیشبینی ارائه میدهد: اینکه ورودیها را کجا پیدا کند، خروجیها را کجا بنویسد، و چگونه کار را در طول یک وظیفه طولانیمدت سازمانیافته نگه دارد.

سیستمهای عاملی باید با این فرض طراحی شوند که تلاشهایی برای تزریق اعلان و استخراج دادهها وجود خواهد داشت. جدا کردن ابزار و توان پردازشی کمک میکند اعتبارنامهها وارد محیطهایی نشوند که کدی که مدل تولید میکند در آنها اجرا میشود.
همچنین امکان اجرای پایدار را فراهم میکند. وقتی وضعیتِ عامل بیرونیسازی شود، از دست رفتن یک کانتینر سندباکس به معنای از دست رفتن اجرا نیست. با قابلیتهای داخلی snapshotting و rehydration، Agents SDK میتواند وضعیت عامل را در یک کانتینر جدید بازیابی کند و اگر محیط اصلی از کار بیفتد یا منقضی شود، از آخرین چکپوینت ادامه دهد.
در نهایت، این موضوع عاملها را مقیاسپذیرتر میکند. اجراهای عاملها میتوانند از یک سندباکس یا چندین سندباکس استفاده کنند، فقط در صورت نیاز سندباکسها را فراخوانی کنند، عاملهای فرعی را به محیطهای ایزوله هدایت کنند و برای اجرای سریعتر، کار را در کانتینرها بهصورت موازی اجرا کنند.
این قابلیتهای جدید Agents SDK بهطور عمومی از طریق API برای همه مشتریان در دسترس هستند و از قیمت استاندارد API بر اساس توکنها و استفاده از ابزارها بهره میبرند.
همزمان با ادامه توسعه Agents SDK، ما به گسترش قابلیتهایی که توسعهدهندگان میتوانند با آن ایجاد کنند ادامه خواهیم داد تا استقرار عاملهای توانمندتر در محیط تولید را با زیرساخت سفارشی کمتر آسانتر کنیم، در عین حال انعطافپذیری و کنترلی که توسعهدهندگان برای تطبیق عاملها با محیطهای خود نیاز دارند، حفظ شود.
قابلیتهای جدید هارنس و سندباکس ابتدا برای Python عرضه میشوند و پشتیبانی از TypeScript برای نسخهای در آینده برنامهریزی شده است. ما همچنین در حال کار هستیم تا قابلیتهای بیشتری برای عامل، از جمله حالت کدنویسی و زیرعاملها، را به هر دو زبان Python و TypeScript اضافه کنیم.
علاوه بر این، ما میخواهیم در گذر زمان به گرد هم آوردن اکوسیستم گستردهتر عامل کمک کنیم؛ با پشتیبانی از ارائهدهندگان محیط سندباکس بیشتر، یکپارچهسازیهای بیشتر و راههای بیشتری برای توسعهدهندگان تا بتوانند SDK را به ابزارها و سامانههایی که هماکنون استفاده میکنند متصل کنند.


