امروز ما AgentKit را معرفی کردهایم که مجموعه کاملی از ابزارها است که به توسعهدهندگان و شرکتها برای ساخت، استقرار و بهینهسازی عاملها کمک میکند. تا به امروز، ساختن عاملها به معنای کار با ابزارهای پراکنده بود — هماهنگی پیچیده بدون نسخهبندی، اتصالات سفارشی، خطوط لوله ارزیابی دستی، تنظیم درخواستها و هفتهها کار بر روی رابط کاربری قبل از راهاندازی. امروز توسعهدهندگان با AgentKit میتوانند جریان کار را بهصورت بصری طراحی کرده و با استفاده از بلوکهای ساختمانی جدید مانند زیر، رابطهای کاربری عاملمحور را سریعتر راهاندازی کنند:
- Agent Builder: یک canvas بصری برای ایجاد و نسخهسازی گردش کارهای چندعاملی
- رجیستری کانکتور: یک مکان مرکزی برای ادمینها تا نحوه اتصال دادهها و ابزارها را در محصولات OpenAI مدیریت کنند
- ChatKit: ابزاری برای تعبیه تجربیات عامل مبتنی بر گفتگو قابل تنظیم در محصول شما
همچنین با افزودن ویژگیهای جدیدی مانند مجموعهدادهها، درجهبندی ردیابی، بهینهسازی خودکار درخواستها و پشتیبانی از مدلهای شخص ثالث برای اندازهگیری و بهبود عملکرد عاملها، در حال گسترش قابلیتهای ارزیابی هستیم.
از زمان انتشار Responses API و Agents SDK در ماه مارس، شاهد بودهایم که توسعهدهندگان و شرکتها، گردشهای کاری عاملی سرتاسری را برای تحقیقات عمیق، پشتیبانی مشتری و موارد دیگر ایجاد کردهاند. Klarna یک عامل پشتیبانی ساخت که میتواند دو سوم از تمام بلیطها را مدیریت کند و Clay با یک عامل فروش رشد 10 برابری را تجربه کرد. AgentKit بر پایه Responses API ساخته شده است تا به توسعهدهندگان کمک کند عاملها را بهصورت کارآمدتر و قابلاعتمادتر بسازند.
همانطور که گردش کار عامل پیچیده تر می شود، توسعه دهندگان به دید واضح تری در مورد نحوه کار خود نیاز دارند. Agent Builder(در یک پنجره جدید باز میشود) یک بوم بصری فراهم میکند تا منطق را با نودهای drag-and-drop بسازی، ابزارها را متصل کنی و quadrailهای سفارشی تنظیم کنی این ابزار از اجرای پیشنمایش، پیکربندی eval درونخطی و نسخهبندی کامل پشتیبانی میکند—ایدهآل برای تکرار سریع

سازندگان میتوانند با یک canvas خالی یا با قالبهای از پیش ساخته شده شروع کنند.
در Ramp، تیم فقط در عرض چند ساعت از یک بوم خالی به یک عامل خریدار رسید:
Agent Builder فرآیندهایی را که زمانی ماهها به هماهنگی پیچیده، کد سفارشی و بهینهسازی دستی نیاز داشتند، به چند ساعت کاهش داد. canvas بصری محصول، قانون و مهندسی را در یک صفحه نگه میدارد و چرخههای تکرار را تا ۷۰ درصد کاهش میدهد و یک عامل را در دو اسپرینت به جای دو چهارم زنده میکند.
به همین ترتیب، شرکت LY - یک شرکت پیشرو در زمینه فناوری و خدمات اینترنتی ژاپنی - در کمتر از دو ساعت یک عامل دستیار کار با Agent Builder ساخت.
"Agent Builder به ما این امکان را داد تا عاملها را به روشی کاملاً جدید سازماندهی کنیم، بهطوری که مهندسان و کارشناسان در موضوعات مختلف همه در یک رابط با هم همکاری کنند. ما اولین جریان کاری چندعاملی خود را ساخته و آن را در کمتر از دو ساعت اجرا کردیم و زمان ایجاد و استقرار عوامل را بهطور چشمگیری تسریع کردیم.»
ما همچنین در حال راهاندازی یک فهرست رابط برای شرکتها هستیم تا دادهها را در چندین فضای کاری و سازمان مدیریت و نگهداری کنند. Connector Registry(در یک پنجره جدید باز میشود) منابع داده را در یک پنل مدیریتی واحد در سراسر ChatGPT و API تجمیع میکند. این رجیستری شامل تمامی کانکتورهای از پیش ساخته شده مانند Dropbox، Google Drive، Sharepoint و Microsoft Teams و همچنین MCPهای شخص ثالث است.
توسعهدهندگان همچنین میتوانند Guardrails(در یک پنجره جدید باز میشود) را در Agent Builder فعال کنند - یک لایه ایمنی ماژولار و متنباز که به محافظت از عاملها در برابر رفتارهای ناخواسته یا مخرب کمک میکند. Quadrailها میتوانند اطلاعات شخصی را پنهان یا علامتگذاری کنند، دور زدنها را شناسایی کنند و سایر محافظتها را اعمال نموده و ساخت و استقرار عاملهای قابلاعتماد و ایمن را آسانتر کنند. گاردریلها میتوانند بهصورت مستقل یا از طریق کتابخانه گاردریل برای Python(در یک پنجره جدید باز میشود) و JavaScript(در یک پنجره جدید باز میشود) مستقر شوند.
استقرار رابطهای کاربری گفتگو برای عاملها میتواند بهطور شگفتآوری پیچیده باشد—مدیریت پاسخهای استریمینگ، مدیریت تردها، نمایش فرآیند فکر کردن مدل و طراحی تجربههای جذاب درونچت. ChatKit(در یک پنجره جدید باز میشود) کار جاسازی عاملهای مبتنی بر گفتگو را ساده میکند تا با محصولت کاملاً بومی و یکپارچه به نظر برسند. میتوان آن را در اپلیکیشنها یا وبسایتها جاسازی و سفارشیسازی کرد تا با تم یا برند تو هماهنگ شود.
" ما بیش از دو هفته در زمان ساخت یک عامل پشتیبانی برای جامعه توسعهدهندگان Canva خود با ChatKit صرفهجویی کردیم و آن را در کمتر از یک ساعت ادغام کردیم. این عامل پشتیبانی نحوه تعامل توسعهدهندگان با مستندات ما را با تبدیل آن به یک تجربه مکالمهای تغییر میدهد و ساخت برنامهها و ادغامها را در Canva آسان میکند."
ChatKit در حال حاضر طیف وسیعی از موارد استفاده، از دستیاران Internal Knowledge و راهنماهای ورود گرفته تا پشتیبانی مشتری و عوامل تحقیقاتی را تقویت میکند. عامل پشتیبانی مشتری HubSpot(در یک پنجره جدید باز میشود)یکی از مثالهاست:

ساخت عاملهای قابل اعتماد و آماده برای تولید نیاز به ارزیابیهای دقیق عملکرد دارد. سال گذشته، Evals(در یک پنجره جدید باز میشود) را راهاندازی کردیم تا به توسعهدهندگان کمک کنیم اعلانها را آزمایش کرده و رفتار مدل را بسنجند. ما اکنون در حال اضافه کردن چهار قابلیت جدید هستیم که ساخت ارزیابیها را حتی آسانتر میکند:
- مجموعهدادهها–بهسرعت evalهای عامل را کاملاً از صفر بساز و بهمرور با نمرهدهندههای خودکار و حاشیهنویسی انسانی گسترششان بده.
- ردیابی درجهبندی–ارزیابیهای سرتاسری از گردشهای کاری عاملمحور را اجرا کن و درجهبندی را خودکار کن تا کاستیها را مشخص کنی.
- بهینهسازی خودکار اعلانها– اعلانهای بهبود یافته را بر اساس حاشیهنویسیهای انسانی و خروجیهای نمرهدهنده تولید کن.
- پشتیبانی از مدلهای شخص ثالث- ارزیابی مدلهای سایر ارائهدهندگان در پلتفرم OpenAI Evals.
ما پیشتر شاهد پیشرفت اساسی در عملکرد مشتریانی بودهایم که از Evals استفاده میکنند.
پلتفرم ارزیابی زمان توسعه چارچوب بررسی دقیق چندعاملی ما را بیش از ۵۰٪ کاهش داد و دقت عاملها را ۳۰٪ افزایش داد.

تنظیم دقیق تقویتی(در یک پنجره جدید باز میشود) (RFT) به توسعهدهندگان اجازه میدهد مدلهای استدلال ما را شخصیسازی کنند. به طور کلی در OpenAI o4-mini و به صورت بتای خصوصی برای GPT‑5 در دسترس است. ما با دهها مشتری بهطور نزدیک همکاری میکنیم تا RFT برای GPT‑5 را، پیش از انتشار گستردهتر بهبود دهیم.
امروز، دو ویژگی جدید را در آن نسخه بتا RFT معرفی میکنیم که برای افزایش عملکرد عامل حتی بیشتر طراحی شدهاند:
- فراخوانی ابزارهای سفارشی– مدلها آموزش میدهند تا استدلال بهتری داشته و در زمان مناسب ابزارهای صحیح را فراخوانی کنند.
- درجهبندیهای سفارشی– معیارهای ارزیابی سفارشی را برای آنچه در مورد استفاده شما بیشترین اهمیت را دارد، تعیین میکند
از امروز، ChatKit و قابلیتهای جدید Evals بهطور عمومی برای همهٔ توسعهدهندگان در دسترس خواهد بود. Agent Builder به صورت بتا در دسترس است و Connector Registry عرضه بتا خود را برای برخی از مشتریان API، ChatGPT Enterprise و Edu با Global Admin Console(در یک پنجره جدید باز میشود) (که در آن Global Owners میتوانند دامنهها، SSO، و چندین سازمان API را مدیریت کنند) آغاز کرده است. کنسول Global Admin پیشنیاز فعالسازی Connector Registry است. همهٔ این ابزارها در قیمت استاندارد مدلهای API گنجانده شدهاند.
قصد داریم به زودی یک API مستقل برای Workflows و گزینههای استقرار عامل را به ChatGPT اضافه کنیم.
بیصبرانه منتظریم ببینیم چی میسازی.


