۱۴ مهر ۱۴۰۴

معرفی AgentKit

ابزارهای جدید برای ساخت، استقرار و بهینه‌سازی عامل‌ها.

در حال بارگذاری…

امروز ما AgentKit را معرفی کرده‌ایم که مجموعه کاملی از ابزارها است که به توسعه‌دهندگان و شرکت‌ها برای ساخت، استقرار و بهینه‌سازی عامل‌ها کمک می‌کند. تا به امروز، ساختن عامل‌ها به معنای کار با ابزارهای پراکنده بود — هماهنگی پیچیده بدون نسخه‌بندی، اتصالات سفارشی، خطوط لوله ارزیابی دستی، تنظیم درخواست‌ها و هفته‌ها کار بر روی رابط کاربری قبل از راه‌اندازی. امروز توسعه‌دهندگان با AgentKit می‌توانند جریان کار را به‌صورت بصری طراحی کرده و با استفاده از بلوک‌های ساختمانی جدید مانند زیر، رابط‌های کاربری عامل‌محور را سریع‌تر راه‌اندازی کنند:

Agent Builder: یک canvas بصری برای ایجاد و نسخه‌سازی گردش کارهای چندعاملی
رجیستری کانکتور: یک مکان مرکزی برای ادمین‌ها تا نحوه اتصال داده‌ها و ابزارها را در محصولات OpenAI مدیریت کنند
ChatKit: ابزاری برای تعبیه تجربیات عامل مبتنی بر گفتگو قابل تنظیم در محصول شما

همچنین با افزودن ویژگی‌های جدیدی مانند مجموعه‌داده‌ها، درجه‌بندی ردیابی، بهینه‌سازی خودکار درخواست‌ها و پشتیبانی از مدل‌های شخص ثالث برای اندازه‌گیری و بهبود عملکرد عامل‌ها، در حال گسترش قابلیت‌های ارزیابی هستیم.

از زمان انتشار Responses API و Agents SDK⁠ در ماه مارس، شاهد بوده‌ایم که توسعه‌دهندگان و شرکت‌ها، گردش‌های کاری عاملی سرتاسری را برای تحقیقات عمیق، پشتیبانی مشتری و موارد دیگر ایجاد کرده‌اند. Klarna یک عامل پشتیبانی ساخت⁠ که می‌تواند دو سوم از تمام بلیط‌ها را مدیریت کند و Clay با یک عامل فروش رشد 10 برابری⁠ را تجربه کرد. AgentKit بر پایه Responses API ساخته شده است تا به توسعه‌دهندگان کمک کند عامل‌ها را به‌صورت کارآمدتر و قابل‌اعتمادتر بسازند.

طراحی گردش‌های کاری با Agent Builder

همانطور که گردش کار عامل پیچیده تر می شود، توسعه دهندگان به دید واضح تری در مورد نحوه کار خود نیاز دارند. Agent Builder⁠(در یک پنجره جدید باز می‌شود) یک بوم بصری فراهم می‌کند تا منطق را با نودهای drag-and-drop بسازی، ابزارها را متصل کنی و quadrailهای سفارشی تنظیم کنی این ابزار از اجرای پیش‌نمایش، پیکربندی eval درون‌خطی و نسخه‌بندی کامل پشتیبانی می‌کند—ایده‌آل برای تکرار سریع

نمای رابط ِ یک جریان اتوماسیون خدمات مشتری در یک ابزار سازنده بصری. canvas گره‌های متصل با برچسب‌های شروع، guardrail برای دور زدن، عامل طبقه‌بندی، اگر/دیگر، عامل بازگشت، عامل نگهداری، عامل اطلاعات، guardrail توهم و پایان را نشان می‌دهد. نوار کناری در سمت چپ انواع گره‌های موجود مانند عامل، Note، File search، Guardrails، MCP و تأیید کاربر را فهرست کرده است. کنترل‌های اصلی شامل گزینه‌هایی برای ارزیابی، کدنویسی، پیش‌نمایش و انتشار هستند.

سازندگان می‌توانند با یک canvas خالی یا با قالب‌های از پیش ساخته شده شروع کنند.

در Ramp، تیم فقط در عرض چند ساعت از یک بوم خالی به یک عامل خریدار رسید:

Agent Builder فرآیندهایی را که زمانی ماه‌ها به هماهنگی پیچیده، کد سفارشی و بهینه‌سازی دستی نیاز داشتند، به چند ساعت کاهش داد. canvas بصری محصول، قانون و مهندسی را در یک صفحه نگه می‌دارد و چرخه‌های تکرار را تا ۷۰ درصد کاهش می‌دهد و یک عامل را در دو اسپرینت به جای دو چهارم زنده می‌کند.

— Ramp

به همین ترتیب، شرکت LY - یک شرکت پیشرو در زمینه فناوری و خدمات اینترنتی ژاپنی - در کمتر از دو ساعت یک عامل دستیار کار با Agent Builder ساخت.

"Agent Builder به ما این امکان را داد تا عامل‌ها را به روشی کاملاً جدید سازماندهی کنیم، به‌طوری که مهندسان و کارشناسان در موضوعات مختلف همه در یک رابط با هم همکاری کنند. ما اولین جریان کاری چندعاملی خود را ساخته و آن را در کمتر از دو ساعت اجرا کردیم و زمان ایجاد و استقرار عوامل را به‌طور چشمگیری تسریع کردیم.»

— LY Corporation

ما همچنین در حال راه‌اندازی یک فهرست رابط برای شرکت‌ها هستیم تا داده‌ها را در چندین فضای کاری و سازمان مدیریت و نگهداری کنند. Connector Registry⁠(در یک پنجره جدید باز می‌شود) منابع داده را در یک پنل مدیریتی واحد در سراسر ChatGPT و API تجمیع می‌کند. این رجیستری شامل تمامی کانکتورهای از پیش ساخته شده مانند Dropbox، Google Drive، Sharepoint و Microsoft Teams و همچنین MCPهای شخص ثالث است.

توسعه‌دهندگان همچنین می‌توانند Guardrails⁠(در یک پنجره جدید باز می‌شود) را در Agent Builder فعال کنند - یک لایه ایمنی ماژولار و متن‌باز که به محافظت از عامل‌ها در برابر رفتارهای ناخواسته یا مخرب کمک می‌کند. Quadrailها می‌توانند اطلاعات شخصی را پنهان یا علامت‌گذاری کنند، دور زدن‌ها را شناسایی کنند و سایر محافظت‌ها را اعمال نموده و ساخت و استقرار عامل‌های قابل‌اعتماد و ایمن را آسان‌تر کنند. گاردریل‌ها می‌توانند به‌صورت مستقل یا از طریق کتابخانه گاردریل برای Python⁠(در یک پنجره جدید باز می‌شود) و JavaScript⁠(در یک پنجره جدید باز می‌شود) مستقر شوند.

تجربیات گفتگوی عاملی را با ChatKit ادغام کنید

استقرار رابط‌های کاربری گفتگو برای عامل‌ها می‌تواند به‌طور شگفت‌آوری پیچیده باشد—مدیریت پاسخ‌های استریمینگ، مدیریت تردها، نمایش فرآیند فکر کردن مدل و طراحی تجربه‌های جذاب درون‌چت. ChatKit⁠(در یک پنجره جدید باز می‌شود) کار جاسازی عامل‌های مبتنی بر گفتگو را ساده می‌کند تا با محصولت کاملاً بومی و یکپارچه به نظر برسند. می‌توان آن را در اپلیکیشن‌ها یا وب‌سایت‌ها جاسازی و سفارشی‌سازی کرد تا با تم یا برند تو هماهنگ شود.

" ما بیش از دو هفته در زمان ساخت یک عامل پشتیبانی برای جامعه توسعه‌دهندگان Canva خود با ChatKit صرفه‌جویی کردیم و آن را در کمتر از یک ساعت ادغام کردیم. این عامل پشتیبانی نحوه تعامل توسعه‌دهندگان با مستندات ما را با تبدیل آن به یک تجربه مکالمه‌ای تغییر می‌دهد و ساخت برنامه‌ها و ادغام‌ها را در Canva آسان می‌کند."

— Canva

ChatKit در حال حاضر طیف وسیعی از موارد استفاده، از دستیاران Internal Knowledge و راهنماهای ورود گرفته تا پشتیبانی مشتری و عوامل تحقیقاتی را تقویت می‌کند. عامل پشتیبانی مشتری HubSpot⁠(در یک پنجره جدید باز می‌شود)یکی از مثال‌هاست:

نمای داشبورد پلتفرم Ramp که یک رابط مدیریت هزینه را نشان می‌دهد. پنل اصلی به کاربر، دانیل، خوش‌آمد می‌گوید و درخواست‌هایی مانند «درخواست برای ChatGPT Business» (در انتظار بررسی) و «درخواست برای HubSpot» (پیش‌نویس)، همراه با هزینه‌های اخیر برای خطوط هوایی، تاکسی‌های اینترنتی و نرم‌افزار را در فهرست آورده است. در سمت راست، فرم درخواست نرم‌افزار برای ChatGPT Business باز است که جزئیات 5 صندلی با قیمت ۱۲۵ دلار در ماه از ۱ اکتبر ۲۰۲۵ تا ۱ اکتبر ۲۰۲۶ را نشان می‌دهد و دکمه زرد «ارسال درخواست» را نشان می‌دهد.

عملکرد عامل را با قابلیت‌های جدید Evals اندازه‌گیری کن

ساخت عامل‌های قابل اعتماد و آماده برای تولید نیاز به ارزیابی‌های دقیق عملکرد دارد. سال گذشته، Evals⁠(در یک پنجره جدید باز می‌شود) را راه‌اندازی کردیم تا به توسعه‌دهندگان کمک کنیم اعلان‌ها را آزمایش کرده و رفتار مدل را بسنجند. ما اکنون در حال اضافه کردن چهار قابلیت جدید هستیم که ساخت ارزیابی‌ها را حتی آسان‌تر می‌کند:

مجموعه‌داده‌ها–به‌سرعت evalهای عامل را کاملاً از صفر بساز و به‌مرور با نمره‌دهنده‌های خودکار و حاشیه‌نویسی انسانی گسترش‌شان بده.
ردیابی درجه‌بندی–ارزیابی‌های سرتاسری از گردش‌های کاری عامل‌محور را اجرا کن و درجه‌بندی را خودکار کن تا کاستی‌ها را مشخص کنی.
بهینه‌سازی خودکار اعلان‌ها– اعلان‌های بهبود یافته را بر اساس حاشیه‌نویسی‌های انسانی و خروجی‌های نمره‌دهنده تولید کن.
پشتیبانی از مدل‌های شخص ثالث- ارزیابی مدل‌های سایر ارائه‌دهندگان در پلتفرم OpenAI Evals.

ما پیشتر شاهد پیشرفت اساسی در عملکرد مشتریانی بوده‌ایم که از Evals استفاده می‌کنند.

پلتفرم ارزیابی زمان توسعه چارچوب بررسی دقیق چندعاملی ما را بیش از ۵۰٪ کاهش داد و دقت عامل‌ها را ۳۰٪ افزایش داد.

— Carlyle

رابط کاربری که یک جدول مجموعه داده با ستون‌های رتبه‌بندی، لحن، بازخورد و دقت را نشان داده است. ردیف‌ها ورودی‌ها را با آیکون‌های انگشت شست بالا یا پایین، برچسب‌های لحنی مانند حرفه‌ای، دوستانه، بی‌ادب و بد، و نتایج دقت با برچسب‌های Pass یا Fail و نمره ۳.۵ نمایش می‌دهند. نوار ابزار بالا گزینه‌هایی برای آپلود، ستون‌ها، نمره‌دهی، تولید خروجی و ذخیره دارد.

عملکرد عامل را با تنظیم دقیق تقویتی بهبود دهید

تنظیم دقیق تقویتی⁠(در یک پنجره جدید باز می‌شود) (RFT) به توسعه‌دهندگان اجازه می‌دهد مدل‌های استدلال ما را شخصی‌سازی کنند. به طور کلی در OpenAI o4-mini و به صورت بتای خصوصی برای GPT‑5 در دسترس است. ما با ده‌ها مشتری به‌طور نزدیک همکاری می‌کنیم تا RFT برای GPT‑5 را، پیش از انتشار گسترده‌تر بهبود دهیم.

امروز، دو ویژگی جدید را در آن نسخه بتا RFT معرفی می‌کنیم که برای افزایش عملکرد عامل حتی بیشتر طراحی شده‌اند:

فراخوانی ابزارهای سفارشی– مدل‌ها آموزش می‌دهند تا استدلال بهتری داشته و در زمان مناسب ابزارهای صحیح را فراخوانی کنند.
درجه‌بندی‌های سفارشی– معیارهای ارزیابی سفارشی را برای آنچه در مورد استفاده شما بیشترین اهمیت را دارد، تعیین می‌کند

قیمت گذاری و در دسترس بودن

از امروز، ChatKit و قابلیت‌های جدید Evals به‌طور عمومی برای همهٔ توسعه‌دهندگان در دسترس خواهد بود. Agent Builder به صورت بتا در دسترس است و Connector Registry عرضه بتا خود را برای برخی از مشتریان API، ChatGPT Enterprise و Edu با Global Admin Console⁠(در یک پنجره جدید باز می‌شود) (که در آن Global Owners می‌توانند دامنه‌ها، SSO، و چندین سازمان API را مدیریت کنند) آغاز کرده است. کنسول Global Admin پیش‌نیاز فعال‌سازی Connector Registry است. همهٔ این ابزارها در قیمت استاندارد مدل‌های API گنجانده شده‌اند.

قصد داریم به زودی یک API مستقل برای Workflows و گزینه‌های استقرار عامل را به ChatGPT اضافه کنیم.

بی‌صبرانه منتظریم ببینیم چی می‌سازی.

نویسنده

OpenAI

به خواندن ادامه بده

مشاهده همه

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 اکنون مدل ترجیحی در Microsoft 365 Copilot است

محصول۱۸ تیر ۱۴۰۵

GPT-5.6: هوشمندی پیشرو که هم‌گام با بلندپروازی شما مقیاس‌پذیر می‌شود

محصول۱۸ تیر ۱۴۰۵

ChatGPT اکنون همراه شما برای بلند پروازانه ترین کارهاست

محصول۱۸ تیر ۱۴۰۵