6 октомври 2025 г.

Представяме ви AgentKit

Нови инструменти за създаване, внедряване и оптимизиране на агенти.

Зареждане…

Днес стартираме AgentKit – пълен набор от инструменти за разработчици и предприятия за изграждане, внедряване и оптимизиране на агенти. Досега изграждането на агенти означаваше да се жонглира с фрагментирани инструменти – сложна оркестрация без версии, персонализирани конектори, ръчни канали за оценка, настройка за подкани и седмици работа по фронтенда преди стартирането. С AgentKit разработчиците вече могат да проектират визуално работни потоци и да вграждат агентни потребителски интерфейси по-бързо, използвайки нови градивни елементи като:

Agent Builder: визуално платно за създаване и версиониране на многоагентни работни потоци
Connector Registry: централно място за администраторите да управляват как данните и инструментите се свързват между продуктите на OpenAI
ChatKit: набор от инструменти за вграждане на персонализирани чат-базирани агенти във вашия продукт

Също така разширяваме възможностите за оценка с нови функции, като например набори от данни, класифициране на следи, автоматизирана оптимизация на подкани и поддръжка на модели на трети страни за измерване и подобряване на производителността на агентите.

Откакто пуснахме API за отговори и SDK за агенти⁠ през март, видяхме разработчиците и предприятията да изграждат цялостни агентни работни потоци за задълбочени проучвания, поддръжка на клиенти и др. Klarna изгради агент за поддръжка,⁠ който обработва две трети от всички билети, и Clay увеличи 10 пъти растежа си⁠ с агент по продажбите. AgentKit се основава на API за отговори, за да помогне на разработчиците да изграждат агенти по-ефективно и надеждно.

Проектиране на работни потоци с Agent Builder

Тъй като работните потоци на агентите стават все по-сложни, разработчиците се нуждаят от по-ясна видимост за начина, по който те работят. Agent Builder⁠(отваря се в нов прозорец) предоставя визуално платно за съставяне на логика с помощта на възли за плъзгане и пускане, свързващи инструменти и конфигуриране на персонализирани защитни ограничения. Поддържа предварителни изпълнения, конфигурация за оценяване в линия и пълно версиониране – идеално за бърза итерация.

Изглед на интерфейса на поток за автоматизация на обслужването на клиенти в инструмент за визуален конструктор. Платното показва свързани възли, обозначени като „Старт“, „Ограничение за избягване“, „Агент за класификация“, „Ако/иначе“, „Агент за връщане“, „Агент за задържане“, „Агент за информация“, „Ограничение за халюцинации“ и „Край“. В страничната лента отляво са изброени наличните типове възли, като например агент, бележка, търсене на файлове, ограничения, MCP и одобрение от потребител. Горните контроли включват опции за оценка, кодиране, преглед и публикуване.

Конструкторите могат да започнат с празно платно или с предварително изградени шаблони.

Само за няколко часа екипът на Ramp се превърна от празно платно в агент на купувача:

„Agent Builder трансформира това, което преди отнемаше месеци на сложна оркестрация, персонализиран код и ръчни оптимизации, само в няколко часа. Визуалното платно държи продуктите, юридическите и инженерните специалисти на една и съща страница, като съкращава циклите на итерации със 70% и осигурява пускането на агента в действие за два спринта, а не за две тримесечия.“

— Ramp

По подобен начин LY Corporation – водеща японска компания за технологии и интернет услуги – изгради работен асистент с помощта на Agent Builder за по-малко от два часа.

„Agent Builder ни позволи да организираме агенти по изцяло нов начин, като инженерите и експертите по темата си сътрудничат в един интерфейс. Създадохме първия си многоагентен работен процес и го стартирахме за по-малко от два часа, като значително ускорихме времето за създаване и внедряване на агенти.“

– LY Corporation

Стартираме и Connector Registry за предприятията, за да управляват и поддържат данни в множество работни пространства и организации. Connector Registry⁠(отваря се в нов прозорец) консолидира източниците на данни в един административен панел в ChatGPT и API. Регистърът включва всички предварително изградени конектори като Dropbox, Google Drive, Sharepoint и Microsoft Teams, както и MCP на трети страни.

Разработчиците могат също така да активират Guardrails⁠(отваря се в нов прозорец) в Agent Builder – модулен защитен слой с отворен код, който помага за защита на агентите от неволно или злонамерено поведение. Guardrails могат да маскират или маркират PII, да откриват пробиви в сигурността и да прилагат други защитни мерки, което улеснява изграждането и внедряването на надеждни и безопасни агенти. Guardrails може да се внедри самостоятелно или чрез библиотеката guardrails за Python⁠(отваря се в нов прозорец) и JavaScript⁠(отваря се в нов прозорец).

Вграждане на агентски чат преживявания с ChatKit

Внедряването на чат потребителски интерфейси за агенти може да бъде изненадващо сложно – обработване на поточни отговори, управление на нишки, показване на мисленето на модела и проектиране на ангажиращи преживявания в чата. ChatKit⁠(отваря се в нов прозорец) улеснява вграждането на агенти, базирани на чат, които са характерни за вашия продукт. Може да се вгради в приложения или уеб сайтове и да се персонализира, за да съответства на вашата тема или марка.

„С ChatKit спестихме над две седмици време за изграждането на агент за поддръжка за нашата общност от разработчици на Canva и го интегрирахме за по-малко от час. Този агент за поддръжка ще промени начина, по който разработчиците взаимодействат с нашите документи, като го превърне в разговорно преживяване, което улеснява създаването на приложения и интеграции в Canva.“

— Canva

ChatKit вече се използва в редица случаи, от вътрешни помощници за знания и ръководства за интегриране до агенти за обслужване на клиенти и проучвания. Агентът на HubSpot⁠(отваря се в нов прозорец) за поддръжка на клиенти е един от примерите:

Изглед на информационния панел на платформата Ramp, показващ интерфейс за управление на разходите. Главният панел поздравява потребителя Даниел и изброява заявки като „Заявка за ChatGPT Business“ (в очакване на преглед) и „Заявка за HubSpot“ (чернова), заедно с последните разходи за авиокомпании, споделени пътувания и софтуер. Вдясно е отворен формуляр за заявка на софтуер за ChatGPT Business, в който са описани 5 места за 125$ на месец от 1 октомври 2025 г. до 1 октомври 2026 г., с жълт бутон „Изпрати заявка“.

Измерване на производителността на агентите с новите възможности на Evals

Изграждането на надеждни, готови за производство агенти изисква строги оценки на производителността. Миналата година стартирахме Evals⁠(отваря се в нов прозорец), за да помогнем на разработчиците да тестват подкани и да измерват поведението на модела. Сега добавяме четири нови възможности, които улесняват още повече създаването на оценки:

Набори от данни – бързо създаване на оценки на агенти от нулата и разширяването им с течение на времето с автоматизирани системи за оценяване и човешки анотации.
Оценяване на проследяването – изпълнявайте цялостни оценки на работните процеси на агентите и автоматизирайте оценяването, за да откриете недостатъците.
Автоматизирана оптимизация на подканите – генерирайте подобрени подкани въз основа на човешки анотации и изходи от оценяващи.
Поддръжка на модели на трета страна – оценявайте модели от други доставчици в рамките на платформата OpenAI Evals.

Вече видяхме значително повишаване на производителността от клиенти, използващи Evals.

„Платформата за оценка съкрати времето за разработка на нашата мултиагентна рамка за надлежна проверка с над 50% и увеличи точността на агентите с 30%.“

— Carlyle

Интерфейс, показващ таблица с данни с колони за оценка, тон, обратна връзка и точност. Редовете показват записи с икони „палец нагоре“ или „палец надолу“, етикети като „Професионален“, „Приятелски“, „Груб“ и „Лош“, както и резултати за точност, обозначени като „Успешен“ или „Неуспешен“ с оценка 3,5. Горната лента с инструменти включва опции за качване, колони, класиране, генериране на изход и запис.

Повишаване на производителността на агента с прецизна настройка на подсилването

Прецизна настройка на подсилването⁠(отваря се в нов прозорец) (RFT) позволява на разработчиците да персонализират нашите модели за разсъждаване. Общодостъпно е за OpenAI o4-mini и в частна бета-версия за GPT‑5. Работим в тясно сътрудничество с десетки клиенти, за да усъвършенстваме RFT за GPT‑5, преди да се пусне на пазара.

Днес представяме две нови функции в бета-версията на RFT, предназначени да повишат още повече производителността на агентите:

Персонализирани извиквания на инструменти – обучете моделите да извикват правилните инструменти в точното време за по-добро разсъждаване
Персонализирани оценители – задайте персонализирани критерии за оценка за това, което има най-голямо значение за вашия случай на употреба

Ценообразуване и наличност

От днес ChatKit и новите възможности на Evals са общодостъпни за всички разработчици. Agent Builder е наличен в бета версия, а Connector Registry започва своето бета разпространение за някои клиенти на API, ChatGPT Enterprise и Edu с глобална конзола за администратори⁠(отваря се в нов прозорец) (където глобалните собственици могат да управляват домейни, SSO, множество API организации). Конзолата на глобалния администратор е необходимо условие за активиране на Connector Registry. Всички тези инструменти са включени в стандартното ценообразуване на API модела.

Планираме скоро да добавим самостоятелен API за работни потоци и опции за внедряване на агенти към ChatGPT.

С нетърпение очакваме да видим какво ще създадете.

Автор

OpenAI

Продължавайте да четете

Вижте всички

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 вече е предпочитаният модел в Microsoft 365 Copilot

Продукт9.07.2026 г.

ChatGPT вече е партньор за най-амбициозната ви работа

Продукт9.07.2026 г.

GPT-5.6: Авангарден изкуствен интелект, който се развива заедно с Вашите амбиции

Продукт9.07.2026 г.