Днес стартираме AgentKit – пълен набор от инструменти за разработчици и предприятия за изграждане, внедряване и оптимизиране на агенти. Досега изграждането на агенти означаваше да се жонглира с фрагментирани инструменти – сложна оркестрация без версии, персонализирани конектори, ръчни канали за оценка, настройка за подкани и седмици работа по фронтенда преди стартирането. С AgentKit разработчиците вече могат да проектират визуално работни потоци и да вграждат агентни потребителски интерфейси по-бързо, използвайки нови градивни елементи като:
- Agent Builder: визуално платно за създаване и версиониране на многоагентни работни потоци
- Connector Registry: централно място за администраторите да управляват как данните и инструментите се свързват между продуктите на OpenAI
- ChatKit: набор от инструменти за вграждане на персонализирани чат-базирани агенти във вашия продукт
Също така разширяваме възможностите за оценка с нови функции, като например набори от данни, класифициране на следи, автоматизирана оптимизация на подкани и поддръжка на модели на трети страни за измерване и подобряване на производителността на агентите.
Откакто пуснахме API за отговори и SDK за агенти през март, видяхме разработчиците и предприятията да изграждат цялостни агентни работни потоци за задълбочени проучвания, поддръжка на клиенти и др. Klarna изгради агент за поддръжка, който обработва две трети от всички билети, и Clay увеличи 10 пъти растежа си с агент по продажбите. AgentKit се основава на API за отговори, за да помогне на разработчиците да изграждат агенти по-ефективно и надеждно.
Тъй като работните потоци на агентите стават все по-сложни, разработчиците се нуждаят от по-ясна видимост за начина, по който те работят. Agent Builder(отваря се в нов прозорец) предоставя визуално платно за съставяне на логика с помощта на възли за плъзгане и пускане, свързващи инструменти и конфигуриране на персонализирани защитни ограничения. Поддържа предварителни изпълнения, конфигурация за оценяване в линия и пълно версиониране – идеално за бърза итерация.

Конструкторите могат да започнат с празно платно или с предварително изградени шаблони.
Само за няколко часа екипът на Ramp се превърна от празно платно в агент на купувача:
„Agent Builder трансформира това, което преди отнемаше месеци на сложна оркестрация, персонализиран код и ръчни оптимизации, само в няколко часа. Визуалното платно държи продуктите, юридическите и инженерните специалисти на една и съща страница, като съкращава циклите на итерации със 70% и осигурява пускането на агента в действие за два спринта, а не за две тримесечия.“
По подобен начин LY Corporation – водеща японска компания за технологии и интернет услуги – изгради работен асистент с помощта на Agent Builder за по-малко от два часа.
„Agent Builder ни позволи да организираме агенти по изцяло нов начин, като инженерите и експертите по темата си сътрудничат в един интерфейс. Създадохме първия си многоагентен работен процес и го стартирахме за по-малко от два часа, като значително ускорихме времето за създаване и внедряване на агенти.“
Стартираме и Connector Registry за предприятията, за да управляват и поддържат данни в множество работни пространства и организации. Connector Registry(отваря се в нов прозорец) консолидира източниците на данни в един административен панел в ChatGPT и API. Регистърът включва всички предварително изградени конектори като Dropbox, Google Drive, Sharepoint и Microsoft Teams, както и MCP на трети страни.
Разработчиците могат също така да активират Guardrails(отваря се в нов прозорец) в Agent Builder – модулен защитен слой с отворен код, който помага за защита на агентите от неволно или злонамерено поведение. Guardrails могат да маскират или маркират PII, да откриват пробиви в сигурността и да прилагат други защитни мерки, което улеснява изграждането и внедряването на надеждни и безопасни агенти. Guardrails може да се внедри самостоятелно или чрез библиотеката guardrails за Python(отваря се в нов прозорец) и JavaScript(отваря се в нов прозорец).
Внедряването на чат потребителски интерфейси за агенти може да бъде изненадващо сложно – обработване на поточни отговори, управление на нишки, показване на мисленето на модела и проектиране на ангажиращи преживявания в чата. ChatKit(отваря се в нов прозорец) улеснява вграждането на агенти, базирани на чат, които са характерни за вашия продукт. Може да се вгради в приложения или уеб сайтове и да се персонализира, за да съответства на вашата тема или марка.
„С ChatKit спестихме над две седмици време за изграждането на агент за поддръжка за нашата общност от разработчици на Canva и го интегрирахме за по-малко от час. Този агент за поддръжка ще промени начина, по който разработчиците взаимодействат с нашите документи, като го превърне в разговорно преживяване, което улеснява създаването на приложения и интеграции в Canva.“
ChatKit вече се използва в редица случаи, от вътрешни помощници за знания и ръководства за интегриране до агенти за обслужване на клиенти и проучвания. Агентът на HubSpot(отваря се в нов прозорец) за поддръжка на клиенти е един от примерите:

Изграждането на надеждни, готови за производство агенти изисква строги оценки на производителността. Миналата година стартирахме Evals(отваря се в нов прозорец), за да помогнем на разработчиците да тестват подкани и да измерват поведението на модела. Сега добавяме четири нови възможности, които улесняват още повече създаването на оценки:
- Набори от данни – бързо създаване на оценки на агенти от нулата и разширяването им с течение на времето с автоматизирани системи за оценяване и човешки анотации.
- Оценяване на проследяването – изпълнявайте цялостни оценки на работните процеси на агентите и автоматизирайте оценяването, за да откриете недостатъците.
- Автоматизирана оптимизация на подканите – генерирайте подобрени подкани въз основа на човешки анотации и изходи от оценяващи.
- Поддръжка на модели на трета страна – оценявайте модели от други доставчици в рамките на платформата OpenAI Evals.
Вече видяхме значително повишаване на производителността от клиенти, използващи Evals.
„Платформата за оценка съкрати времето за разработка на нашата мултиагентна рамка за надлежна проверка с над 50% и увеличи точността на агентите с 30%.“

Прецизна настройка на подсилването(отваря се в нов прозорец) (RFT) позволява на разработчиците да персонализират нашите модели за разсъждаване. Общодостъпно е за OpenAI o4-mini и в частна бета-версия за GPT‑5. Работим в тясно сътрудничество с десетки клиенти, за да усъвършенстваме RFT за GPT‑5, преди да се пусне на пазара.
Днес представяме две нови функции в бета-версията на RFT, предназначени да повишат още повече производителността на агентите:
- Персонализирани извиквания на инструменти – обучете моделите да извикват правилните инструменти в точното време за по-добро разсъждаване
- Персонализирани оценители – задайте персонализирани критерии за оценка за това, което има най-голямо значение за вашия случай на употреба
От днес ChatKit и новите възможности на Evals са общодостъпни за всички разработчици. Agent Builder е наличен в бета версия, а Connector Registry започва своето бета разпространение за някои клиенти на API, ChatGPT Enterprise и Edu с глобална конзола за администратори(отваря се в нов прозорец) (където глобалните собственици могат да управляват домейни, SSO, множество API организации). Конзолата на глобалния администратор е необходимо условие за активиране на Connector Registry. Всички тези инструменти са включени в стандартното ценообразуване на API модела.
Планираме скоро да добавим самостоятелен API за работни потоци и опции за внедряване на агенти към ChatGPT.
С нетърпение очакваме да видим какво ще създадете.


