Сегодня мы запускаем AgentKit — полный набор инструментов для разработчиков и предприятий для создания, развертывания и оптимизации агентов. До сих пор создание агентов означало жонглирование разрозненными инструментами — сложная оркестрация без версионирования, пользовательские коннекторы, ручные конвейеры оценки, настройка промптов и недели работы над интерфейсом перед запуском. С AgentKit разработчики теперь могут визуально проектировать рабочие процессы и быстрее внедрять агентские пользовательские интерфейсы, используя такие новые строительные блоки, как:
- Агент Builder: визуальное рабочее поле для создания и версионирования мультиагентных рабочих процессов
- Connector Registry: центральное место для администраторов, где они могут управлять подключением данных и инструментов между продуктами OpenAI
- ChatKit: набор инструментов для встраивания настраиваемого чат-агента в ваш продукт
Мы также расширяем возможности оценки с помощью новых функций, таких как наборы данных, оценка трассировки, автоматическая оптимизация промптов и поддержка сторонних моделей для измерения и улучшения производительности агентов.
С момента выпуска в марте Responses API и Agents SDK, мы наблюдали, как разработчики и предприятия создают сквозные агентские рабочие процессы для глубоких исследований, поддержки клиентов и других целей. Компания Klarna создала агента поддержки, который обрабатывает две трети всех обращений, а компания Clay увеличила рост в 10 раз с помощью агента по продажам. AgentKit использует Responses API, помогая разработчикам создавать агентов более эффективно и надежно.
По мере того как рабочие процессы агентов усложняются, разработчикам нужно лучше понимать, как они работают. Agent Builder(открывается в новом окне) предоставляет визуальное рабочее поле для составления логики с помощью перетаскиваемых узлов, подключения инструментов и настройки пользовательских ограничений. Он поддерживает пробные запуски, встроенную конфигурацию систем оценки и полное версионирование — что идеально для быстрой итерации.

Разработчики могут начать с пустого рабочего поля или с готовых шаблонов.
В компании Ramp команда прошла путь от пустого рабочего поля до агента по закупкам всего за несколько часов:
Agent-Builder превратил то, на что раньше уходили месяцы сложной оркестровки, пользовательского кода и ручной оптимизации, всего в пару часов. Визуальная рабочая область объединяет продукт, юридический отдел и разработку, сокращая циклы итераций на 70% и позволяя агенту начать работу за два спринта вместо двух кварталов.
Аналогично, LY Corporation — ведущая японская компания в области технологий и интернет-услуг — создала агента с помощью Agent Builder менее чем за два часа.
"Agent Builder позволил нам организовать работу агентов совершенно по-новому: инженеры и эксперты по предметным областям могли сотрудничать в одном интерфейсе. Мы создали наш первый мультиагентный рабочий процесс и запустили его менее чем за два часа, что значительно ускорило процесс создания и развертывания агентов."
Мы также запускаем Connector Registry для корпоративных клиентов, чтобы централизованно управлять данными и поддерживать их в актуальном состоянии в разных рабочих областях и организациях. Connector Registry(открывается в новом окне) объединяет источники данных в единую панель администратора для ChatGPT и API. Реестр включает все предварительно встроенные коннекторы, такие как Dropbox, Google Drive, SharePoint и Microsoft Teams, а также сторонние MCP.
Разработчики также могут включить Guardrails(открывается в новом окне) в Agent Builder — модульный уровень безопасности с открытым исходным кодом, который помогает защитить агентов от непреднамеренного или вредоносного поведения. Guardrails могут маскировать или отмечать PII, обнаруживать jailbreak-атаки и применять другие меры безопасности, упрощая создание и развертывание надёжных и безопасных агентов. Guardrails можно развертывать автономно или через библиотеку защитных мер для Python(открывается в новом окне) и JavaScript(открывается в новом окне).
Развертывание интерфейсов чата для агентов может быть удивительно сложным — обработка потоковых ответов, управление беседами, демонстрация работы модели и создание увлекательного опыта общения в чате. ChatKit(открывается в новом окне) упрощает встраивание чат-агентов, которые органично вписываются в ваш продукт. Его можно встроить в приложения или веб-сайты и настроить в соответствии с вашей темой или брендом.
"Мы сохранили более двух недель времени, создавая агента поддержки для нашего сообщества разработчиков Canva с помощью ChatKit и интегрировали его менее чем за час. Этот агент поддержки изменит способ взаимодействия разработчиков с нашей документацией, превратив её в разговорный формат, что упростит создание приложений и интеграций на Canva.
ChatKit уже поддерживает целый ряд вариантов использования: от ассистента по корпоративным знаниям и руководств по адаптации до агентов поддержки клиентов и исследовательских агентов. HubSpot(открывается в новом окне)— это пример агента службы поддержки клиентов:

Создание надежных, готовых к эксплуатации агентов требует тщательной оценки производительности. В прошлом году мы запустили Системы оценки (Evals)(открывается в новом окне), чтобы помочь разработчикам тестировать промпты и измерять поведение моделей. Теперь мы добавляем четыре новые функции, которые еще больше упрощают создание оценок:
- Наборы данных— быстро создавайте оценки агентов с нуля и расширяйте их со временем с помощью автоматических оценщиков и аннотаций произведенных человеком.
- Оценка трассировки — проведение комплексных оценок агентских рабочих процессов и автоматизация оценки для выявления недостатков.
- Автоматизированная оптимизация промптов — формируйте улучшенные промпты на основе аннотаций человека и результатов работы авто-оценщика.
- Поддержка моделей сторонних поставщиков — оценка моделей от других провайдеров в рамках платформы OpenAI Evals.
Мы уже наблюдали значительные улучшения в производительности у клиентов, использующих Системы оценки (Evals).
"Платформа оценки сократила время разработки нашей многоагентной системы комплексной проверки более чем на 50 %, а точность агентов увеличилась на 30 %."

Дообучение с подкреплением(открывается в новом окне) (RFT) позволяет разработчикам настраивать наши модели рассуждений. RFT находится в общем доступе на OpenAI o4-mini и в закрытой бета-версии для GPT‑5. Мы тесно сотрудничаем с десятками клиентов, чтобы усовершенствовать RFT для GPT‑5 до более широкого выпуска.
Сегодня мы представляем две новые функции в бета-версии RFT, которые призваны еще больше повысить производительность агентов:
- Вызовы пользовательских инструментов — обучайте модели вызывать нужные инструменты в нужный момент для более качественных рассуждений
- Настраиваемые оценщики — задавайте собственные критерии оценки для ключевых факторов вашего сценария использования
Начиная с сегодняшнего дня, ChatKit и новые возможности Evals становятся общедоступными для всех разработчиков. Agent Builder доступен в бета-версии, а Connector Registry начинает развёртывание беты для части клиентов API, ChatGPT Enterprise и Edu. Доступ осуществляется через Global Admin Console(открывается в новом окне), где Global Owners могут управлять доменами, SSO и несколькими API-организациями. Консоль Global Admin является необходимым условием для активации Connector Registry. Все эти инструменты включены в стандартную цену модели API.
В ближайшее время мы планируем добавить в ChatGPT отдельный API для рабочих процессов и варианты развертывания агентов.
С нетерпением ждём, что вы создадите дальше.


