6 октября 2025 г.

Представляем AgentKit

Новые инструменты для создания, развертывания и оптимизации агентов.

Загрузка…

Сегодня мы запускаем AgentKit — полный набор инструментов для разработчиков и предприятий для создания, развертывания и оптимизации агентов. До сих пор создание агентов означало жонглирование разрозненными инструментами — сложная оркестрация без версионирования, пользовательские коннекторы, ручные конвейеры оценки, настройка промптов и недели работы над интерфейсом перед запуском. С AgentKit разработчики теперь могут визуально проектировать рабочие процессы и быстрее внедрять агентские пользовательские интерфейсы, используя такие новые строительные блоки, как:

Агент Builder: визуальное рабочее поле для создания и версионирования мультиагентных рабочих процессов
Connector Registry: центральное место для администраторов, где они могут управлять подключением данных и инструментов между продуктами OpenAI
ChatKit: набор инструментов для встраивания настраиваемого чат-агента в ваш продукт

Мы также расширяем возможности оценки с помощью новых функций, таких как наборы данных, оценка трассировки, автоматическая оптимизация промптов и поддержка сторонних моделей для измерения и улучшения производительности агентов.

С момента выпуска в марте Responses API и Agents SDK⁠, мы наблюдали, как разработчики и предприятия создают сквозные агентские рабочие процессы для глубоких исследований, поддержки клиентов и других целей. Компания Klarna создала агента поддержки⁠, который обрабатывает две трети всех обращений, а компания Clay увеличила рост в 10 раз⁠ с помощью агента по продажам. AgentKit использует Responses API, помогая разработчикам создавать агентов более эффективно и надежно.

Проектируйте рабочие процессы с помощью Agent Builder

По мере того как рабочие процессы агентов усложняются, разработчикам нужно лучше понимать, как они работают. Agent Builder⁠(открывается в новом окне) предоставляет визуальное рабочее поле для составления логики с помощью перетаскиваемых узлов, подключения инструментов и настройки пользовательских ограничений. Он поддерживает пробные запуски, встроенную конфигурацию систем оценки и полное версионирование — что идеально для быстрой итерации.

Вид интерфейса потока автоматизации обслуживания клиентов в визуальном компоновщике. На рабочем поле отображаются соединенные узлы с метками «Начало», «Ограждение побега», «Агент классификации», «Если/иначе», «Агент возврата», «Агент удержания», «Информационный агент», «Ограждение галлюцинаций» и «Конец». На боковой панели слева перечислены доступные типы узлов, такие как агент, заметка, поиск по файлам, защитные механизмы, MCP и утверждение пользователем. Верхние элементы управления включают опции «Оценить», «Код», «предварительно просматривать» и «Опубликовать».

Разработчики могут начать с пустого рабочего поля или с готовых шаблонов.

В компании Ramp команда прошла путь от пустого рабочего поля до агента по закупкам всего за несколько часов:

Agent-Builder превратил то, на что раньше уходили месяцы сложной оркестровки, пользовательского кода и ручной оптимизации, всего в пару часов. Визуальная рабочая область объединяет продукт, юридический отдел и разработку, сокращая циклы итераций на 70% и позволяя агенту начать работу за два спринта вместо двух кварталов.

— Ramp

Аналогично, LY Corporation — ведущая японская компания в области технологий и интернет-услуг — создала агента с помощью Agent Builder менее чем за два часа.

"Agent Builder позволил нам организовать работу агентов совершенно по-новому: инженеры и эксперты по предметным областям могли сотрудничать в одном интерфейсе. Мы создали наш первый мультиагентный рабочий процесс и запустили его менее чем за два часа, что значительно ускорило процесс создания и развертывания агентов."

— LY Corporation

Мы также запускаем Connector Registry для корпоративных клиентов, чтобы централизованно управлять данными и поддерживать их в актуальном состоянии в разных рабочих областях и организациях. Connector Registry⁠(открывается в новом окне) объединяет источники данных в единую панель администратора для ChatGPT и API. Реестр включает все предварительно встроенные коннекторы, такие как Dropbox, Google Drive, SharePoint и Microsoft Teams, а также сторонние MCP.

Разработчики также могут включить Guardrails⁠(открывается в новом окне) в Agent Builder — модульный уровень безопасности с открытым исходным кодом, который помогает защитить агентов от непреднамеренного или вредоносного поведения. Guardrails могут маскировать или отмечать PII, обнаруживать jailbreak-атаки и применять другие меры безопасности, упрощая создание и развертывание надёжных и безопасных агентов. Guardrails можно развертывать автономно или через библиотеку защитных мер для Python⁠(открывается в новом окне) и JavaScript⁠(открывается в новом окне).

Встраивайте агентские чаты с помощью ChatKit

Развертывание интерфейсов чата для агентов может быть удивительно сложным — обработка потоковых ответов, управление беседами, демонстрация работы модели и создание увлекательного опыта общения в чате. ChatKit⁠(открывается в новом окне) упрощает встраивание чат-агентов, которые органично вписываются в ваш продукт. Его можно встроить в приложения или веб-сайты и настроить в соответствии с вашей темой или брендом.

"Мы сохранили более двух недель времени, создавая агента поддержки для нашего сообщества разработчиков Canva с помощью ChatKit и интегрировали его менее чем за час. Этот агент поддержки изменит способ взаимодействия разработчиков с нашей документацией, превратив её в разговорный формат, что упростит создание приложений и интеграций на Canva.

Canva

ChatKit уже поддерживает целый ряд вариантов использования: от ассистента по корпоративным знаниям и руководств по адаптации до агентов поддержки клиентов и исследовательских агентов. HubSpot⁠(открывается в новом окне)— это пример агента службы поддержки клиентов:

Вид панели управления платформы Ramp, демонстрирующий интерфейс управления расходами. Главная панель приветствует пользователя Дэниела и перечисляет запросы, такие как «Запрос на ChatGPT Business» (ожидает рассмотрения) и «Запрос на HubSpot» (черновик), а также последние расходы на авиабилеты, поездки и программное обеспечение. Справа открыта форма запроса на программное обеспечение для ChatGPT Business, в которой указаны 5 мест по цене 125 долларов США в месяц с 1 октября 2025 года по 1 октября 2026 года, с желтой кнопкой «Отправить запрос».

Оцените производительность агентов с помощью новых возможностей систем оценки (Evals).

Создание надежных, готовых к эксплуатации агентов требует тщательной оценки производительности. В прошлом году мы запустили Системы оценки (Evals)⁠(открывается в новом окне), чтобы помочь разработчикам тестировать промпты и измерять поведение моделей. Теперь мы добавляем четыре новые функции, которые еще больше упрощают создание оценок:

Наборы данных— быстро создавайте оценки агентов с нуля и расширяйте их со временем с помощью автоматических оценщиков и аннотаций произведенных человеком.
Оценка трассировки — проведение комплексных оценок агентских рабочих процессов и автоматизация оценки для выявления недостатков.
Автоматизированная оптимизация промптов — формируйте улучшенные промпты на основе аннотаций человека и результатов работы авто-оценщика.
Поддержка моделей сторонних поставщиков — оценка моделей от других провайдеров в рамках платформы OpenAI Evals.

Мы уже наблюдали значительные улучшения в производительности у клиентов, использующих Системы оценки (Evals).

"Платформа оценки сократила время разработки нашей многоагентной системы комплексной проверки более чем на 50 %, а точность агентов увеличилась на 30 %."

— Carlyle

Интерфейс отображает таблицу данных с колонками «Оценка», «Тон», «Отзыв» и «Точность». В строках отображаются записи со значками «знак одобрения» или «знак неодобрения», метками тона, такими как «Профессиональный», «Дружелюбный», «Грубый» и «Плохой», а также результаты точности, обозначенные как «Прошел» или «Не прошел» с оценкой 3,5. Верхняя панель инструментов включает опции «Загрузить», «Столбцы», «Оценка», «Сформировать результат» и «Сохранить»; слева находятся фильтры «Оценка», «Тональность» и «Отзыв».

Повышайте производительность агентов с помощью дообучения с подкреплением (RFT)

Дообучение с подкреплением⁠(открывается в новом окне) (RFT) позволяет разработчикам настраивать наши модели рассуждений. RFT находится в общем доступе на OpenAI o4-mini и в закрытой бета-версии для GPT‑5. Мы тесно сотрудничаем с десятками клиентов, чтобы усовершенствовать RFT для GPT‑5 до более широкого выпуска.

Сегодня мы представляем две новые функции в бета-версии RFT, которые призваны еще больше повысить производительность агентов:

Вызовы пользовательских инструментов — обучайте модели вызывать нужные инструменты в нужный момент для более качественных рассуждений
Настраиваемые оценщики — задавайте собственные критерии оценки для ключевых факторов вашего сценария использования

Стоимость и доступность

Начиная с сегодняшнего дня, ChatKit и новые возможности Evals становятся общедоступными для всех разработчиков. Agent Builder доступен в бета-версии, а Connector Registry начинает развёртывание беты для части клиентов API, ChatGPT Enterprise и Edu. Доступ осуществляется через Global Admin Console⁠(открывается в новом окне), где Global Owners могут управлять доменами, SSO и несколькими API-организациями. Консоль Global Admin является необходимым условием для активации Connector Registry. Все эти инструменты включены в стандартную цену модели API.

В ближайшее время мы планируем добавить в ChatGPT отдельный API для рабочих процессов и варианты развертывания агентов.

С нетерпением ждём, что вы создадите дальше.

Автор

OpenAI

Читать далее

Просмотреть все

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 стал приоритетной моделью в Microsoft 365 Copilot

Товар9 июл. 2026 г.

GPT-5.6: Передовой искусственный интеллект, соразмерный вашим амбициям

Товар9 июл. 2026 г.

ChatGPT — партнер для ваших самых амбициозных задач

Товар9 июл. 2026 г.