Прескокни до главната содржина
OpenAI

6 октомври 2025 г.

Производ

Претставување на AgentKit

Нови алатки за градење, распоредување и оптимизирање на агенти.

Се вчитува...

Денес го пуштаме во употреба AgentKit, комплетен сет на алатки за развивачи на софтвер и компании за градење, распоредување и оптимизирање на агенти. До сега, градењето агенти значеше жонглирање со фрагментирани алатки - сложена оркестрација без верзионирање, сопствени конектори, рачни евалуациски цевководи, подесување на промпт и недели работа на фронтенд пред лансирање. Со AgentKit, развивачи на софтвер сега можат визуелно да дизајнираат работни текови и побрзо да вградат агентски кориснички интерфејси користејќи нови градежни блокови како:

  • Agent Builder: визуелно платно (canvas) за креирање и верзионирање на работни текови со повеќе агенти
  • Connector Registry: централно место од каде што администраторите можат да управуваат како податоците и алатките се поврзуваат низ производите на OpenAI
  • ChatKit: алатник за вградување на прилагодливи искуства со агенти базирани на разговор во твојот производ

Исто така, ги прошируваме можностите за евалуација со нови функции, како што се збирки на податоци, оценување траги, автоматизирана оптимизација на промптови и поддршка за модели од трето лице за мерење и подобрување на перформансите на агентите.

Од објавувањето на Responses API и Agents SDK во март, забележавме дека развивачите на софтвер и компаниите создаваат целосни од-до агентски работни процеси за длабинско истражување, поддршка на клиенти и многу повеќе. Кларна изгради агент за поддршка кој се справува со две третини од сите билети. AgentKit се базира на Одговори API за да им помогне на развивачите на софтвер да создаваат агенти поефикасно и понадежно.

Дизајнирај работни процеси со Agent Builder

Како што работните процеси на агентите стануваат се посложени, развивачите на софтвер имаат потреба од појасна видливост за тоа како тие функционираат. Агент Креатор(се отвора во нов прозорец) обезбедува canvas за компонирање логика со влечење и пуштање јазли, поврзување алатки и конфигурирање на сопствени заштитни огради. Поддржува прегледни извршувања, вградена eval конфигурација и целосно верзионирање - идеално за брза итерација.

Приказ на интерфејс на процес за автоматизација на услуги за клиенти во алатка за визуелен креатор. На canvas се прикажани поврзани јазли означени со Почеток, Заштитна ограда за Jailbreak, Агент за класификација, If/else, Агент за враќање, Агент за задржување, Агент за информации, Заштитна ограда за халуцинации и Крај. Странична лента на левата страна ги наведува достапните типови на јазли како што се агент, забелешка, пребарување на датотеки, заштитни огради, MCP и корисничко одобрување. Врвните контроли вклучуваат опции за Оценување, Кодирање, прегледај и објавува.

Креаторите можат да започнат со празно платно (canvas) или со претходно изградени шаблони.

Во Ramp, тимот се претвори од празно платно (canvas) во агент за купувачи за само неколку часа:

Agent Builder го трансформираше она што порано бараше месеци сложена оркестрација, прилагоден код и рачни оптимизации за само неколку часа. Canvas ги одржува производите, правните и инженерските тимови на иста страница, намалувајќи ги циклусите на итерација за 70% и овозможувајќи агентот да биде активен во два спринта наместо во две четвртини.
— Ramp

Слично на тоа, LY Corporation - водечка јапонска компанија за технологија и интернет услуги - изгради агент работен асистент со Agent Builder за помалку од два часа.

„Agent Builder ни овозможи да ги оркестрираме агентите на сосема нов начин, со инженери и експерти за содржина кои сите заедно соработуваат во еден интерфејс. Го изградивме нашиот прв мулти-агентски работен процес и го покренавме за помалку од два часа, драматично забрзувајќи го времето за креирање и распоредување на агенти.
— LY Corporation

Исто така, пуштаме во употреба регистар на поврзувачи за компании, за управување и одржување на податоци во повеќе работни простори и организации. Регистарот на конектори(се отвора во нов прозорец) ги обединува изворите на податоци во единствен административен панел за ChatGPT и API. Регистарот ги вклучува сите претходно изградени конектори како што се Dropbox, Google Drive, SharePoint и Microsoft Teams, како и MCP од трети лица.

Развивачи на софтвер исто така можат да овозможат Guardrails(се отвора во нов прозорец) во Agent Builder— модуларен безбедносен слој со отворен код кој помага да ги заштити агентите од ненамерно или злонамерно однесување. Заштитните огради можат да ги маскираат или означат PII, да откријат jailbreaks и да применат други заштитни мерки, што го олеснува создавањето и распоредувањето на сигурни и безбедни агенти. Guardrails може да се распоредат самостојно или преку библиотеката guardrails за Python(се отвора во нов прозорец) и JavaScript(се отвора во нов прозорец).

Вградете агентски разговорни искуства со ChatKit.

Распоредувањето кориснички интерфејси за разговор за агенти може да биде изненадувачки сложено - ракување со стриминг одговори, управување со нишки, прикажување на размислувањето на моделот и осмислување привлечни искуства во разговорот. ChatKit(се отвора во нов прозорец) го олеснува вградувањето на агенти базирани на разговор кои изгледаат природно во вашиот производ. Може да биде вграден во апликации или веб-сајтови и прилагоден за да одговара на твојата тема или бренд.

„Заштедивме повеќе од две седмици градејќи агент за поддршка за нашата заедница Canva Developers со ChatKit и го интегриравме за помалку од еден час. Овој поддржувачки агент ќе го трансформира начинот на кој развивачите на софтвер се ангажираат со нашите документи, претворајќи го во разговорно искуство, што го олеснува градењето апликации и интеграции на Canva.
— Canva

ChatKit веќе овозможува низа случаи на употреба, од асистенти за Internal Knowledge и водичи за вклучување, до агенти за поддршка на клиенти и истражувачки агенти. Агентот за поддршка на клиенти на HubSpot(се отвора во нов прозорец)е еден пример:

Приказ на контролна табла на платформата Ramp што прикажува интерфејс за управување со трошоци. Главниот панел го поздравува корисникот, Даниел, и наведува барања како што се „Барање за ChatGPT Business“ (во очекување на преглед) и „Барање за HubSpot“ (нацрт), заедно со неодамнешните трошоци за авиокомпании, споделени возења и софтвер. На десната страна, отворен е образец за барање на софтвер за ChatGPT Business, со детали за 5 места по цена од 125 долари месечно од 1 октомври 2025 до 1 октомври 2026 година, со жолто копче „Поднесува барање“.

Измери ги перформансите на агентот со новите можности на Evals

Изградбата на сигурни агенти, подготвени за производство, бара ригорозни проценки на перформансите. Минатата година го лансиравме Evals(се отвора во нов прозорец) за да им помогнеме на развивачите на софтвер да тестираат промпти и да го измерат однесувањето на моделот. Сега додаваме четири нови можности кои го олеснуваат создавањето на евалуации:

  • Податочни сетови- брзо изгради евалуации на агенти од нула и проширувај ги со текот на времето со автоматизирани оценувачи и човечки прибелешки.
  • Оценување на траги– спроведувај целосни проценки на агентските работни процеси и автоматизирај го оценувањето за да ги идентификуваш недостатоците.
  • Автоматска оптимизација на промпти– генерирај подобрени промпти врз основа на човечки белешки и резултати од оценувачот.
  • Поддршка на модели од трето лице– евалуација на модели од други провајдери во рамките на платформата OpenAI Evals.

Веќе забележавме значителни подобрувања во перформансите кај клиенти кои користат Evals.

„Платформата за евалуација го намали времето за развој на нашата рамка за темелна анализа со повеќе агенти за над 50% и ја зголеми точноста на агентите за 30%."
— Carlyle
Интерфејс кој прикажува табела со податоци со колони за Оценка, Тон, Повратни информации и Точност. Редовите прикажуваат записи со икони со палци нагоре или палци надолу, тонски ознаки како што се Професионален, Пријателски, Груб и Лош, и резултати за точност означени како Pass или Fail со резултат 3,5. Горната лента со алатки вклучува опции за поставува, колони, оценување, генерира резултат и зачувува.

Подобри ги перформансите на агентот со засилено фино прилагодување

Засилено фино прилагодување (се отвора во нов прозорец) (RFT) им овозможува на развивачите на софтвер да ги прилагодуваат нашите модели на размислување. Општо е достапен на OpenAI o4-mini и во приватна beta за GPT‑5. Тесно соработуваме со десетици клиенти за да го усовршиме RFT за GPT‑5 пред поширока објава.

Денес, воведуваме две нови функции во тоа RFT beta, дизајнирано со цел да ги подобри перформансите на агентите уште повеќе:

  • Прилагодени повици на алатки–ги обучува моделите за повикување на вистинските алатки, во вистинско време за подобро расудување 
  • Прилагодени оценувачи– поставува прилагодени критериуми за евалуација за она што е најважно во твојот случај на употреба.

Цени и достапност

Почнувајќи од денес, ChatKit и новите можности на Evals се генерално достапни за сите развивачи на софтвер. Agent Builder е достапен во бета верзија, а Connector Registry ја започнува својата бета верзија на некои API, ChatGPT Enterprise и Edu клиенти со глобална администраторска(се отвора во нов прозорец) конзола. Конзолата Global Admin е предуслов за овозможување на Регистарот на Конектори. Сите овие алатки се вклучени во стандардните цени на API моделот.

Планираме наскоро да додадеме самостоен API за Workflows и опции за распоредување на агенти во ChatGPT.

Со нетрпение чекаме да видиме што ќе изградиш.

Автор

OpenAI