Անցնել հիմնական բովանդակությանը
OpenAI

6 հոկտեմբերի, 2025 թ.

Արտադրանք

Ներկայացնում ենք AgentKit-ը

Ագենտների կառուցման, տեղակայման և օպտիմալացման նոր գործիքներ։

Բեռնվում է…

Այսօր մենք թողարկում ենք AgentKit-ը՝ գործիքների ամբողջական հավաքածու ծրագրավորողների և ձեռնարկությունների համար՝ գործակալներ կառուցելու, տեղակայելու և օպտիմալացնելու համար։ Մինչև այժմ ագենտներ կառուցելը նշանակում էր տարբեր գործիքների համատեղում. բարդ գործիքավորում առանց տարբերակների կառավարման, հատուկ միացքների, ձեռքով գնահատման խողովակաշարերի, արագ կարգավորման և գործարկումից առաջ ինտերֆեյսի կատարելագործում շաբաթների ընթացքում։ AgentKit-ի միջոցով ծրագրավորողները այժմ կարող են տեսողականորեն նախագծել աշխատանքային հոսքեր և ավելի արագ ներդնել գործակալական UI-ները՝ օգտագործելով նոր կառուցվածքային բլոկներ, ինչպիսիք են՝

  • Ագենտի կառուցող․ տեսողական գործիք բազմագործակալային աշխատանքային հոսքերի ստեղծման և տարբերակման համար
  • Միացքի գրանցամատյան. կենտրոնական տեղ ադմինիստրատորների համար՝ կառավարելու, թե ինչպես են տվյալները և գործիքները միանում OpenAI պրոդուկներին
  • ChatKit․ գործիքակազմ՝ ձեր պրոդուկտի մեջ անհատականացվող զրույցի վրա հիմնված ագենտի փորձառություններ ներդնելու համար

Մենք նաև ընդլայնում ենք գնահատման հնարավորությունները նոր գործառույթներով, ինչպիսիք են տվյալների հավաքածուները, հետքերի գնահատումը, ավտոմատացված հարցման օպտիմալացումը և երրորդ կողմի մոդելի աջակցումը՝ ագենտի կատարողականը չափելու և բարելավելու համար։

Մարտ ամսին Պատասխաններ API և SDK ագենտներ թողարկելուց ի վեր, մենք տեսել ենք, որ ծրագրավորողները և ձեռնարկությունները ստեղծել ամբողջական գործակալական աշխատանքային հոսքեր՝ խորը հետազոտությունների, հաճախորդների աջակցության և այլնի համար: Klarna-ն աջակցում ագենտ է կառուցել, որը զբաղվում է բոլոր տոմսերի երկու երրորդով, իսկ Clay-ը 10 անգամ ավելացրել է աճը՝ վաճառքի ագենտի միջոցով։ AgentKit-ը հիմնված է Responses API-ի վրա՝ օգնելու մշակողներին ավելի արդյունավետ և հուսալիորեն ստեղծել գործակալներ։

Նախագծեք աշխատանքային հոսքերը ագենտ կառուցողի միջոցով

Քանի որ ագենտի աշխատանքային հոսքերը ավելի բարդ են դառնում, ծրագրավորողներին անհրաժեշտ է ավելի հստակ պատկերացում, թե ինչպես են դրանք աշխատում: Ագենտ կառուցողը(բացվում է նոր պատուհանում) տրամադրում է տեսողական կտավ՝ տրամաբանությունը կազմելու համար քաշել և թողնել հանգույցների միջոցով՝ տրամաբանություն ստեղծելու, գործիքներ միացնելու և հատուկ սահմանափակումներ սահմանելու համար։ Այն աջակցում է նախադիտման գործարկումներին, ներքին գնահատման կարգավորումներին և ամբողջական տարբերակավորմանը՝ իդեալական արագ կրկնությունների համար։

Վիզուալ կառուցող գործիքում հաճախորդների սպասարկման ավտոմատացման հոսքի ինտերֆեյսի տեսք: Կանվասը ցույց է տալիս միացված հանգույցները պիտակավորված Սկիզբ, Jailbreak guardrail, Դասակարգման ագենտ, If/else, Վերադարձի ագենտ, Պահպանման ագենտ, Տեղեկատվական ագենտ, Հալյուցինացիայի guardrail և Վերջ. Ձախ կողմում գտնվող կողագոտին ցուցադրում է առկա հանգույցների տեսակները, ինչպիսիք են՝ Ագենտ, Նշումը, ֆայլի որոնում, Guardrails, MCP և Օգտատերի հաստատում: Վերևի վերահսկիչները ներառում են ընտրանքներ՝ Գնահատել, Կոդ, Նախադիտում և Հրապարակել։

Կառուցողները կարող են սկսել դատարկ կտավով կամ նախապես պատրաստված ձևանմուշներով:

Ramp-ում թիմը դատարկ կտավից վերածվեց գնորդ-ագենտի ընդամենը մի քանի ժամվա ընթացքում։

Ագենտ կառուցողը փոխակերպեց այն, ինչ ժամանակին ամիսներ էր պահանջում բարդ համակարգման, հատուկ կոդի և ձեռքով օպտիմալացումների համար, ընդամենը մի քանի ժամում: Վիզուալ կտավը նույն էջում է պահում պրոդուկտի, իրավաբանական և ինժեներական հարցերը՝ 70%-ով կրճատելով իտերացիոն ցիկլերը և ագենտին գործարկելով երկու սպրինտում՝ երկու եռամսյակի փոխարեն։
— Ramp

Նմանապես, LY Corporation-ը՝ առաջատար ճապոնական տեխնոլոգիական և ինտերնետային ծառայությունների ընկերություն, երկու ժամից պակաս ժամանակում Ագենտ-կառուցողի միջոցով կառուցեց աշխատանքային օգնական գործակալ:

«Ագենտ կառուցողը թույլ տվեց մեզ նոր ձևով կազմակերպել ագենտների աշխատանքը՝ ինժեներների և թեմայի փորձագետների համագործակցությամբ՝ բոլորը մեկ ինտերֆեյսում: Մենք կառուցեցինք մեր առաջին բազմաագենտային աշխատանքային հոսքը և այն գործարկեցինք երկու ժամից պակաս ժամանակում՝ զգալիորեն արագացնելով ագենտների ստեղծման և տեղակայման ժամանակը»:
— LY Corporation

Մենք նաև գործարկում ենք Միացքի գրանցամատյան ձեռնարկությունների համար՝ բազմաթիվ աշխատատարածքներում և կազմակերպություններում տվյալները կառավարելու և պահպանելու նպատակով։ Միացքի գրանցամատյանը(բացվում է նոր պատուհանում) համախմբում է տվյալների աղբյուրները մեկ ադմինիստրատորի վահանակում՝ ChatGPT‑ի և API-ի համար։ Գրանցամատյանը ներառում է բոլոր նախապես կառուցված միացքները, ինչպիսիք են Dropbox-ը, Google Drive-ը, Sharepoint-ը և Microsoft Teams-ը, ինչպես նաև երրորդ կողմի MCP-ները։

Ծրագրավորողները կարող են նաև միացնել Guardrails(բացվում է նոր պատուհանում)-ը Ագենտ կառուցողում՝ բաց կոդով, մոդուլային անվտանգության շերտ, որը օգնում է պաշտպանել ագենտներին չնախատեսված կամ վնասակար վարքագծից: Guardrails-ը կարող է քողարկել կամ նշել անձնական տեղեկությունները, հայտնաբերել jailbreak-ներ և կիրառել այլ պաշտպանիչ միջոցներ, ինչը հեշտացնում է հուսալի և անվտանգ գործակալների ստեղծումը և տեղակայումը։ Guardrails-ը կարող է տեղակայվել ինքնուրույն կամ Python(բացվում է նոր պատուհանում)-ի և JavaScript(բացվում է նոր պատուհանում)-ի համար նախատեսված Guardrails գրադարանի միջոցով։

Ներդրված ագենտի զրույցի փորձառություններ ChatKit-ի միջոցով

Ագենտների համար զրույցի ինտերֆեյսների տեղակայումը կարող է զարմանալիորեն բարդ լինել՝ հոսքային պատասխանների վարում, շարքերի կառավարում, մոդելի մտածողության ցուցադրում և զրույցի ներգրավիչ փորձառություններ նախագծում: ChatKit-ը(բացվում է նոր պատուհանում)-ը հեշտացնում է ձեր արտադրանքին բնորոշ չաթի վրա հիմնված ագենտների ներդնումը։ Այն կարող է ներդրվել հավելվածներում կամ կայքերում և հարմարեցվել ձեր թեմային կամ ապրանքանիշին համապատասխանելու համար։

«Մենք երկու շաբաթից ավելի ժամանակ խնայեցինք՝ ChatKit-ի միջոցով մեր Canva ծրագրավորողների համայնքի համար աջակցության ագենտ կառուցելով և այն ինտեգրելով մեկ ժամից էլ պակաս ժամանակում։ Այս աջակցության ագենտը կվերափոխի այն ձևը, թե ինչպես ծրագրավորողները ներգրավվում են մեր փաստաթղթերի հետ՝ այն վերածելով խոսակցական փորձի՝ հեշտացնելով հավելվածների և ինտեգրացիաների կառուցումը Canva-ում»։
— Canva

ChatKit- ն արդեն ապահովում է մի շարք օգտագործման դեպքեր՝ ներառյալ Internal Knowledge օգնականները, գրանցման ուղեցույցները, հաճախորդների աջակցումը և հետազոտական ագենտները: HubSpot(բացվում է նոր պատուհանում)-ի հաճախորդների աջակցության ագենտը մեկ օրինակ է:

Ramp հարթակի վահանակի տեսքը, որը ցույց է տալիս ծախսերի կառավարման ինտերֆեյսը։ Գլխավոր վահանակը ողջունում է օգտատիրոջը՝ Դանիելին, և թվարկում է այնպիսի հարցումներ, ինչպիսիք են՝ «ChatGPT Business հարցում» (ստուգման փուլում է) և «HubSpot-ի հարցում» (սևագիր), ինչպես նաև ավիաընկերությունների, ուղևորափոխադրումների և ծրագրային ապահովման վերջին ծախսերը։ Աջ կողմում բաց է ChatGPT Business-ի համար ծրագրային ապահովման հարցման ձևը, որը մանրամասնում է 5 տեղ ամսական 125 դոլարով 2025 թվականի հոկտեմբերի 1-ից մինչև 2026 թվականի հոկտեմբերի 1-ը, դեղին «Ուղարկել հայտ» կոճակով:

Չափեք ագենտի կատարողականությունը Evals-ի նոր հնարավորություններով

Հուսալի, արտադրության համար պատրաստ ագենտներ կառուցելը պահանջում է կատարողականի խիստ գնահատում։ Անցյալ տարի մենք գործարկեցինք Evals(բացվում է նոր պատուհանում)-ը՝ օգնելու ծրագրավորողներին փորձարկել հարցումները և չափել մոդելի վարքագիծը: Մենք այժմ ավելացնում ենք չորս նոր հնարավորություններ, որոնք էլ ավելի հեշտ են դարձնում evals-ների կառուցումը:

  • Տվյալների հավաքածուներ– արագ կառուցեք ագենտի գնահատումներ զրոյից և ընդլայնեք դրանք ժամանակի ընթացքում ավտոմատացված գնահատողների և մարդկային ծանոթագրությունների միջոցով:
  • Գնահատման հետևում՝ ագենտի աշխատանքային հոսքերի ամբողջական գնահատումներ անցկացրեք և ավտոմատացրեք գնահատումը՝ թերությունները բացահայտելու համար։
  • Ավտոմատացված հարցումների օպտիմալացում՝ գեներացրեք բարելավված հարցումներ՝ հիմնված մարդկային մեկնաբանությունների և գնահատողների արտածումների վրա:
  • Երրորդ կողմի մոդելների աջակցություն՝ գնահատեք OpenAI Evals հարթակի այլ մատակարարների մոդելները։

Մենք արդեն տեսել ենք Evals օգտագործող հաճախորդների կատարողականի զգալի բարելավումներ:

«Գնահատման հարթակը կրճատել է զարգացման ժամանակը մեր բազմաագենտ պատշաճ ջանասիրության շրջանակներում ավելի քան 50%-ով, իսկ ագենտների ճշգրտությունը բարձրացրել է 30%-ով: "
— Carlyle
Ինտերֆեյս, որը ցույց է տալիս տվյալների հավաքածուի աղյուսակ՝ վարկանիշի, տոնայնության, կարծիքի և ճշգրտության սյունակներով: Տողերը ցուցադրում են գրառումները հավանել կամ չհավանել պատկերակներով, տոնային պիտակներով, ինչպիսիք են Մասնագիտական, Բարեկամական, Անկիրթ և Վատ, և ճշգրտության արդյունքները պիտակավորված են որպես Հաջողություն կամ Անհաջողություն՝ 3.5 գնահատականով: Վերևի գործիքագոտին ներառում է Վերբեռնել, Սյունակներ, Գնահատական, Արտածում գեներացնել և Պահել ընտրանքներ:

Բարձրացրեք ագենտի արդյունավետությունը՝ ամրապնդման նուրբ կարգավորման միջոցով

Ամրապնդման ճշգրտումը(բացվում է նոր պատուհանում) (RFT) թույլ է տալիս ծրագրավորողներին հարմարեցնել մեր հիմնավորման մոդելները: Այն ընդհանուր առմամբ հասանելի է OpenAI o4-mini-ում և GPT‑5‑ի մասնավոր բետա տարբերակում։ Մենք սերտորեն համագործակցում ենք տասնյակ հաճախորդների հետ՝ բարելավելու GPT‑5‑ի RFT-ն՝ նախքան ավելի լայն թողարկումը:

Այսօր մենք ներկայացնում ենք RFT բետա տարբերակի երկու նոր հնարավորություններ, որոնք նախատեսված են գործակալների արդյունավետությունն էլ ավելի բարձրացնելու համար.

  • Գործիքների պատվերով կանչեր– վարժեցնել մոդելներին ճիշտ ժամանակին ճիշտ գործիքներ կանչելու համար ավելի լավ հիմնավորումներ անելու համար 
  • "Պատվերով գնահատողներ– ձեր օգտագործման դեպքում ամենակարևորի համար հատուկ գնահատման չափանիշներ սահմանելու համար

Գներ և հասանելիություն

Այսօրվանից սկսած ChatKit-ը և նոր Evals հնարավորությունները հասանելի են բոլոր ծրագրավորողներին: Ագենտ կառուցողը հասանելի է բետա տարբերակով, իսկ Միացքի գրանցամատյանը սկսում է իր բետա թողարկումը որոշ API-ների, ChatGPT Enterprise և Edu հաճախորդների համար Գլոբալ ադմինիստրատիվ վահանակի(բացվում է նոր պատուհանում) միջոցով (որտեղ Գլոբալ սեփականատերերը կարող են կառավարել տիրույթներ, SSO, բազմաթիվ API կազմակերպություններ): Գլոբալ ադմինիստրատորի կառավարակետը Միացքի գրանցամատյանի միացման նախապայման է։ Այս բոլոր գործիքները ներառված են ստանդարտ API մոդելի գների մեջ:

Մենք պլանավորում ենք շուտով ավելացնել ինքնուրույն Աշխատանքային հոսքերի API և ագենտի տեղակայման տարբերակներ ChatGPT‑ին:

Անհամբեր սպասում ենք տեսնելու, թե ինչ եք կառուցելու։

Հեղինակ

OpenAI