Այսօր մենք թողարկում ենք AgentKit-ը՝ գործիքների ամբողջական հավաքածու ծրագրավորողների և ձեռնարկությունների համար՝ գործակալներ կառուցելու, տեղակայելու և օպտիմալացնելու համար։ Մինչև այժմ ագենտներ կառուցելը նշանակում էր տարբեր գործիքների համատեղում. բարդ գործիքավորում առանց տարբերակների կառավարման, հատուկ միացքների, ձեռքով գնահատման խողովակաշարերի, արագ կարգավորման և գործարկումից առաջ ինտերֆեյսի կատարելագործում շաբաթների ընթացքում։ AgentKit-ի միջոցով ծրագրավորողները այժմ կարող են տեսողականորեն նախագծել աշխատանքային հոսքեր և ավելի արագ ներդնել գործակալական UI-ները՝ օգտագործելով նոր կառուցվածքային բլոկներ, ինչպիսիք են՝
- Ագենտի կառուցող․ տեսողական գործիք բազմագործակալային աշխատանքային հոսքերի ստեղծման և տարբերակման համար
- Միացքի գրանցամատյան. կենտրոնական տեղ ադմինիստրատորների համար՝ կառավարելու, թե ինչպես են տվյալները և գործիքները միանում OpenAI պրոդուկներին
- ChatKit․ գործիքակազմ՝ ձեր պրոդուկտի մեջ անհատականացվող զրույցի վրա հիմնված ագենտի փորձառություններ ներդնելու համար
Մենք նաև ընդլայնում ենք գնահատման հնարավորությունները նոր գործառույթներով, ինչպիսիք են տվյալների հավաքածուները, հետքերի գնահատումը, ավտոմատացված հարցման օպտիմալացումը և երրորդ կողմի մոդելի աջակցումը՝ ագենտի կատարողականը չափելու և բարելավելու համար։
Մարտ ամսին Պատասխաններ API և SDK ագենտներ թողարկելուց ի վեր, մենք տեսել ենք, որ ծրագրավորողները և ձեռնարկությունները ստեղծել ամբողջական գործակալական աշխատանքային հոսքեր՝ խորը հետազոտությունների, հաճախորդների աջակցության և այլնի համար: Klarna-ն աջակցում ագենտ է կառուցել, որը զբաղվում է բոլոր տոմսերի երկու երրորդով, իսկ Clay-ը 10 անգամ ավելացրել է աճը՝ վաճառքի ագենտի միջոցով։ AgentKit-ը հիմնված է Responses API-ի վրա՝ օգնելու մշակողներին ավելի արդյունավետ և հուսալիորեն ստեղծել գործակալներ։
Քանի որ ագենտի աշխատանքային հոսքերը ավելի բարդ են դառնում, ծրագրավորողներին անհրաժեշտ է ավելի հստակ պատկերացում, թե ինչպես են դրանք աշխատում: Ագենտ կառուցողը(բացվում է նոր պատուհանում) տրամադրում է տեսողական կտավ՝ տրամաբանությունը կազմելու համար քաշել և թողնել հանգույցների միջոցով՝ տրամաբանություն ստեղծելու, գործիքներ միացնելու և հատուկ սահմանափակումներ սահմանելու համար։ Այն աջակցում է նախադիտման գործարկումներին, ներքին գնահատման կարգավորումներին և ամբողջական տարբերակավորմանը՝ իդեալական արագ կրկնությունների համար։

Կառուցողները կարող են սկսել դատարկ կտավով կամ նախապես պատրաստված ձևանմուշներով:
Ramp-ում թիմը դատարկ կտավից վերածվեց գնորդ-ագենտի ընդամենը մի քանի ժամվա ընթացքում։
Ագենտ կառուցողը փոխակերպեց այն, ինչ ժամանակին ամիսներ էր պահանջում բարդ համակարգման, հատուկ կոդի և ձեռքով օպտիմալացումների համար, ընդամենը մի քանի ժամում: Վիզուալ կտավը նույն էջում է պահում պրոդուկտի, իրավաբանական և ինժեներական հարցերը՝ 70%-ով կրճատելով իտերացիոն ցիկլերը և ագենտին գործարկելով երկու սպրինտում՝ երկու եռամսյակի փոխարեն։
Նմանապես, LY Corporation-ը՝ առաջատար ճապոնական տեխնոլոգիական և ինտերնետային ծառայությունների ընկերություն, երկու ժամից պակաս ժամանակում Ագենտ-կառուցողի միջոցով կառուցեց աշխատանքային օգնական գործակալ:
«Ագենտ կառուցողը թույլ տվեց մեզ նոր ձևով կազմակերպել ագենտների աշխատանքը՝ ինժեներների և թեմայի փորձագետների համագործակցությամբ՝ բոլորը մեկ ինտերֆեյսում: Մենք կառուցեցինք մեր առաջին բազմաագենտային աշխատանքային հոսքը և այն գործարկեցինք երկու ժամից պակաս ժամանակում՝ զգալիորեն արագացնելով ագենտների ստեղծման և տեղակայման ժամանակը»:
Մենք նաև գործարկում ենք Միացքի գրանցամատյան ձեռնարկությունների համար՝ բազմաթիվ աշխատատարածքներում և կազմակերպություններում տվյալները կառավարելու և պահպանելու նպատակով։ Միացքի գրանցամատյանը(բացվում է նոր պատուհանում) համախմբում է տվյալների աղբյուրները մեկ ադմինիստրատորի վահանակում՝ ChatGPT‑ի և API-ի համար։ Գրանցամատյանը ներառում է բոլոր նախապես կառուցված միացքները, ինչպիսիք են Dropbox-ը, Google Drive-ը, Sharepoint-ը և Microsoft Teams-ը, ինչպես նաև երրորդ կողմի MCP-ները։
Ծրագրավորողները կարող են նաև միացնել Guardrails(բացվում է նոր պատուհանում)-ը Ագենտ կառուցողում՝ բաց կոդով, մոդուլային անվտանգության շերտ, որը օգնում է պաշտպանել ագենտներին չնախատեսված կամ վնասակար վարքագծից: Guardrails-ը կարող է քողարկել կամ նշել անձնական տեղեկությունները, հայտնաբերել jailbreak-ներ և կիրառել այլ պաշտպանիչ միջոցներ, ինչը հեշտացնում է հուսալի և անվտանգ գործակալների ստեղծումը և տեղակայումը։ Guardrails-ը կարող է տեղակայվել ինքնուրույն կամ Python(բացվում է նոր պատուհանում)-ի և JavaScript(բացվում է նոր պատուհանում)-ի համար նախատեսված Guardrails գրադարանի միջոցով։
Ագենտների համար զրույցի ինտերֆեյսների տեղակայումը կարող է զարմանալիորեն բարդ լինել՝ հոսքային պատասխանների վարում, շարքերի կառավարում, մոդելի մտածողության ցուցադրում և զրույցի ներգրավիչ փորձառություններ նախագծում: ChatKit-ը(բացվում է նոր պատուհանում)-ը հեշտացնում է ձեր արտադրանքին բնորոշ չաթի վրա հիմնված ագենտների ներդնումը։ Այն կարող է ներդրվել հավելվածներում կամ կայքերում և հարմարեցվել ձեր թեմային կամ ապրանքանիշին համապատասխանելու համար։
«Մենք երկու շաբաթից ավելի ժամանակ խնայեցինք՝ ChatKit-ի միջոցով մեր Canva ծրագրավորողների համայնքի համար աջակցության ագենտ կառուցելով և այն ինտեգրելով մեկ ժամից էլ պակաս ժամանակում։ Այս աջակցության ագենտը կվերափոխի այն ձևը, թե ինչպես ծրագրավորողները ներգրավվում են մեր փաստաթղթերի հետ՝ այն վերածելով խոսակցական փորձի՝ հեշտացնելով հավելվածների և ինտեգրացիաների կառուցումը Canva-ում»։
ChatKit- ն արդեն ապահովում է մի շարք օգտագործման դեպքեր՝ ներառյալ Internal Knowledge օգնականները, գրանցման ուղեցույցները, հաճախորդների աջակցումը և հետազոտական ագենտները: HubSpot(բացվում է նոր պատուհանում)-ի հաճախորդների աջակցության ագենտը մեկ օրինակ է:

Հուսալի, արտադրության համար պատրաստ ագենտներ կառուցելը պահանջում է կատարողականի խիստ գնահատում։ Անցյալ տարի մենք գործարկեցինք Evals(բացվում է նոր պատուհանում)-ը՝ օգնելու ծրագրավորողներին փորձարկել հարցումները և չափել մոդելի վարքագիծը: Մենք այժմ ավելացնում ենք չորս նոր հնարավորություններ, որոնք էլ ավելի հեշտ են դարձնում evals-ների կառուցումը:
- Տվյալների հավաքածուներ– արագ կառուցեք ագենտի գնահատումներ զրոյից և ընդլայնեք դրանք ժամանակի ընթացքում ավտոմատացված գնահատողների և մարդկային ծանոթագրությունների միջոցով:
- Գնահատման հետևում՝ ագենտի աշխատանքային հոսքերի ամբողջական գնահատումներ անցկացրեք և ավտոմատացրեք գնահատումը՝ թերությունները բացահայտելու համար։
- Ավտոմատացված հարցումների օպտիմալացում՝ գեներացրեք բարելավված հարցումներ՝ հիմնված մարդկային մեկնաբանությունների և գնահատողների արտածումների վրա:
- Երրորդ կողմի մոդելների աջակցություն՝ գնահատեք OpenAI Evals հարթակի այլ մատակարարների մոդելները։
Մենք արդեն տեսել ենք Evals օգտագործող հաճախորդների կատարողականի զգալի բարելավումներ:
«Գնահատման հարթակը կրճատել է զարգացման ժամանակը մեր բազմաագենտ պատշաճ ջանասիրության շրջանակներում ավելի քան 50%-ով, իսկ ագենտների ճշգրտությունը բարձրացրել է 30%-ով: "

Ամրապնդման ճշգրտումը(բացվում է նոր պատուհանում) (RFT) թույլ է տալիս ծրագրավորողներին հարմարեցնել մեր հիմնավորման մոդելները: Այն ընդհանուր առմամբ հասանելի է OpenAI o4-mini-ում և GPT‑5‑ի մասնավոր բետա տարբերակում։ Մենք սերտորեն համագործակցում ենք տասնյակ հաճախորդների հետ՝ բարելավելու GPT‑5‑ի RFT-ն՝ նախքան ավելի լայն թողարկումը:
Այսօր մենք ներկայացնում ենք RFT բետա տարբերակի երկու նոր հնարավորություններ, որոնք նախատեսված են գործակալների արդյունավետությունն էլ ավելի բարձրացնելու համար.
- Գործիքների պատվերով կանչեր– վարժեցնել մոդելներին ճիշտ ժամանակին ճիշտ գործիքներ կանչելու համար ավելի լավ հիմնավորումներ անելու համար
- "Պատվերով գնահատողներ– ձեր օգտագործման դեպքում ամենակարևորի համար հատուկ գնահատման չափանիշներ սահմանելու համար
Այսօրվանից սկսած ChatKit-ը և նոր Evals հնարավորությունները հասանելի են բոլոր ծրագրավորողներին: Ագենտ կառուցողը հասանելի է բետա տարբերակով, իսկ Միացքի գրանցամատյանը սկսում է իր բետա թողարկումը որոշ API-ների, ChatGPT Enterprise և Edu հաճախորդների համար Գլոբալ ադմինիստրատիվ վահանակի(բացվում է նոր պատուհանում) միջոցով (որտեղ Գլոբալ սեփականատերերը կարող են կառավարել տիրույթներ, SSO, բազմաթիվ API կազմակերպություններ): Գլոբալ ադմինիստրատորի կառավարակետը Միացքի գրանցամատյանի միացման նախապայման է։ Այս բոլոր գործիքները ներառված են ստանդարտ API մոդելի գների մեջ:
Մենք պլանավորում ենք շուտով ավելացնել ինքնուրույն Աշխատանքային հոսքերի API և ագենտի տեղակայման տարբերակներ ChatGPT‑ին:
Անհամբեր սպասում ենք տեսնելու, թե ինչ եք կառուցելու։


