2025 оны аравдугаар сарын 6

AgentKit-ийг танилцуулж байна

Агент бүтээх, нэвтрүүлэх, оновчлох шинэ хэрэгслүүд.

Ачаалж байна…

Өнөөдөр бид хөгжүүлэгчид болон байгууллагуудад агент бүтээх, нэвтрүүлэх, оновчлох бүрэн хэрэгслийн цогц болох AgentKit-ийг танилцуулж байна. Өнөөг хүртэл агент бүтээнэ гэдэг нь хувилбаржуулалтгүй нарийн уялдуулалт, тусгай холбогч, гарын авлагын eval шугам, өгөгдөл тааруулах, нээлтээс өмнөх олон долоо хоногийн фронтэнд ажил зэрэг салангид хэрэгслүүдийг зэрэг зохицуулахыг хэлдэг байв. AgentKit-ийн тусламжтайгаар хөгжүүлэгчид одоо ажлын урсгалыг визуалаар загварчилж, дараах шинэ бүрэлдэхүүнүүдээр агентлаг UI-ийг илүү хурдан шингээж чадна:

Agent Builder: олон агенттай ажлын урсгал үүсгэх, хувилбаржуулах визуал канвас
Connector Registry: OpenAI бүтээгдэхүүнүүдийн хооронд өгөгдөл, хэрэгслүүд хэрхэн холбогдохыг админууд удирдах төвлөрсөн газар
ChatKit: өөрийн бүтээгдэхүүнд тохируулж болох чатад суурилсан агентын туршлагыг шингээх хэрэгслийн багц

Мөн бид агентын гүйцэтгэлийг хэмжиж сайжруулахын тулд өгөгдлийн багц, мөрийн үнэлгээ, автомат өгөгдөл оновчлол, гуравдагч талын загварын дэмжлэг зэрэг шинэ боломжуудаар үнэлгээний чадавхаа өргөжүүлж байна.

Гуравдугаар сард Responses API and Agents SDK⁠-ийг гаргаснаас хойш бид хөгжүүлэгчид болон байгууллагууд гүн судалгаа, хэрэглэгчийн дэмжлэг болон бусад зориулалтаар төгсгөлөөс төгсгөл хүртэлх агентлаг ажлын урсгалууд бүтээж байгааг харсан. Klarna дэмжлэгийн агент бүтээж⁠ бүх тасалбарын гуравны хоёрыг боловсруулдаг болсон бөгөөд Clay өсөлтөө 10x болгосон⁠ борлуулалтын агентын тусламжтай. AgentKit нь Responses API дээр тулгуурлан хөгжүүлэгчдэд агентуудыг илүү үр ашигтай, найдвартай бүтээхэд тусалдаг.

Agent Builder-ээр ажлын урсгал загварчлах

Агентын ажлын урсгалууд илүү төвөгтэй болохын хэрээр хөгжүүлэгчдэд тэдгээр нь хэрхэн ажилладгийг илүү тодорхой харах шаардлага гардаг. Agent Builder⁠(шинэ цонхонд нээгдэнэ) нь чирч тавьдаг нодуудаар логик угсрах, хэрэгслүүд холбох, тусгай guardrail тохируулах визуал канвас өгдөг. Энэ нь preview run, inline eval тохиргоо, бүрэн хувилбаржуулалтыг дэмждэг тул хурдан давталтад тохиромжтой.

Визуал бүтээгч хэрэгсэл доторх хэрэглэгчийн үйлчилгээний автоматжуулалтын урсгалын интерфэйс. Канвас дээр Start, Jailbreak guardrail, Classification agent, If/else, Return agent, Retention agent, Information agent, Hallucination guardrail, End гэсэн шошготой холбогдсон нодууд харагдана. Зүүн талын хажуу самбарт Agent, Note, File search, Guardrails, MCP, User approval зэрэг боломжтой нодын төрлүүд жагссан байна. Дээд удирдлагад Evaluate, Code, Preview, Publish гэсэн сонголтууд багтсан.

Бүтээгчид хоосон канвасаас эсвэл урьдчилан бэлтгэсэн загваруудаас эхлэх боломжтой.

Ramp дээр баг нь хоосон канвасаас худалдан авагч агент хүртэл ердөө хэдхэн цагийн дотор хүрсэн:

Agent Builder нь урьд нь олон сарын нарийн уялдуулалт, тусгай код, гар аргаар хийдэг оновчлол шаарддаг ажлыг ердөө хэдхэн цагийн ажил болгож өөрчилсөн. Визуал канвас нь бүтээгдэхүүн, хууль, инженерийн багийг нэг ойлголт дээр төвлөрүүлж, давталтын мөчлөгийг 70%-иар бууруулан, агентын нэвтрүүлэлтийг хоёр улирал биш хоёр спринтэд амьд болгосон.”

— Ramp

Үүнтэй адил Японы тэргүүлэх технологи, интернэт үйлчилгээний компани болох LY Corporation Agent Builder ашиглан хоёр цаг хүрэхгүй хугацаанд ажлын туслах агент бүтээсэн.

“Agent Builder бидэнд агентуудыг цоо шинэ аргаар уялдуулах боломж олгож, инженерүүд болон салбарын мэргэжилтнүүдийг нэг интерфэйс дээр хамтран ажиллуулах боломж бүрдүүлсэн. Бид анхны олон агенттай ажлын урсгалаа бүтээж, хоёр цаг хүрэхгүй хугацаанд ажиллуулсан нь агент бүтээх, нэвтрүүлэх хугацааг эрс хурдасгасан.”

— LY Corporation

Мөн бид олон ажлын талбар, байгууллагын хэмжээнд өгөгдлийг засаглаж, хадгалах боломжтой Connector Registry-г байгууллагуудад зориулан танилцуулж байна. Connector Registry⁠(шинэ цонхонд нээгдэнэ) нь ChatGPT болон API даяарх өгөгдлийн эх үүсвэрүүдийг нэг админ самбарт нэгтгэдэг. Registry-д Dropbox, Google Drive, Sharepoint, Microsoft Teams зэрэг бэлэн холбогчууд болон гуравдагч талын MCP-үүд бүгд багтсан.

Хөгжүүлэгчид мөн Agent Builder дотор Guardrails⁠(шинэ цонхонд нээгдэнэ)-ийг идэвхжүүлж болно—энэ нь агентуудыг санамсаргүй эсвэл хортой үйлдлээс хамгаалахад тусалдаг нээлттэй эхтэй, модульчлагдсан аюулгүй байдлын давхарга юм. Guardrails нь PII-г халхалж эсвэл тэмдэглэж, jailbreak илрүүлж, бусад хамгаалалтыг хэрэгжүүлдэг тул найдвартай, аюулгүй агент бүтээж нэвтрүүлэхийг хялбар болгодог. Guardrails-ийг дангаар нь эсвэл Python⁠(шинэ цонхонд нээгдэнэ) болон JavaScript⁠(шинэ цонхонд нээгдэнэ)-д зориулсан guardrails library-аар дамжуулан нэвтрүүлж болно.

ChatKit-ээр агентлаг чат туршлагыг шингээх

Агентуудад зориулсан чат UI нэвтрүүлэх нь санаанд оромгүй төвөгтэй байж болно—урсгал хариултыг боловсруулах, thread удирдах, загварын сэтгэж буйг харуулах, чат дотор сонирхолтой туршлага зохиох гэх мэт. ChatKit⁠(шинэ цонхонд нээгдэнэ) нь танай бүтээгдэхүүнд төрөлхийн мэт мэдрэгдэх чатад суурилсан агентуудыг шингээхийг хялбар болгодог. Үүнийг апп эсвэл вэбсайтад шингээж, танай theme эсвэл брэндэд тохируулан өөрчилж болно.

“ChatKit-ийн тусламжтайгаар бид Canva Developers нийгэмлэгтээ зориулсан дэмжлэгийн агент бүтээхэд хоёр долоо хоногоос илүү хугацааг хэмнэж, нэг цаг хүрэхгүй хугацаанд нэгтгэсэн. Энэ дэмжлэгийн агент нь манай баримтжуулалтыг харилцан ярианы туршлага болгон хувиргаж, Canva дээр апп, интеграци бүтээхийг хялбар болгосноор хөгжүүлэгчидтэй харилцах арга барилыг өөрчилнө.”

— Canva

ChatKit нь аль хэдийн дотоод мэдлэгийн туслах, onboarding guide-аас эхлээд хэрэглэгчийн дэмжлэг, судалгааны агент хүртэл олон төрлийн хэрэглээг дэмжиж байна. HubSpot⁠(шинэ цонхонд нээгдэнэ)-ийн хэрэглэгчийн дэмжлэгийн агент бол үүний нэг жишээ:

Ramp платформын зардлын удирдлагын интерфэйсийг харуулсан хяналтын самбар. Үндсэн самбар нь Daniel хэрэглэгчид мэндчилж, ‘Request for ChatGPT Business’ (хяналтад хүлээгдэж буй) болон ‘Request for HubSpot’ (ноорог) зэрэг хүсэлтүүдийг, мөн агаарын тээвэр, rideshare, програм хангамжийн сүүлийн зардлуудыг жагсаасан байна. Баруун талд ChatGPT Business-д зориулсан програм хангамжийн хүсэлтийн маягт нээлттэй бөгөөд 2025 оны 10-р сарын 1-нээс 2026 оны 10-р сарын 1 хүртэл сар бүр $125 үнэтэй 5 суудлыг, мөн шар өнгийн ‘Submit request’ товчийг харуулж байна.

Шинэ Evals боломжуудаар агентын гүйцэтгэлийг хэмжих

Найдвартай, үйлдвэрлэлд бэлэн агент бүтээхэд гүйцэтгэлийн хатуу үнэлгээ шаардлагатай. Өнгөрсөн жил бид хөгжүүлэгчдэд өгөгдлийг турших, загварын зан төлөвийг хэмжихэд туслах Evals⁠(шинэ цонхонд нээгдэнэ)-ийг танилцуулсан. Одоо бид eval бүтээхийг бүр ч хялбар болгох дөрвөн шинэ боломж нэмж байна:

Өгөгдлийн багцууд–автомат үнэлэгч болон хүний annotation ашиглан агентын eval-ийг эхнээс нь хурдан бүтээж, цаг хугацааны явцад өргөжүүлэх.
Мөрийн үнэлгээ–агентлаг ажлын урсгалын төгсгөлөөс төгсгөл хүртэлх үнэлгээг ажиллуулж, сул талуудыг илрүүлэхийн тулд үнэлгээг автоматжуулах.
Автомат өгөгдөл оновчлол–хүний annotation болон үнэлэгчийн гаралтад тулгуурлан сайжруулсан өгөгдөл үүсгэх.
Гуравдагч талын загварын дэмжлэг–OpenAI Evals платформ дотор бусад нийлүүлэгчдийн загварыг үнэлэх.

Бид Evals ашиглаж буй хэрэглэгчдээс гүйцэтгэлийн томоохон өсөлтийг аль хэдийн харсан.

“Үнэлгээний платформ нь манай олон агенттай due diligence хүрээний хөгжүүлэлтийн хугацааг 50%-иас дээш бууруулж, агентын нарийвчлалыг 30%-иар нэмэгдүүлсэн.”

— Carlyle

Үнэлгээ, Өнгө аяс, Санал хүсэлт, Нарийвчлал гэсэн баганатай өгөгдлийн хүснэгтийг харуулсан интерфэйс. Мөрүүдэд эрхий хуруу дээш эсвэл доош дүрс, Professional, Friendly, Rude, Bad зэрэг өнгө аясыг заасан шошго, мөн 3.5 оноотой Pass эсвэл Fail гэж тэмдэглэсэн нарийвчлалын үр дүнүүд харагдана. Дээд хэрэгслийн мөрөнд Upload, Columns, Grade, Generate output, Save гэсэн сонголтууд багтсан байна.

Бататгах нарийн тохиргоогоор агентын гүйцэтгэлийг ахиулах

Бататгах нарийн тохиргоо⁠(шинэ цонхонд нээгдэнэ) (RFT) нь хөгжүүлэгчдэд манай сэтгэн бодох загваруудыг өөрчлөн тохируулах боломж олгодог. Энэ нь OpenAI o4-mini дээр нийтэд нээлттэй, GPT‑5‑д хувийн beta шатанд байна. Бид GPT‑5‑ийн RFT-ийг өргөн хүрээтэй гаргахаас өмнө боловсронгуй болгохын тулд олон арван хэрэглэгчтэй нягт хамтран ажиллаж байна.

Өнөөдөр бид тэр RFT beta-д агентын гүйцэтгэлийг илүү ахиулах зорилготой хоёр шинэ боломжийг танилцуулж байна:

Тусгай хэрэгслийн дуудлага–загваруудыг зөв цагт зөв хэрэгслийг дуудахаар сургаж, илүү сайн сэтгэн бодох чадвар бий болгох
Тусгай үнэлэгчид–танай хэрэглээний хувилбарт хамгийн чухал зүйлд зориулан тусгай үнэлгээний шалгуур тогтоох

Үнэ ба хүртээмж

Өнөөдрөөс эхлэн ChatKit болон шинэ Evals боломжууд бүх хөгжүүлэгчдэд нийтэд нээлттэй боллоо. Agent Builder нь beta хувилбартай, харин Connector Registry нь Global Admin Console⁠(шинэ цонхонд нээгдэнэ) (Global Owners нь домэйн, SSO, олон API org-ийг удирдах боломжтой) бүхий зарим API, ChatGPT Enterprise, Edu хэрэглэгчдэд beta нэвтрүүлэлтээ эхлүүлж байна. Global Admin console нь Connector Registry-г идэвхжүүлэх урьдчилсан нөхцөл юм. Эдгээр бүх хэрэгсэл стандарт API загварын үнэд багтсан.

Бид удахгүй тусдаа Workflows API болон агент нэвтрүүлэх сонголтуудыг ChatGPT‑д нэмэхээр төлөвлөж байна.

Та юу бүтээхийг харахыг бид тэсэн ядан хүлээж байна.

Зохиогч

OpenAI

Үргэлжлүүлэн уншина уу

Бүгдийг үзэх

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 одоо Microsoft 365 Copilot-ийн үндсэн загвар боллоо

Бүтээгдэхүүн2026 оны 7-р сарын 9

GPT-5.6: Таны хүсэл тэмүүлэлд нийцсэн хил хязгаарын оюун ухаан

Бүтээгдэхүүн2026 оны 7-р сарын 9

ChatGPT таны хамгийн амбицтай ажилд хамтрагч боллоо

Бүтээгдэхүүн2026 оны 7-р сарын 9