Leo tunazindua AgentKit, seti kamili ya zana kwa wasanidi programu na makampuni kujenga, kupeleka na kuboresha mawakala. Hadi sasa, kujenga mawakala kulimaanisha kutumia zana zilizogawanyika—uratatibu mgumu bila toleo, viunganishi maalum, mabomba ya tathmini ya mikono, kurekebisha dokeza na wiki za kazi ya mbele kabla ya uzinduzi. Kwa kutumia AgentKit, wasanidi programu sasa wanaweza kubuni mtiririko wa kazi kwa njia ya kuona na kuingiza UI za kiwakala haraka kwa kutumia vitalu vipya vya ujenzi kama:
- Mjenzi wa Wakala: canvas ya kuunda na kuweka matoleo ya mtiririko wa kazi wa mawakala mbalimbali
- Usajili wa Kiunganishi: mahali pa kati kwa wasimamizi kusimamia jinsi data na zana zinavyounganisha katika bidhaa za OpenAI
- ChatKit: kifaa cha kuweka uzoefu wa wakala wa mazungumzo unaoweza kubadilishwa kwenye bidhaa yako
Tunapanua pia uwezo wa tathmini kwa vipengele vipya kama vile seti za data, upimaji wa ufuatiliaji, uboreshaji wa dokeza kiotomatiki, na usaidizi wa miundo ya wahusika wengine ili kupima na kuboresha utendaji wa wakala.
Tangu kutolewa kwa API ya Majibu na SDK ya Wakala mnamo Machi, tumeona wasanidi programu na biashara wakijenga mtiririko wa kazi wa wakala wa mwisho hadi mwisho kwa utafiti wa kina, usaidizi wa wateja na zaidi. Klarna ilijenga wakala wa usaidizi anayeshughulikia theluthi mbili ya tiketi zote na Clay iliongeza ukuaji mara 10 kwa kutumia wakala wa mauzo. AgentKit inajenga juu ya API ya Majibu ili kuwasaidia wasanidi programu kujenga mawakala kwa ufanisi zaidi na kwa kuaminika.
Kadiri mtiririko wa kazi wa wakala unavyokuwa mgumu zaidi, msanidi programu wanahitaji mwonekano wazi zaidi wa jinsi unavyofanya kazi. Mjenzi wa Wakala(fungua katika dirisha jipya) hutoa canvas ya kuona kwa kutunga mantiki kwa kutumia nodi za kuburuta na kuachia, kuunganisha zana, na kusanidi vizuizi maalum. Usaidizi wa uendeshaji wa onyesho awali, usanidi wa tathmini ya ndani, na utoaji wa matoleo kamili—bora kwa urudufishaji wa haraka.

Wajenzi wanaweza kuanza na canvas tupu au violezo vilivyotengenezwa awali.
Katika Ramp, Team ilianza na canvas tupu na kuwa wakala wa mnunuzi katika muda wa saa chache tu:
Mjenzi wa Wakala ilibadilisha kile ambacho hapo awali kilichukua miezi ya upangaji tata, msimbo maalum na uboreshaji wa mikono kuwa masaa machache tu. Canvas ya kuona huweka bidhaa, kisheria, na uhandisi kwenye ukurasa mmoja, ikipunguza mizunguko ya marudio kwa 70% na kuwezesha wakala kuanza kazi katika mbio mbili badala ya robo mbili.
Vivyo hivyo, LY Corporation—kampuni inayoongoza ya teknolojia na huduma za mtandao ya Kijapani—ilijenga wakala mjenzi msaidizi wa kazi kwa kutumia wakala mjenzi kwa chini ya masaa mawili.
"Mjenzi wa Wakala ulituruhusu kupanga mawakala kwa njia mpya kabisa, huku wahandisi na wataalam wa mada wakishirikiana wote katika kiolesura kimoja. Tulijenga mtiririko wetu wa kwanza wa kazi wa mawakala wengi na kuutekeleza chini ya masaa mawili, tukiharakisha sana muda wa kuunda na kupeleka mawakala."
Tunazindua pia Usajili wa Kiunganishi kwa makampuni kutawala na kudumisha data katika maeneo ya kazi mengi na mashirika. Usajili wa Kiunganishi(fungua katika dirisha jipya) unajumuisha vyanzo vya data katika paneli moja ya msimamizi kwenye ChatGPT na API. Usajili unajumuisha viunganisho vyote vilivyojengwa tayari kama Dropbox, Google Drive, Sharepoint na Microsoft Teams, pamoja na MCP za wahusika wengine.
Masanidi programu pia wanaweza kuwasha Guardrails(fungua katika dirisha jipya) katika Mjenzi wa Wakala—safu ya usalama ya chanzo wazi na ya kimoduli ambayo husaidia kulinda mawakala dhidi ya tabia isiyokusudiwa au mbaya. Guardrails zinaweza kuficha au kuashiria PII, kugundua uvunjaji wa usalama, na kutumia ulinzi mwingine, na hivyo kurahisisha kujenga na kupeleka mawakala wa kuaminika na salama. Guardrails zinaweza kutumika peke yake au kupitia maktaba ya guardrails kwa Python(fungua katika dirisha jipya) na JavaScript(fungua katika dirisha jipya).
Kuweka UI za chati kwa mawakala kunaweza kuwa ngumu sana - kushughulikia majibu ya utiririshaji, kusimamia tukio, kuonyesha mawazo ya muundo, na kubuni uzoefu wa kuvutia ndani ya chati. ChatKit(fungua katika dirisha jipya) inafanya iwe rahisi kuingiza mawakala wa chati ambao wanahisi asili kwa bidhaa yako. Inaweza kuingizwa kwenye programu au tovuti na kuboreshwa ili kulingana na mada yako au chapa yako.
"Tulihifadhi zaidi ya wiki mbili za muda kwa kujenga wakala wa usaidizi kwa jamii yetu ya Wasanidi Programu wa Canva kwa kutumia ChatKit na tuliunganisha kwa chini ya saa moja. Wakala huyu wa usaidizi atabadilisha jinsi wasanidi programu wanavyoshirikiana na hati zetu kwa kuigeuza kuwa uzoefu wa mazungumzo, na kuifanya iwe rahisi kujenga programu na ujumuishaji kwenye Canva."
Chatkit tayari ina nguvu anuwai ya kesi, kutoka kwa wasaidizi wa maarifa ya ndani na miongozo ya kuingia kwenye msaada wa wateja na mawakala wa utafiti. Wakala wa usaidizi wa wateja wa HubSpot(fungua katika dirisha jipya)ni mfano mmoja:

Kujenga mawakala wa kuaminika, walio tayari kwa uzalishaji kunahitaji tathmini kali za utendaji. Mwaka jana, tulizindua Evals(fungua katika dirisha jipya) ili kuwasaidia wasanidi programu kujaribu dokeza na kupima tabia ya miundo. Sasa tunaongeza uwezo mpya nne ambao hurahisisha zaidi kujenga evals:
- Datasets–jenga haraka tathmini za mawakala kutoka mwanzo na kuzikuza baada ya muda kwa kutumia wapimaji wa kiotomatiki na maelezo ya kibinadamu.
- Ufuatiliaji wa viwango–endesha tathmini za mwisho hadi mwisho za mtiririko wa kazi wa wakala na uweke alama kiotomatiki ili kubaini mapungufu.
- Uboreshaji wa dokeza wa kiotomatiki–zalisha dokeza zilizoboreshwa kulingana na maelezo ya binadamu na utoaji wa mchambuzi.
- Usaidizi wa miundo ya mhusika mwingine– tathmini miundo kutoka kwa watoa huduma wengine ndani ya jukwaa la OpenAI Evals.
Tayari tumeona ongezeko kubwa la utendaji kutoka kwa wateja wanaotumia Evals.
"Jukwaa la tathmini lilipunguza muda wa maendeleo kwenye mfumo wetu wa bidii ya kina wa mawakala wengi kwa zaidi ya 50%, na kuongeza usahihi wa mawakala kwa 30%."

Marekebisho ya kuimarisha(fungua katika dirisha jipya) (RFT) yanawaruhusu msanidi programu kubinafsisha miundo yetu ya uwazaji. Kwa ujumla inapatikana kwenye OpenAI o4-mini na katika beta ya kibinafsi kwa GPT‑5. Tunafanya kazi kwa karibu na wateja kadhaa kuboresha RFT ya GPT‑5 kabla ya kutolewa kwa upana.
Leo, tunatanguliza vipengele viwili vipya katika beta hiyo ya RFT vilivyoundwa kuboresha zaidi utendaji wa wakala:
- Wito wa zana maalum–funza miundo kuita zana sahihi kwa wakati unaofaa kwa hoja bora
- Wapimaji maalum- weka vigezo vya tathmini maalum kwa kile kinachojalisha zaidi katika kesi yako ya matumizi
Kuanzia leo, ChatKit na uwezo mpya wa Evals unapatikana kwa ujumla kwa wasanidi programu wote. Wakala Mjenzi unapatikana katika toleo la Beta, na Usajili wa Kiunganishi unaanza utoaji wake wa Beta kwa baadhi ya wateja wa API, ChatGPT Enterprise na Edu walio na Global Admin Console(fungua katika dirisha jipya) (ambapo Wamiliki wa Kimataifa wanaweza kusimamia vikoa, SSO, na mashirika mengi ya API). Console ya Usimamizi wa Kimataifa ni sharti la awali la kuwezesha Usajili wa Kiunganishi. Zana hizi zote zimejumuishwa katika uwekaji bei wa kawaida wa muundo wa API.
Tuna mpango wa kuongeza API ya kujitegemea ya Workflows na chaguzi za utekelezaji wa wakala kwenye ChatGPT hivi karibuni.
Hatuwezi kusubiri kuona unachojenga.


