6 tetor 2025

Prezantojmë AgentKit

Mjete të reja për ndërtimin, përdorimin dhe optimizimin e agjentëve.

Duke ngarkuar…

Sot po lançojmë AgentKit, një set i plotë mjetesh për zhvilluesit dhe ndërmarrjet për të krijuar, përdorur dhe optimizuar agjentët. Deri më tani, ndërtimi i agjentëve nënkuptonte xhonglimin e mjeteve të fragmentuara—orkestrim kompleks pa versionim, lidhës të personalizuar, linja vlerësimi manual, përshtatje të kërkesave dhe javë pune në frontend përpara lançimit. Me AgentKit, zhvilluesit tani mund të dizajnojnë flukset e punës vizualisht dhe të integrojnë UI-të agjentike më shpejt duke përdorur blloqe të reja ndërtimi si:

Ndërtuesi i agjentëve: një kanavacë vizuale për krijimin dhe versionimin e proceseve të punës me shumë agjentë
Regjistri i lidhësve: një vend qendror për administratorët për të menaxhuar se si të dhënat dhe mjetet lidhen nëpër produktet OpenAI
ChatKit: një paketë mjetesh për integrimin e përvojave të personalizueshme të agjentëve të bazuar në bisedë në produktin tënd

Ne gjithashtu po zgjerojmë aftësitë e vlerësimit me veçori të reja si grupe të dhënash, vlerësim i gjurmëve, optimizim i automatizuar i kërkesave dhe mbështetje për modele të palëve të treta për të matur dhe përmirësuar performancën e agjentit.

Që nga dalja e API-së së Përgjigjeve dhe Agents SDK⁠ në mars, kemi parë zhvillues dhe kompani që ndërtojnë procese pune agjentike nga fillimi në fund për kërkime të thella, mbështetje ndaj klientit e më shumë. Klarna ndërtoi një agjent mbështetës⁠ që trajton dy të tretat e të gjitha kërkesave dhe Clay 10-fishoi rritijen⁠ me një agjent shitjesh. AgentKit ndërtohet mbi API-në e Përgjigjeve për të ndihmuar zhvilluesit të krijojnë agjentë në mënyrë më efikase dhe të besueshme.

Dizajnoni proceset e punës me Agent Builder

Ndërsa proceset e punës së agjentëve bëhen më komplekse, zhvilluesit kanë nevojë për një pamje më të qartë se si funksionojnë ato. Agent Builder⁠(hapet në një dritare të re) ofron një kanavacë vizuale për kompozimin e logjikës me nyje të zvarrit dhe lësho, mjete lidhëse dhe konfigurimin e parmakëve të personalizuar. Mbështetje për pamje paraprake, konfigurimin e vlerësimit në linjë dhe versionimin e plotë—ideale për përsëritje të shpejtë.

Pamja e ndërfaqes së një fluksi automatizimi të shërbimit të klientit në një mjet ndërtues vizual. Canvas tregon nyjet e lidhura të etiketuara Start, Jailbreak guardrail, Agjenti i klasifikimit, If/else, Agjenti i kthimit, Agjenti i ruajtjes, Agjenti i informacionit, Hallucination guardrail dhe End. Një shirit anësor në të majtë rendit llojet e nyjeve të disponueshme si Agjent, Shënim, Kërkimi i skedarëve, Mbrojtëset, MCP dhe Miratimi i përdoruesit. Kontrollet kryesore përfshijnë opsionet për Vlerësim, Kod, Pamje paraprake dhe Publiko.

Ndërtuesit mund të fillojnë me një kanavacë bosh ose me shabllone të paracaktuara.

Në Ramp, ekipi kaloi nga një kanavacë bosh te një agjent blerës brenda vetëm disa orësh:

Agent Builder transformoi atë që dikur kërkonte muaj orkestrimi kompleks, kod të personalizuar dhe optimizime manuale në vetëm disa orë. Kanavaca vizuale mban produktin, kuadrin ligjor dhe inxhinierinë në të njëjtën faqe, duke zvogëluar ciklet e përsëritjes me 70% dhe duke bërë që një agjent të jetë aktiv në dy sprinte në vend të dy çerekëve.

— Ramp

Në mënyrë të ngjashme, LY Corporation—një kompani lider japoneze e teknologjisë dhe shërbimeve të internetit—ndërtoi një agjent asistent pune me Agent Builder në më pak se dy orë.

"Agent Builder na lejoi të orkestrojmë agjentët në një mënyrë krejtësisht të re, me inxhinierë dhe ekspertë të fushës që bashkëpunojnë të gjithë në një ndërfaqe të vetme. Ne ndërtuam proceset e para multi-agjentike të punës dhe i ekzekutuam ato në më pak se dy orë, duke përshpejtuar në mënyrë dramatike kohën për të krijuar dhe vendosur agjentë."

— Korporata LY

Ne gjithashtu po lançojmë një Regjistër të lidhësve për kompanitë për të menaxhuar dhe mirëmbajtur të dhënat në hapësira të shumta pune dhe organizata. Regjistri i lidhësve⁠(hapet në një dritare të re) konsolidon burimet e të dhënave në një panel të vetëm administratori në ChatGPT dhe API. Regjistri përfshin të gjithë lidhësit e para-ndërtuar si Dropbox, Google Drive, Sharepoint dhe Microsoft Teams, si dhe MCP-të e palëve të treta.

Zhvilluesit mund të aktivizojnë gjithashtu mbrojtëse⁠(hapet në një dritare të re) në Agent Builder—një shtresë sigurie modulare me burim të hapur që ndihmon në mbrojtjen e agjentëve nga sjelljet e paqëllimshme ose keqdashëse. Mbrojtëset mund të maskojnë ose shënojnë PII, të zbulojnë ndërprerjet e sigurisë dhe të aplikojnë masa të tjera mbrojtëse, duke e bërë më të lehtë ndërtimin dhe vendosjen e agjentëve të besueshëm dhe të sigurt. Mbrojtëset mund të vendosen në mënyrë të pavarur ose përmes bibliotekës së mbrojtëseve për Python⁠(hapet në një dritare të re) dhe JavaScript⁠(hapet në një dritare të re).

Integro përvojat e bisedës agjentike me ChatKit

Vendosja e ndërfaqeve të bisedës për agjentët mund të jetë çuditërisht komplekse—trajtimi i përgjigjeve në rresht, menaxhimi i bashkëbisedimeve, shfaqja e mendimit të modelit dhe hartimi i përvojave tërheqëse në bisedë. ChatKit⁠(hapet në një dritare të re) e bën të thjeshtë integrimin e agjentëve të bazuar në bisedë që duken si pjesë e natyrshme e produktit tënd. Mund të integrohet në aplikacione ose faqe interneti dhe të personalizohet për t'iu përshtatur temës ose markës sate.

"Ne ruajtëm mbi dy javë kohë duke ndërtuar një agjent mbështetje për komunitetin tonë të zhvilluesve të Canva me ChatKit dhe e integruam atë në më pak se një orë. Ky agjent mbështetje do të transformojë mënyrën se si zhvilluesit angazhohen me dokumentet tona duke e kthyer atë në një përvojë bisede, duke e bërë të lehtë ndërtimin e aplikacioneve dhe integrimeve në Canva."

— Canva

ChatKit tashmë fuqizon një sërë rastesh përdorimi, nga asistentët e Internal Knowledge dhe udhëzuesit e integrimit deri te mbështetja e klientit dhe agjentët kërkimorë. Agjenti i mbështetjes së klientëve të HubSpot⁠(hapet në një dritare të re)është një shembull:

Pamja e panelit të platformës Ramp që tregon një ndërfaqe për menaxhimin e shpenzimeve. Paneli kryesor përshëndet përdoruesin, Daniel, dhe rendit kërkesa të tilla si 'Kërkesa për ChatGPT Business' (në pritje të rishikimit) dhe 'Kërkesa për HubSpot' (draft), së bashku me shpenzimet e fundit për linjat ajrore, udhëtimet me taksi dhe softuerin. Në të djathtë, një formular kërkese për softuer është i hapur për ChatGPT Business, duke detajuar 5 vende me 125 dollarë në muaj nga 1 tetor 2025 deri më 1 tetor 2026, me një buton të verdhë 'Dërgo'.

Mat performancën e agjentit me aftësitë e reja të Evals

Ndërtimi i agjentëve të besueshëm dhe të gatshëm për prodhim kërkon vlerësime rigoroze të performancës. Vitin e kaluar, ne lançuam Evals⁠(hapet në një dritare të re) për të ndihmuar zhvilluesit të testojnë kërkesat dhe të matin sjelljen e modelit. Tani po shtojmë katër veçori të reja që e bëjnë edhe më të lehtë ndërtimin e vlerësimeve:

Grupe të dhënash–ndërton me shpejtësi vlerësimet e agjentëve nga e para dhe i zgjeron ato me kalimin e kohës me vlerësues të automatizuar dhe shënime njerëzore.
Vlerësimi i gjurmëve– kryen vlerësime nga fillimi në fund të proceseve të punës agjentike dhe automatizon vlerësimin për të identifikuar mangësitë.
Optimizimi i automatizuar i kërkesave– gjeneron kërkesa të përmirësuara bazuar në shënimet njerëzore dhe daljet e vlerësuesit.
Mbështetje për modelet e palës së tretë– vlerëson modelet nga ofrues të tjerë brenda platformës OpenAI Evals.

Ne kemi parë tashmë përmirësime të mëdha në performancë nga klientët që përdorin Evals.

"Platforma e vlerësimit shkurtoi kohën e zhvillimit në kornizën tonë të verifikimit të kujdesit të duhur me shumë agjentë me mbi 50% dhe rriti saktësinë e agjentëve me 30%."

— Carlyle

Ndërfaqja që tregon një tabelë të të dhënave me kolona për vlerësimin, tonin, përshtypjet dhe saktësinë. Rreshtat shfaqin të dhëna me ikona me gishtat lart ose gishtat poshtë, etiketa toni si Profesional, Miqësor, I vrazhdë dhe I keq, dhe rezultatet e saktësisë të etiketuara Kalon ose Dështim me një rezultat prej 3.5. Shiriti i veglave i sipërm përfshin opsione për Ngarko, Kolonat, Vlerëso, Gjenero dalje dhe Ruaj.

Përmirëson performancën e agjentit me rregullim të përforcimit

Rregullim i hollësishëm i përforcimit⁠(hapet në një dritare të re) (RFT) i lejon zhvilluesit të personalizojnë modelet tanë të arsyetimit. Është përgjithësisht i disponueshëm në OpenAI o4-mini dhe në beta private për GPT‑5. Ne po punojmë ngushtë me dhjetëra klientë për të përmirësuar RFT-në për GPT‑5 para daljes më të gjerë.

Sot, po prezantojmë dy veçori të reja në atë beta RFT të dizajnuara për të përmirësuar performancën e agjentit edhe më tej:

Thirrjet e mjeteve të personalizuara–trajnojnë modelet për të thirrur mjetet e duhura në kohën e duhur për arsyetim më të mirë
Vlerësues të personalizuar–vendosin kritere vlerësimi të personalizuara për atë që ka më shumë rëndësi në rastin tënd të përdorimit

Çmimet dhe disponueshmëria

Duke filluar nga sot, ChatKit dhe aftësitë e reja të Evals janë përgjithësisht të disponueshme për të gjithë zhvilluesit. Agent Builder është i disponueshëm në versionin beta dhe regjistri i lidhësve po fillon shpërndarjen e tij në versionin beta për disa klientë API, ChatGPT Enterprise dhe Edu me një Konsolë globale administratori⁠(hapet në një dritare të re) (ku pronarët globalë mund të menaxhojnë domene, SSO, organizata të shumta API). Konsola globale e administratorit është një parakusht për të mundësuar Regjistrin e lidhësve. Të gjitha këto mjete janë të përfshira në çmimet standarde të modelit API.

Ne planifikojmë të shtojmë një API të pavarur të proceseve të punës dhe opsione përdorimi të agjentit në ChatGPT së shpejti.

Mezi presim të shohim se çfarë do të ndërton.

Autor

OpenAI

Vazhdo të lexosh

Shiko të gjitha

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 tani është modeli i preferuar në Microsoft 365 Copilot

Produkti9 korr 2026

GPT-5.6: inteligjencë avangardë që rritet me ambicien tënde

Produkti9 korr 2026

ChatGPT tashmë është partner për punën tënde më ambicioze

Produkti9 korr 2026