Danas pokrećemo AgentKit, kompletan set alata za programere i preduzeća za izgradnju, implementaciju i optimizaciju agenata. Do sada je izgradnja agenata značila žongliranje fragmentiranim alatima—složenu orkestraciju bez verzioniranja, prilagođene konektore, ručne evaluacijske cjevovode, podešavanje upita i sedmice rada na frontendu prije lansiranja. Uz AgentKit, programeri sada mogu vizualno dizajnirati radne tokove i brže ugraditi agentne korisničke interfejse koristeći nove gradivne blokove kao što su:
- Agent Builder: vizualni canvas za kreiranje i verzioniranje višeagentskih radnih procesa
- Connector Registry: centralno mjesto za administratore da upravljaju načinom na koji se podaci i alati povezuju preko OpenAI proizvoda
- ChatKit: alat za ugrađivanje prilagodljivih iskustava agenata zasnovanih na chatu u vaš proizvod
Također proširujemo mogućnosti evaluacije s novim značajkama kao što su skupovi podataka, ocjenjivanje tragova, automatizirana optimizacija upita i podrška za modele trećih strana kako bismo mjerili i poboljšali performanse agenata.
Od kada smo u martu objavili Responses API i Agenti SDK, primijetili smo da programeri i preduzeća kreiraju sveobuhvatne agentne tokove rada za dubinsko istraživanje, korisničku podršku i još mnogo toga. Klarna je izgradila agenta za podršku koji obrađuje dvije trećine svih zahtjeva, a Clay je deset puta povećao rast uz pomoć prodajnog agenta. AgentKit se oslanja na Responses API kako bi pomogao programerima da efikasnije i pouzdanije izgrade agente.
Kako radni tokovi agenata postaju sve složeniji, programerima je potrebna jasnija vidljivost načina na koji oni rade. Agent Builder(otvara se u novom prozoru) nudi vizualni canvas za sastavljanje logike s čvorovima za povlačenje i ispuštanje, povezivanje alata i konfiguriranje prilagođenih zaštitnih ograda. Podržava pokretanje pregleda, ugrađenu konfiguraciju evaluacije i potpuno verzioniranje - idealno za brzu iteraciju.

Graditelji mogu započeti s praznim canvasom ili s unaprijed izgrađenim šablonima.
U Rampu, tim je prešao s praznog canvas do agenta kupca u samo nekoliko sati:
Agent Builder transformirao je ono što je nekad trajalo mjesecima složene orkestracije, prilagođenog koda i ručnih optimizacija u samo nekoliko sati. Vizualni canvas drži proizvod, pravni i inženjerski tim na istoj stranici, smanjujući cikluse iteracije za 70% i omogućavajući da agent bude uživo u dva sprinta umjesto u dva kvartala.
Slično tome, LY Corporation—vodeća japanska kompanija za tehnologiju i internet usluge—izgradila je agenta za pomoć pri radu koristeći Agent Builder za manje od dva sata.
"Agent graditelj nam je omogućio orkestriranje agenata na potpuno nov način, s inženjerima i stručnjacima za temu koji surađuju svi u jednom sučelju. Izgradili smo naš prvi multi-agentski tijek rada i pokrenuli ga za manje od dva sata, dramatično ubrzavajući vrijeme za kreirati i implementirati agente."
Također pokrećemo Registar konektora za preduzeća kako bi upravljali i održavali podatke u više radnih prostora i organizacija. Registar konektora(otvara se u novom prozoru) objedinjuje izvore podataka u jedinstveni administrativni panel za ChatGPT i API. Registar uključuje sve unaprijed izgrađene konektore kao što su Dropbox, Google Drive, Sharepoint i Microsoft Teams, kao i MCP-ove trećih strana.
Programeri također mogu omogućiti Guardrails(otvara se u novom prozoru) u Agent Builderu—modularnom sigurnosnom sloju otvorenog koda koji pomaže u zaštiti agenata od nenamjernog ili zlonamjernog ponašanja. Guardrails može maskirati ili označiti PII, otkriti jailbreakove i primijeniti druge zaštitne mjere, što olakšava izgradnju i implementaciju pouzdanih, sigurnih agenata. Guardrails se može rasporediti samostalno ili putem guardrails biblioteke za Python(otvara se u novom prozoru) i JavaScript(otvara se u novom prozoru).
Implementacija korisničkih interfejsa za chat za agente može biti iznenađujuće složena— rukovanje streaming odgovorima, upravljanje nizovima, prikazivanje razmišljanja modela i dizajniranje privlačnih iskustava unutar chata. ChatKit(otvara se u novom prozoru) olakšava ugradnju agenata zasnovanih na chatu koji se čine izvornim za vaš proizvod. Može se ugraditi u aplikacije ili web stranice i prilagoditi vašoj temi ili brendu.
„Sačuvali smo više od dvije sedmice vremena izgradnjom agenta za podršku našoj zajednici Canva programera pomoću ChatKita i integrirali ga za manje od sat vremena. Ovaj agent za podršku će transformirati način na koji programeri stupaju u interakciju s našim dokumentima pretvarajući ih u iskustvo razgovora, čineći izradu aplikacija i integracija na Canvi jednostavnom.“
ChatKit već pokreće niz primjena, od internih pomoćnika za znanje i vodiča za pristup novih zaposlenika do agenata za korisničku podršku i istraživanje. HubSpot(otvara se u novom prozoru) agent za korisničku podršku je primjer toga:

Izgradnja pouzdanih agenata spremnih za proizvodnju zahtijeva rigorozne procjene performansi. Prošle godine pokrenuli smo Evals(otvara se u novom prozoru) kako bismo pomogli programerima da testiraju upite i mjere ponašanje modela. Sada dodajemo četiri nove mogućnosti koje dodatno olakšavaju izgradnju evala:
- Skupovi podataka–brzo izgradite evaluacije agenta od nule i vremenom ih proširite uz pomoć automatiziranih ocjenjivača i ljudskih bilješki.
- Ocjenjivanje tragova— pokrenite cjelovite procjene agentičkih tokova rada i automatizirajte ocjenjivanje kako biste precizno utvrdili nedostatke.
- Automatizirana optimizacija upita– generirajte poboljšane upite na osnovu ljudskih napomena i izlaza ocjenjivača.
- Podrška za modele treće strane– procijenite modele drugih pružatelja unutar platforme OpenAI Evals.
Već smo primijetili značajna poboljšanja u performansama kod kupaca koji koriste Evals.
„Platforma za evaluaciju smanjila je vrijeme razvoja našeg okvira za dubinsku analizu s više agenata za preko 50% i povećala točnost agenata za 30%.“

Fino podešavanje pojačanja(otvara se u novom prozoru) (RFT) omogućava programerima da prilagode naše modele rezonovanja. Općenito je dostupan na OpenAI o4-mini i u privatnoj beta verziji za GPT‑5. Blisko surađujemo s desetinama kupaca kako bismo usavršili RFT za GPT‑5 prije šireg izdanja.
Danas predstavljamo dvije nove značajke u RFT beta verziji dizajniranoj da još više unaprijedi performanse agenta:
- Prilagođeni pozivi alata–obučavajte modele da pozivaju prave alate u pravo vrijeme za bolje rezonovanje
- Prilagođeni ocjenjivači–postavite prilagođene kriterije ocjenjivanja za ono što je najvažnije u vašem slučaju upotrebe
Počevši od danas, ChatKit i nove mogućnosti Evals općenito su dostupne svim programerima. Agent Builder je dostupan u beta verziji, a Connector Registry započinje svoje beta uvođenje za neke API, ChatGPT Enterprise i Edu korisnike s Globalnom administrativnom konzolom(otvara se u novom prozoru) (gdje globalni vlasnici mogu upravljati domenama, SSO-om i više API organizacija). Globalna administratorska konzola je preduvjet za omogućavanje Connector Registry. Svi ovi alati uključeni su u standardnu cijenu API modela.
Imamo plan uskoro dodati samostalni Workflows API i opcije implementacije agenta u ChatGPT.
Jedva čekamo da vidimo šta ćete izgraditi.


