Danas pokrećemo AgentKit, sveobuhvatni komplet alata za razvojne inženjere i poduzeća za izradu, implementaciju i optimizaciju izvršitelja. Do sada je razvoj izvršitelja značio žongliranje odvojenih alata — složenu orkestraciju bez verzioniranja, s prilagođenim poveznika, ručno podešavanim tokovima procjene, podešavanjem unosa i tjednima rada na vizialnom dijelu prije lansiranja. Uz AgentKit, razvojni inženjeri sada mogu vizualno dizajnirati tokove rada i brže ugraditi korisnička sučelja izvršitelja koristeći nove građevne blokove kao što su:
- Alat za izradu izvršitelja: vizualni predložak za izradu i verzioniranje tokova rada za više izvršitelja
- Registar poveznika: središnje mjesto za administratore za upravljanje načinom na koji se podaci i alati povezuju u OpenAI proizvodima
- ChatKit: alat za integraciju prilagodljivih chat-agenata u vaš proizvod
Također proširujemo mogućnosti procjene uz nove značajke kao što su skupovi podataka, ocjenjivanje praćenja, automatizirana optimizacija unosa i podrška za modele trećih strana, kako bismo mogli mjeriti i poboljšavati performanse izvršitelja.
Otkako smo u ožujku objavili Responses API i Agents SDK, primijetili smo kako razvojni inženjeri i poduzeća kreiraju cjelovite tijekove rada izvršitelja za dubinsko istraživanje, korisničku podršku i još mnogo toga. Klarna je izgradila izvršitelja za podršku, koji upravlja s dvije trećine svih zahtjeva, a Clay je povećao svoj rast deset puta putem prodajnog izvršitelja. AgentKit oslanja se na API za odgovore kako bi pomogao razvojnim inženjerima da učinkovitije i pouzdanije izgrade izvršitelje.
Kako tokovi rada izvršitelja (agenata) postaju sve složeniji, razvojnim inženjerima potrebna je jasnija vidljivost kako oni funkcioniraju. Agent Builder(otvara se u novom prozoru) pruža vizualni predložak za izradu logike, s čvorovima koji funkcioniraju na konceptu 'povuci i ispusti', povezivanjem alata i konfiguriranjem prilagođenih zaštita. Podrška za pretprikaze, ugrađenu konfiguraciju procjene i potpuno verzioniranje – idealno za brzu iteraciju.

Graditelji mogu započeti s praznim prozorom ili s unaprijed izrađenim predlošcima.
U Rampu, tim je prešao put od početnog praznog predloška do izvršitelja u samo nekoliko sati:
Agent Builder pretvorio je ono što je nekad trajalo mjesecima i zahtijevalo složene radnje, prilagođeni kôd i ručnu optimizaciju u operaciju od samo nekoliko sati. Vizualni predložak usklađuje proizvod, pravni i inženjerski tim, smanjujući cikluse iteracije za 70 % i omogućujući pokretanje izvršitelja uživo u dva sprinta umjesto u dva kvartala.
Slično tome, LY Corporation – vodeća japanska tehnološka i internetska kompanija – izradila je radnog asistenta-agenta pomoću Agent Buildera u manje od dva sata.
"Alat za izradu izvršitelja omogućio nam je orkestriranje izvršitelja na potpuno nov način, s inženjerima i stručnjacima koji surađuju u jedinstvenom sučelju. Razvili smo naš prvi multi-izvršiteljski tok rada i pokrenuli ga za manje od dva sata, dramatično ubrzavajući vrijeme za izradu i postavljanje izvršitelja."
Također pokrećemo Registar poveznika za poduzeća kako bi upravljali i održavali podatke u više radnih prostora i organizacija. Registar poveznika(otvara se u novom prozoru) konsolidira izvore podataka u jednu administracijsku ploču za ChatGPT i API. Registar uključuje sve unaprijed omogućene poveznike kao što su Dropbox, Google Drive, Sharepoint i Microsoft Teams, kao i MCP-ove trećih strana.
Razvojni inženjeri također mogu omogućiti Guardrails(otvara se u novom prozoru) ("zaštitne ograde") u Agent Builderu — modularni sigurnosni sloj otvorenog kôda koji pomaže u zaštiti poveznika od nenamjernog ili zlonamjernog ponašanja. Zaštitne mjere mogu maskirati ili označiti PII, otkriti pokušaje probijanja sigurnosnih sustava i primijeniti druge zaštitne mjere, što olakšava izgradnju i implementaciju pouzdanih, sigurnih poveznika. Zaštitne ograde mogu se postaviti samostalno ili putem biblioteke zaštitnih ograda za Python(otvara se u novom prozoru) i JavaScript(otvara se u novom prozoru).
Implementacija korisničkih sučelja za čavrljanje za poveznike može biti iznenađujuće složena – upravljanje tokovima odgovorima, vođenje razgovora, prikazivanje razmišljanja modela i osmišljavanje što boljih iskustava unutar čavrljanja. ChatKit(otvara se u novom prozoru) olakšava ugradnju poveznika temeljenih na čavrljanju koji se čine izvornima za vaš proizvod. Mogu se ugraditi u aplikacije ili web stranice i prilagoditi vašoj temi ili robnoj marki.
"Uštedjeli smo više od dva tjedna vremena razvojem izvršitelja za podršku našoj zajednici Canva Developers uz pomoć ChatKita i integrirali ga za manje od sat vremena. Ovaj izvršitelj za podršku transformirat će način na koji se razvojni inženjeri povezuju s našim dokumentima pretvarajući ih u razgovorno iskustvo, čime se olakšava izrada aplikacija i integracija na Canvi."
ChatKit već pokreće niz slučajeva uporabe, od asistenata internog znanja i vodiča za uvođenje do korisničke podrške i istraživačkih izvršitelja. HubSpot(otvara se u novom prozoru)ov izvršitelj za korisničku podršku jedan je primjer:

Razvoj pouzdanih izvršitelja spremnih za proizvodnju zahtijeva rigorozne procjene izvedbe. Prošle godine pokrenuli smo Evals(otvara se u novom prozoru) kako bismo pomogli razvojnim inženjerima da testiraju unose i izmjere ponašanje modela. Sada dodajemo četiri nove mogućnosti koje dodatno olakšavaju razvoj Evalsa:
- Skupovi podataka – brzo izradite procjene (evals) izvršitelja od nule i proširite ih s vremenom uz pomoć automatiziranih ocjenjivača i ljudskih bilješki.
- Ocjenjivanje praćenja – pokrenite cjelovite procjene tokova rada izvršitelja i automatizirajte ocjenjivanje kako biste precizno utvrdili nedostatke.
- Automatizirana optimizacija unosa – smislite poboljšane unose na temelju ljudskih napomena i izlaza ocjenjivača.
- Podrška za modele treće strane – procijenite modele drugih pružatelja unutar platforme OpenAI Evals.
Već smo primijetili značajna poboljšanja u performansama kod klijenata koji koriste Evals.
„Platforma za evaluaciju smanjila je vrijeme razvoja našeg due diligence okvira s više agenata za više od 50 % te povećala točnost agenata za 30 %.”

Fino podešavanje sigurnosti odabira(otvara se u novom prozoru) (RFT) omogućava razvojni inženjerima da prilagode naše modele zaključivanja. Općenito je dostupan na OpenAI o4-mini i u privatnoj beta verziji za GPT‑5. Blisko surađujemo s desecima klijenata kako bismo poboljšali RFT za GPT‑5 prije šireg puštanja u promet.
Danas predstavljamo dvije nove značajke u toj RFT beta verziji dizajniranoj da još više potakne performanse izvršitelja:
- Prilagođeni pozivi alata — obučite modele da pozivaju prave alate u pravo vrijeme za bolje zaključivanje
- Prilagođeni ocjenjivači — postavite prilagođene kriterije ocjenjivanja za ono što je najvažnije u vašem slučaju uporabe
Počevši od danas, ChatKit i nove mogućnosti Evalsa općenito su dostupne svim razvojnim inženjerima. Agent Builder dostupan je u beta verziji, a registar poveznika (Connector Registry) započinje s beta verzijom za neke API-je, ChatGPT Enterprise i Edu korisnike s globalnom administratorskom konzolom(otvara se u novom prozoru) (gdje globalni vlasnici mogu upravljati domenama, SSO-om i više API organizacija). Globalna administratorska konzola preduvjet je za omogućavanje registra poveznika. Svi ovi alati uključeni su u standardna određivanja cijena API modela.
Planiramo uskoro dodati samostalni Workflows API (za tokove rada) i opcije implementacije izvršitelja u ChatGPT.
Jedva čekamo vidjeti što ćete razviti.


