Preskočite na glavno vsebino
OpenAI

6. oktober 2025

Izdelek

Predstavljamo AgentKit

Nova orodja za gradnjo, uvajanje in optimizacijo agentov.

Nalaganje …

Danes lansiramo AgentKit, celoten nabor orodij za razvijalce in podjetja za ustvarjanje, uvajanje in optimizacijo agentov. Do sedaj je bilo ustvarjanje agentov povezano z usklajevanjem fragmentiranih orodij, tj. zapletena orkestracija brez verzioniranja, povezovalniki po meri, ročni evalvacijski postopki, prilagajanje pozivov in več tednov frontend razvoja pred lansiranjem. Z AgentKit-om lahko razvijalci zdaj vizualno oblikujejo delovne tokove in hitreje vključijo agentne uporabniške vmesnike z novimi gradniki, kot so:

  • Agent Builder: vizualna predloga za ustvarjanje in verzioniranje večagentnih delovnih tokov
  • Connector Registry: centralizirano mesto za skrbnike, kjer lahko upravljajo povezave med podatki in orodji v različnih izdelkih OpenAI
  • ChatKit: nabor orodij za vgrajevanje prilagodljivih klepetalnih agentov v vaš izdelek

Poleg tega širimo zmožnosti evalvacije z novimi funkcionalnostmi, kot so podatkovni nizi, ocenjevanje sledov, avtomatizirana optimizacija pozivov in podpora za modele tretjih strani za merjenje in izboljšanje delovanja agentov.

Po lansiranju storitve Responses API in Agents SDK marca smo opazili, da so razvijalci in podjetja ustvarili agentne delovne tokove od začetka do konca za poglobljeno raziskovanje, podporo strankam in še več. Klarna je ustvarila podpornega agenta, ki obravnava dve tretjini vseh zahtevkov, medtem ko je Clay z uporabo prodajnega agenta povečal rast za 10-krat. AgentKit temelji na storitvi Responses API kot pomoč razvijalcem za bolj učinkovito in zanesljivo ustvarjanje agentov.

Oblikujte delovne tokove s storitvijo Agent Builder

Ker postajajo delovni tokovi agentov vse bolj zapleteni, razvijalci potrebujejo jasnejši vpogled v samo delovanje. Agent Builder(odpre se v novem oknu) omogoča vizualno predlogo za sestavljanje logike z uporabo vozlišč z metodo povleci in spusti, povezovanje orodij ter konfiguriranje prilagojenih varovalnih mej. Podpira predogledne zagone, vgrajeno eval konfiguracijo in popolno verzioniranje, kar je idealno za hitro iteracijo.

Pogled vmesnika avtomatiziranega toka storitev za stranke v orodju za vizualnega graditelja. Predloga prikazuje povezane vozlišča z oznakami Začetek, Jailbreak varovalni mehanizem, Razvrščevalni agent, Če/potem, Vrni agent, Agent za zadrževanje, Informacijski agent, Hallucination varovalni mehanizem in Konec. Here is the translation with the terms translated properly:Stranski meni na levi prikazuje razpoložljive tipe vozlišč, kot so Agent, Opomba, Iskanje datotek, Varovalni mehanizmi, MCP in Odobritev uporabnika. Glavni kontrolniki vključujejo možnosti Ocenjevanje, Kodiranje, Predogled in Objavi.

Graditelji lahko začnejo s prazno ali s predpripravljeno predlogo.

Ekipi podjetja Ramp je v samo nekaj urah uspelo iz praznega platna ustvariti agentnega kupca:

Agent Builder je vse to, kar je prej zahtevalo mesece in mesece zapletene orkestracije, kod po meri in ročnih optimizacij, zdaj strnil v le nekaj ur. Vizualna predloga izdelek, pravne zadeve in tehnologijo uskladi, kar zmanjša cikle iteracij za 70 %, agent pa postane operativen v dveh sprintih namesto v dveh četrtletjih.
— Ramp

Podobno je podjetje LY Corporation, vodilno japonsko podjetje za tehnologijo in internetne storitve, v manj kot dveh urah z Agent Builderjem ustvarilo delovnega asistenta.

»Agent Builder nam je omogočil orkestracijo agentov na povsem nov način, s sodelovanjem inženirjev in strokovnjakov v enem samem vmesniku. »Ustvarili smo naš prvi večagentni delovni tok in ga izvedli v manj kot dveh urah, kar je dramatično pospešilo čas za ustvarjanje in uvajanje agentov.«
— LY Corporation

Prav tako uvajamo storitev Connector Registry za podjetja za upravljanje in vzdrževanje podatkov v več delovnih prostorih in organizacijah. Connector Registry(odpre se v novem oknu) združuje podatkovne vire v eno samo upraviteljsko ploščo za ChatGPT in API. Register vključuje vse predizdelane povezovalnike, kot so Dropbox, Google Drive, Sharepoint in Microsoft Teams, kot tudi MCP-je tretjih strank.

Razvijalci lahko v Agent Builderju omogočijo storitev Guardrails(odpre se v novem oknu), tj. odprtokodno, modularno varnostno plast, ki pomaga zaščititi agente pred nenamernim ali zlonamernim vedenjem. Guardrails lahko maskira ali poroča o osebno prepoznavnih informacijah, zaznajo jailbreake in uporabljajo druge ukrepe za lažje ustvarjanje in uporabo zanesljivih, varnih agentov. Guardrails se lahko uvede samostojno ali preko knjižnice varovalnih mehanizmov za Python(odpre se v novem oknu) in JavaScript(odpre se v novem oknu).

Vdelajte klepetalnega agenta s storitvijo ChatKit

Uvajanje klepetalnih uporabniških vmesnikov za agente je lahko kar zapleteno: obravnavanje pretočnih odgovorov, upravljanje niti, prikazovanje razmišljanja modela in oblikovanje zanimive izkušnje v klepetu. ChatKit(odpre se v novem oknu) omogoča enostavno vdelavo klepetalnih agentov, ki se zdijo, da so izdelku nativni. Lahko ga vdelate v aplikacije ali spletna mesta in prilagodite vaši temi ali blagovni znamki.

»Shranili smo več kot dva tedna časa pri izgradnji agenta za podporo za našo skupnost razvijalcev Canva s ChatKitom in ga integrirali v manj kot eni uri. Ta agent za podporo bo preoblikoval način, kako razvijalci sodelujejo z našo dokumentacijo, tako da jo bo spremenil v pogovorno izkušnjo, kar bo olajšalo izdelavo aplikacij in integracij na Canva.«
— Canva

ChatKit že poganja različne primere uporabe, od asistentov za notranje znanje in vodnikov za uporabo agentov za podporo strankam in raziskave. Eden od primerov je agent za podporo strank podjetja HubSpot(odpre se v novem oknu):

Pogled na nadzorno ploščo platforme Ramp, ki prikazuje vmesnik za upravljanje stroškov. Glavna plošča pozdravi uporabnika Daniela in navede zahteve, kot sta »Zahteva za ChatGPT Business« (v čakanju na pregled) in »Zahteva za HubSpot« (osnutek), skupaj z nedavnimi stroški za letalske prevoze, prevoze z vozili in programsko opremo. Na desni je odprt obrazec za zahtevo za programsko opremo ChatGPT Business, ki podrobno opisuje 5 mest po 125 USD na mesec od 1. oktobra 2025 do 1. oktobra 2026, z rumenim gumbom »Pošlji zahtevo«.

Merite uspešnost agentov z novimi zmogljivostmi Evals

Izdelava zanesljivih agentov, pripravljenih za proizvodnjo, zahteva stroge ocene zmogljivosti. Lani smo lansirali Evals(odpre se v novem oknu), da bi razvijalcem pomagali preizkusiti pozive in meriti vedenje modela. Zdaj dodajamo štiri nove zmogljivosti za še lažjo izdelavo Evals:

  • Zbirke podatkov–hitro ustvarjanje agentnih Evals od začetka, ki jih sčasoma razširite z avtomatiziranimi ocenjevalci in človeškimi opombami.
  • Ocenjevanje sledi–izvedba ocenjevanja delovnih tokov agentov od začetla do konca in avtomatiziranje ocenjevanja za natančno prepoznavanje pomanjkljivosti.
  • Avtomatizirana optimizacija pozivov– ustvarite še boljše pozive na podlagi človeških opomb in izhodov ocenjevalnika.
  • Podpora za modele tretjih strank– ocenite modele drugih ponudnikov znotraj platforme OpenAI Evals.

Pri strankah, ki uporabljajo Evals, smo že opazili večjo učinkovitost.

»Platforma za ocenjevanje je skrajšala čas razvoja našega večagentnega okvira skrbnega pregleda za več kot 50% in povečala natančnost agentov za 30%.«
— Carlyle
Vmesnik, ki prikazuje tabelo nabora podatkov s stolpci za oceno, ton, povratne informacije in natančnost. Vrstice prikazujejo vnose z ikonami s palcem navzgor ali negativno kritiko, tonskimi oznakami, kot so Profesionalen, Prijazen, Nesramen in Slab, ter rezultati natančnosti z oznako Uspešen ali Neuspešen z oceno 3,5. Zgornja orodna vrstica vključuje možnosti za nalagati, stolpce, ocenjevanje, ustvariti izhod in shraniti.

Izboljšajte zmogljivost agenta z natančnim procesom prilagajanja

Proces prilagajanja(odpre se v novem oknu) (Reinforcement fine-tuning ali RFT) omogoča razvijalcem prilagajanje naših modelov sklepanja. Na voljo je vsem na OpenAI o4-mini in v zasebni beta različici za GPT‑5. Tesno sodelujemo z več deset strankami, da izpopolnimo RFT za GPT‑5 pred širšo izdajo.

Danes uvajamo dve novi funkciji v tej beta različici RFT, namenjeni še večjemu izboljšanju delovanja agentov:

  • Priklic orodja po meri– usposobite modele, da ob pravem času prikličejo prava orodja za boljše sklepanje 
  • Ocenjevalniki po meri–določite merila za evalvacijo po meri za to, kar je v vašem primeru uporabe najbolj pomembno

Cenik in razpoložljivost

Začenši od danes, sta ChatKit in nove zmožnosti Evals-a na voljo vsem razvijalcem. Agent Builder je na voljo v beta različici, Connector Registry pa bodo počasi začeli uvajati v beta različici nekaterim API, ChatGPT Enterprise in Edu strankam prek storitve Global Admin Console(odpre se v novem oknu) (kjer lahko t.i. Global Ownerji upravljajo domene, SSO in več API organizacij). Konzola Global Admin je predpogoj za omogočanje storitve Connector Registry. Vsa ta orodja so vključena v standardni cenik API modela.

Načrtujemo, da bomo kmalu dodali samostojno API za delovne tokove in možnosti za nameščanje agentov v ChatGPT.

Komaj čakamo na vaše stvaritve.

Avtor

OpenAI