Ugrás a fő tartalomra
OpenAI

2025. október 6.

Termék

Bemutatkozik az AgentKit

Új eszközök ügynökök létrehozásához, telepítéséhez és optimalizálásához.

Betöltés…

Ma útjára lindítjuk az AgentKitet, egy teljes eszközkészletet fejlesztők és vállalatok számára az ügynökök létrehozására, telepítésére és optimalizálására. Eddig az ügynökök építése töredezett eszközök zsonglőrködését jelentette—komplex szervezést verziókezelés nélkül, egyedi csatlakozók, kézi értékelési csővezetékek, utasítás hangolás és hetekig tartó frontend munka által az indulás előtt. Az AgentKit segítségével a fejlesztők mostantól vizuálisan tervezhetnek munkafolyamatokat, és gyorsabban ágyazhatnak be ügynöki felhasználói felületeket az olyan új építőelemekkel, mint például:

  • Agent Builder: vizuális canvas több ügynök munkafolyamatainak létrehozásához és verziózásához
  • Connector Registry: központi hely az adminok számára, ahol az adatok és eszközök csatlakoznak az OpenAI termékek között
  • ChatKit: eszközkészlet testreszabható csevegés-alapú ügynöki élmények beágyazásához a termékedbe

Az értékelési képességeket új funkciókkal is bővítjük, mint például az adatkészletek, a nyomkövetési osztályozás, az automatizált utasításoptimalizálás és a harmadik fél modelltámogatása az ügynök teljesítményének mérésére és javítására.

A Responses API és az Agents SDK márciusi kiadása óta azt láttuk, hogy a fejlesztők és a vállalatok végpontok közötti ügynöki munkafolyamatokat építenek mélyreható kutatás, ügyfélszolgálat stb. céljából. A Klarna létrehozott egy ügyfélszolgálati ügynököt, amely az összes jegy kétharmadát kezeli, és a Clay tízszeresére növelte a növekedést egy értékesítési ügynök segítségével. Az AgentKit alapja a Responses API, hogy segítse a fejlesztőket az ügynökök hatékonyabb és megbízhatóbb létrehozásában.

Munkafolyamatok tervezése az Agent Builder segítségével

Ahogy az ügynökök munkafolyamatai egyre bonyolultabbá válnak, a fejlesztőknek egyértelműbb rálátásra van szükségük arra, hogyan is működnek. Az Agent Builder(új ablakban nyílik meg) vizuális canvas-t biztosít a logika összeállításához húzással és ejtéssel elhelyezhető csomópontokkal, eszközök csatlakoztatásával és egyéni védőkorlátok konfigurálásával. Támogatást nyújt előnézet futtatásokhoz, beágyazott eval konfigurációt és teljes verziókezelést – ideális a gyors iterációhoz.

Egy ügyfélszolgálati automatizálási folyamat felületének nézete egy vizuális builder eszközben. A canvas a Start, Jailbreak guardrail, Classification ügynök, If/else, Return ügynök, Retention ügynök, Information ügynök, Hallucination guardrail és End feliratú összekapcsolt csomópontokat mutatja. A bal oldali oldalsáv felsorolja az elérhető csomóponttípusokat, mint például az ügynök, a megjegyzés, a fájlkeresés, a védősínek, az MCP és a felhasználói jóváhagyás. A felső vezérlők tartalmazzák az Értékelés, Kód, Előnézet és Közzététel opciókat.

A készítők egy üres canvas-szal vagy előre elkészített sablonokkal kezdhetnek.

A Rampnél a csapat néhány órán belül a teljesen üres tervtől egy működő „buyer agentig” jutott el

Az Agent Builder néhány óra alatt átalakította azt, ami korábban hónapokig tartott a bonyolult szervezés, egyedi kód és kézi optimalizálás során. A vizuális canvas összhangban tartja a termék-, jogi és mérnöki csapatokat, 70%-kal csökkenti az iterációs ciklusokat, és két negyedév helyett két sprint alatt élesít egy ügynököt.
— Ramp

Hasonlóképpen, a LY Corporation—egy vezető japán technológiai és internetes szolgáltató vállalat—kevesebb mint két óra alatt épített egy munkaasszisztens ügynököt az Agent Builder által.

„Az Agent Builder lehetővé tette számunkra, hogy teljesen új módon szervezzük az ügynököket, a mérnökök és a szakértők egy felületen működjenek együtt. Elkészítettük az első többügynökös munkafolyamatunkat, és kevesebb mint két óra alatt lefuttattuk, drámaian felgyorsítva az ügynökök létrehozásának és telepítésének idejét."
— LY Corporation

Emellett elindítunk egy Connecto Registry nyilvántartást a vállalatok számára, hogy több munkaterületen és szervezeten keresztül tudják szabályozni és karbantartani az adatokat. A Connector Registry(új ablakban nyílik meg) egyetlen adminisztrációs panelbe egyesíti az adatforrásokat a ChatGPT és az API számára. A nyilvántartás tartalmazza az összes előre beépített csatlakozót, mint például a Dropbox, a Google Drive, a Sharepoint és a Microsoft Teams, valamint a harmadik fél MCP-k.

A fejlesztők az Agent Builderben(új ablakban nyílik meg) is engedélyezhetik a Guardrails réteget—egy nyílt forráskódú, moduláris biztonsági réteget, amely segít megvédeni az ügynököket a nem szándékos vagy rosszindulatú viselkedéstől. A Guardrails képes elfedni vagy megjelölni a személyes azonosító információkat (PII), felismerni a jailbreakeket, és egyéb védelmi intézkedéseket alkalmazni, megkönnyítve a megbízható, biztonságos ügynökök létrehozását és telepítését. A Guardrails önállóan vagy a Python(új ablakban nyílik meg) és JavaScript(új ablakban nyílik meg) számára készült Guardrails könyvtáron keresztül telepíthető.

Ügynöki csevegési élmények beágyazása a ChatKit segítségével

Az ügynökök számára készült csevegési felhasználói felületek telepítése meglepően összetett lehet—a streaming válaszok kezelése, a témaszálak kezelése, a modell gondolkodásának bemutatása és vonzó csevegési élmények tervezése. ChatKit(új ablakban nyílik meg) egyszerűvé teszi a csevegésalapú ügynökök beágyazását, amelyek natívnak érződnek a termékedben. Beágyazható appokba vagy weboldalakba, és testreszabható, hogy illeszkedjen a témádhoz vagy márkádhoz.

„Több mint két hetet mentettünk azzal, hogy a ChatKit segítségével építettünk egy ügyfélszolgálati ügynököt a Canva Fejlesztők közösségének, és kevesebb mint egy óra alatt integráltuk. Ez az ügyfélszolgálati ügynök átalakítja a fejlesztők dokumentumokkal való interakcióját, beszélgetési élménnyé téve azt, megkönnyítve az appok és integrációk létrehozását a Canva platformon.”
— Canva

A ChatKit már számos felhasználási esetet támogat, az Internal Knowledge asszisztensektől és bevezetés útmutatóktól kezdve az ügyfélszolgálati és kutatási ügynökökig. HubSpot(új ablakban nyílik meg)ügyfélszolgálati ügynöke jó példa erre:

A Ramp platform irányítópult nézete, amely egy költségkezelési felületet mutat. A főpanel üdvözli a felhasználót, Danielt, és felsorolja az olyan kéréseket, mint a „Request for ChatGPT Business” (felülvizsgálat alatt) és a „Request for HubSpot” (vázlat), valamint a légitársaságok, a fuvarmegosztó szolgáltatások és a szoftverek legutóbbi költségeit. A jobb oldalon egy szoftverigénylő űrlap nyitva van a ChatGPT Business számára, amely 5 helyet mutat havi 125 dollárért 2025. október 1-jétől 2026. október 1-jéig, sárga „Beküldés” gombbal.

Mérd meg az ügynök teljesítményét az új Evals képességekkel

A megbízható, gyártásra kész ügynökök létrehozása szigorú teljesítményértékeléseket igényel. Tavaly indítottuk el az Evals(új ablakban nyílik meg) megoldást, hogy segítsünk a fejlesztőknek tesztelni az utasításokat és mérni a modellek viselkedését. Most négy új funkciót adunk hozzá, amelyek még könnyebbé teszik az evals építését:

  • Adathalmazok–építs gyorsan ügynökértékeléseket a semmiből, és idővel bővítsd őket automatikus osztályozókkal és emberi megjegyzésekkel.
  • Nyomkövetési osztályozás–futtass végponttól végpontig tartó értékeléseket az ügynöki munkafolyamatokról, és automatizáld az osztályozást a hiányosságok pontos meghatározása érdekében.
  • Automatizált utasításoptimalizálás–generálj továbbfejlesztett utasításokat emberi megjegyzések és értékelő kimenetek alapján.
  • Harmadik fél modellek támogatása–értékeld más szolgáltatók modelljeit az OpenAI Evals platformon belül.

Már jelentős teljesítménynövekedést tapasztaltunk az Evals-t használó ügyfeleinktől.

„Az értékelő platform több mint 50%-kal csökkentette a több ügynökből álló átvilágítási keretrendszerünk fejlesztési idejét, és 30%-kal növelte az ügynökök pontosságát.”
— Carlyle
Egy adathalmaz táblázatot megjelenítő felület, amely az Értékelés, a Hangulat, a Visszajelzés és a Pontosság oszlopokat tartalmazza. A sorok felfelé mutató hüvelykujj vagy nem tetszik ikonokkal, hangnem címkékkel, mint például Professzionális, Barátságos, Udvariatlan és Rossz, valamint 3,5 pontszámmal rendelkező Sikeres vagy Sikertelen címkével ellátott pontossági eredményeket jelenítenek meg. A felső eszköztár tartalmazza a feltölt, oszlopok, osztályozás, generálás kimenet és ment opciókat.

Push ügynök teljesítményének finomhangolásával történő megerősítés

A megerősítéses finomhangolás(új ablakban nyílik meg) (RFT) lehetővé teszi a fejlesztőknek, hogy testre szabják az érvelési modelljeinket. Általánosan elérhető az OpenAI o4-mini rendszeren és a GPT‑5 privát bétában. Szorosan együttműködünk több tucat ügyféllel, hogy a GPT‑5 RFT-et finomítsuk a szélesebb körű megjelenés előtt.

Ma két új funkciót mutatunk be az RFT bétában, amelyek célja, hogy még tovább növeljék az ügynökök teljesítményét:

  • Egyéni eszközhívások–taníts be modelleket a megfelelő eszközök megfelelő időben történő hívására a jobb érvelés érdekében 
  • Egyéni osztályozók–állíts be egyéni értékelési kritériumokat, a számodra legfontosabbhoz

Árképzés és elérhetőség

Mától a ChatKit és az új Evals funkciók általánosan elérhetők minden fejlesztő számára. Az Agent Builder bétaverzióban érhető el, és a Connector Registry megkezdi a bétaverzió bevezetését néhány API, ChatGPT Enterprise és Edu ügyfél számára egy Global Admin Console(új ablakban nyílik meg) (ahol a globális tulajdonosok kezelhetik a domaineket, az egyszeri bejelentkezést és több API-szervezetet). A Global Admin konzol a Connector Registry engedélyezésének előfeltétele. Mindezeket az eszközöket a standard API modell árképzése magában foglalja.

Tervezzük, hogy hamarosan önálló Workflows API-t és ügynöktelepítési lehetőségeket adunk hozzá a ChatGPT‑hez.

Alig várjuk, hogy lássuk, mit építesz.

Szerző

OpenAI