Täna anname välja AgentKit'i, täieliku tööriistakomplekti arendajatele ja ettevõtetele agentide loomiseks, juurutamiseks ja optimeerimiseks. Siiani tähendas agentide loomine killustatud tööriistadega žongleerimist – keeruline orkestreerimine ilma versioonihalduseta, kohandatud ühendused, manuaalsed eval-protsessid, viipade häälestamine ja nädalaid kestnud frontenditöö enne käivitamist. AgentKitiga saavad arendajad nüüd visuaalselt kujundada töövooge ja kiiremini integreerida agentide kasutajaliideseid, kasutades uusi ehitusplokke nagu:
- Agendi ehitaja: visuaalne canvas mitme agendi töövoogude loomiseks ja versioonimiseks
- Ühendaja register: keskne koht, kus administraatorid saavad hallata, kuidas andmed ja tööriistad üksteisega OpenAI toodete vahel ühendada.
- ChatKit: tööriistakomplekt kohandatavate vestluspõhiste agentide kogemuste integreerimiseks sinu tootesse
Samuti laiendame hindamisvõimalusi uute funktsioonidega, nagu andmekogumid, jälgede hindamine, automaatne viipade optimeerimine ja kolmanda osapoole mudelite tugi, et mõõta ja parandada agentide jõudlust.
Alates Responses API ja Agents SDK väljaandmisest märtsis oleme näinud, kuidas arendajad ja ettevõtted loovad põhjalike teadusuuringute, klienditugi ja muu jaoks terviklikke agentide töövooge. Klarna lõi tugiteenuse agendi, mis tegeleb kahe kolmandikuga kõigist piletitest, ja Clay kümnekordistas kasvu müügiagendi abil. AgentKit tugineb Responses API-le, et aidata arendajatel agente tõhusamalt ja usaldusväärsemalt ehitada.
Kuna agentide töövood muutuvad keerukamaks, vajavad arendajad selgemat ülevaadet nende toimimisest. Agendi ehitaja(avaneb uues aknas) pakub visuaalset canvas'i loogika koostamiseks lohistatavate sõlmpunktidega, tööriistade ühendamiseks ja kohandatud kaitsepiirete seadistamiseks. See toetab eelvaate käitamisi, tekstisisest eval-konfiguratsiooni ja täielikku versioonimist – ideaalne kiireks iteratsiooniks.

Ehitajad saavad alustada tühja canvasega või eelnevalt koostatud mallidega.
Rampis läks meeskond üle vaid mõne tunniga tühjast canvasest ostja agentiks:
Agendi ehitaja muutis selle, milleks varem kulus mitu kuud keerulist orkestreerimist, kohandatud koodi ja manuaalset optimeerimist, vaid mõne tunniga. Visuaalne canvas hoiab toote-, juriidilise ja insenerimeeskonna ühel lehel, vähendades iteratsioonitsükleid 70% võrra ja viies agendi kahe sprindi jooksul ellu, mitte kahe kvartaliga.
samamoodi ehitas Jaapani juhtiv tehnoloogia- ja internetiteenuste ettevõte LY Corporation vähem kui kahe tunniga Agent Ehitajaga tööassistendi agenti.
„Agendi ehitaja võimaldas meil agente orkestreerida täiesti uuel viisil, kus insenerid ja valdkonna eksperdid tegid koostööd ühes liideses. Ehitasime oma esimese multiagentse töövoo ja käivitasime selle vähem kui kahe tunniga, kiirendades dramaatiliselt agentide luua ja juurutamise aega“.
Samuti käivitame ettevõtete jaoks ühendajate registri, et hallata ja säilitada andmeid mitmes tööjaamas ja organisatsioonis. Ühendajate register(avaneb uues aknas) koondab andmeallikad ühte halduspaneelisse ChatGPT ja API jaoks. Register sisaldab kõiki eelehitatud konnektoreid, nagu Dropbox, Google Drive, Sharepoint ja Microsoft Teams, samuti kolmandate osapoolte MCP-sid.
Arendajad saavad ka Guardrails(avaneb uues aknas) agendi ehitajas lubada – avatud lähtekoodiga, modulaarne turvakiht, mis aitab kaitsta agente tahtmatu või pahatahtliku käitumise eest. Guardrails võib maskeerida või märgistada PII-d, tuvastada jailbreak'e ja rakendada muid kaitsemeetmeid, mis muudab usaldusväärsete ja turvaliste agentide loomise ja kasutuselevõtu lihtsamaks. Kaitsepiirdeid saab juurutada eraldiseisvana või Pythoni(avaneb uues aknas) ja JavaScripti(avaneb uues aknas) teegi kaudu.
Vestlusliideste juurutamine agentidele võib olla üllatavalt keeruline – voogedastuse vastuste käsitlemine, lõimede haldamine, mudeli mõtlemise kuvamine ja kaasahaaravate vestluskogemuste loomine. ChatKit(avaneb uues aknas) muudab vestluspõhiste agentide manustamise lihtsaks, mis tunduvad su tootele omased. Seda saab integreerida rakendustesse või veebisaitidesse ja kohandada vastavalt su teemale või brändile.
„Säästsime üle kahe nädala aega meie Canva arendajate kogukonna tugiagendi loomisel ChatKiti abil ja integreerisime selle vähem kui tunniga. See tugi agent muudab arendajate suhtlemist meie dokumentatsiooniga, muutes selle vestluskogemuseks ja lihtsustades rakenduste ja integratsioonide loomist Canval.
ChatKit pakub juba mitmesuguseid kasutusjuhtumeid, alates Internal Knowledge assistentide ja alustamise juhenditest kuni klienditugi ja uurimisagentideni. HubSpot(avaneb uues aknas)klienditugi agent on üks näide:

Usaldusväärsete, tootmiskõlblike agentide loomine nõuab rangeid tulemuslikkuse hindamisi. Eelmisel aastal käivitasime Evals(avaneb uues aknas), et aidata arendajatel testida viipide ja mõõta mudelite käitumist. Lisame nüüd neli uut funktsiooni, mis muudavad evalide loomise veelgi lihtsamaks:
- Andmekogumid– kiiresti luua agentide hindamisi nullist ja neid aja jooksul laiendada automatiseeritud hindajate ja inimeste märkustega.
- Jälgimishindamine– teosta agentide töövoogude otsast lõpuni hindamisi ja automatiseeri hindamist puuduste kindlakstegemiseks.
- Automaatne viipade optimeerimine–koosta täiustatud viipeid inimeste märkuste ja hindaja väljundite põhjal.
- Kolmandate osapoolte mudelite tugi – hinda teiste pakkujate mudeleid OpenAI Evals platvormi raames.
Oleme juba näinud Evalsi kasutavate klientide puhul suurt jõudluse kasvu.
"Hindamisplatvorm vähendas meie mitmeagendi hoolsusraamistiku arendusaega üle 50% ja suurendas agentide täpsust 30%."

Tugevdamise peenhäälestamine(avaneb uues aknas) (RFT) võimaldab arendajatel meie arutlusmudeleid kohandada. See on üldiselt kättesaadav OpenAI o4-mini ja eraviisilises beetas GPT‑5 jaoks. Me teeme tihedat koostööd kümnete klientidega, et täiustada RFT-d GPT‑5 jaoks enne laiemat kasutuselevõttu.
Täna tutvustame RFT beeta versioonis kahte uut funktsiooni, mis on loodud agentide jõudluse veelgi tõstmiseks:
- Kohandatud tööriistakutsed– koolita mudeleid kutsuma õigeid tööriistu õigel ajal, et paremini arutleda.
- Kohandatud hindajad – määrakohandatud hindamiskriteeriumid selle jaoks, mis on teie kasutusjuhtumi puhul kõige olulisem
Alates tänasest on ChatKit ja uued Evals'i võimalused üldiselt kättesaadavad kõigile arendajatele. Agent Builder on saadaval beeta versioonis ja Connector Registry alustab beeta versiooni juurutamist mõnedele API, ChatGPT Enterprise'i ja Edu klientidele, kellel on Globaalne Administraatori Konsool(avaneb uues aknas) (kus globaalsed omanikud saavad hallata domeene, SSO-d ja mitut API-organisatsiooni). Connector Registry aktiveerimise eeltingimus on Global Admin konsool. Kõik need tööriistad on kaasatud standardse API mudeli hinnastamisse.
Plaanime peagi lisada ChatGPT‑le eraldiseisva Workflows API ja agendi juurutamise võimalused.
Me ei jõua ära oodata, mida sa ehitad.


