Tänään julkaisemme AgentKitin, täydellisen työkalupaketin kehittäjille ja yrityksille agenttien rakentamiseen, käyttöönottoon ja optimointiin. Tähän asti agenttien rakentaminen on tarkoittanut erillisten työkalujen kanssa jongleeraamista, monimutkaista orkestrointia ilman versiointia, mukautettuja yhdistimiä, manuaalisia arviointiputkia, kehotteiden säätämistä ja viikkojen käyttöliittymätyötä ennen julkaisua. AgentKitin avulla kehittäjät voivat nyt suunnitella työnkulkuja visuaalisesti ja upottaa agenttipohjaisia käyttöliittymiä nopeammin käyttämällä uusia rakennuspalikoita, kuten:
- Agent Builder: visuaalinen canvas usean agentin työnkulkujen luomiseen ja versiointiin
- Yhdistinrekisteri: keskus, jossa pääkäyttäjät voivat hallita, miten data ja työkalut yhdistyvät OpenAI-tuotteiden välillä
- ChatKit: työkalupakki mukautettavien keskustelupohjaisten agenttikokemusten upottamiseen tuotteisiin
Laajennamme myös arviointiominaisuuksia uusilla ominaisuuksilla, kuten tietojoukoilla, jäljityksen luokituksella, automaattisella kehotteiden optimoinnilla ja tukemalla kolmannen osapuolen malleja agenttien suorituskyvyn mittaamiseksi ja parantamiseksi.
Maaliskuussa julkaistun Vastausten API:n ja Agents SDK:n jälkeen olemme nähneet kehittäjien ja yritysten rakentavan kokonaisvaltaisia agenttipohjaisia työnkulkuja syvätutkimukseen, asiakastukeen ja muuhun. Klarna rakensi tukiagentin, joka käsittelee kaksi kolmasosaa kaikista tukipyynnöistä, ja Clay kymmenkertaisti kasvunsa myyntiagentin avulla. AgentKit perustuu Vastausten API:in auttamaan kehittäjiä rakentamaan agentteja tehokkaammin ja luotettavammin.
Agenttien työnkulkujen tullessa monimutkaisemmiksi kehittäjät tarvitsevat selkeämmän näkymän siihen, miten he työskentelevät. Agent Builder(avautuu uudessa ikkunassa) antaa visuaalisen pohjan logiikan luomiseen vetämällä ja pudottamalla solmuja, yhdistämällä työkaluja ja määrittämällä mukautettuja turvatoimia. Se tukee esikatseluajoja, suoritettavien arviointien määritystä ja täyttä versiointia, joka tekee siitä ihanteellisen nopeaan iterointiin.

Rakentajat voivat aloittaa tyhjällä pohjalla tai valmiilla malleilla.
Rampilla tiimi siirtyi tyhjästä pohjasta hankinta-agentiksi vain muutamassa tunnissa:
Agent Builder muutti aiemmin kuukausien monimutkaisen orkestroinnin, mukautetun koodin ja manuaaliset optimoinnit vain muutamaan tuntiin. Visuaalinen pohja pitää tuote-, laki- ja suunnitteluosaamisen samalla sivulla, lyhentää iteraatiovaiheita 70 % ja saa agentin julkaistua kahdessa nopeassa jaksossa kahden vuosineljänneksen sijaan.
Samoin LY Corporation – johtava japanilainen teknologia- ja internetpalveluyritys – rakensi työavustaja-agentin Agent Builderilla alle kahdessa tunnissa.
”Agent Builder mahdollisti agenttien organisoinnin täysin uudella tavalla, kun insinöörit ja asiantuntijat tekivät yhteistyötä yhdessä käyttöliittymässä. Rakensimme ensimmäisen moniagenttisen työnkulkumme ja suoritimme sen alle kahdessa tunnissa, mikä nopeutti huomattavasti agenttien luomis- ja käyttöönottoaikaa.”
Julkaisemme myös yrityksille tarkoitetun yhdistinrekisterin, jolla voidaan hallita ja ylläpitää tietoja useissa työtiloissa ja organisaatioissa. Yhdistinrekisteri(avautuu uudessa ikkunassa) yhdistää tietolähteet yhteen ohjauspaneeliin ChatGPT:n ja API:n välillä. Rekisteri sisältää kaikki valmiiksi rakennetut yhdistimet työkaluihin, kuten Dropbox, Google Drive, SharePoint ja Microsoft Teams, sekä kolmannen osapuolen mallin kontekstiprotokollat.
Kehittäjät voivat myös ottaa käyttöön turvatoimet(avautuu uudessa ikkunassa) Agent Builderissa eli avoimen lähdekoodin modulaarisen turvakerroksen, joka auttaa suojaamaan agentteja tahattomalta tai haitalliselta toiminnalta. Turvatoimet voivat peittää tai merkitä henkilötietoja, havaita jailbreak-ongelmia ja soveltaa muita suojatoimia, mikä helpottaa luotettavien ja turvallisten agenttien rakentamista ja käyttöönottoa. Turvatoimia voi ottaa käyttöön itsenäisesti tai Pythonin(avautuu uudessa ikkunassa) ja JavaScriptin(avautuu uudessa ikkunassa) suojauskirjaston kautta.
Keskustelukäyttöliittymien käyttöönotto agenteille voi olla yllättävän monimutkaista, kun se sisältää suoratoistettavien vastausten käsittelyn, ketjujen hallinnan, mallin ajattelutavan näyttämisen ja mukaansatempaavien keskustelukokemusten suunnittelun. ChatKit tekee keskustelupohjaisten agenttien upottamisesta helppoa, koska ne tuntuvat tuotteeseen luontevilta. Se voidaan upottaa sovelluksiin tai verkkosivustoihin ja mukauttaa teeman tai brändin mukaan.
”Säästimme yli kaksi viikkoa aikaa rakentamalla tukiagentin Canva-kehittäjäyhteisöllemme ChatKitin avulla ja integroimme sen alle tunnissa. Tämä tukiagentti mullistaa kehittäjien tavan käsitellä asiakirjojamme muuttamalla sen keskustelukokemukseksi, mikä helpottaa sovellusten ja integraatioiden rakentamista Canvalla.”
ChatKit tukee jo useita käyttötapauksia sisäisen tiedon avustajista ja perehdytysoppaista asiakastukeen ja tutkimusagentteihin. HubSpotin(avautuu uudessa ikkunassa) asiakaspalveluagentti on yksi esimerkki:

Luotettavien ja tuotantoon valmiiden agenttien rakentaminen vaatii tiukkoja suorituskykyarviointeja. Viime vuonna julkistimme arvioinnit(avautuu uudessa ikkunassa) auttaaksemme kehittäjiä testaamaan kehotteita ja mittaamaan mallin toimintaa. Lisäämme nyt neljä uutta ominaisuutta, jotka helpottavat arviointien suorittamista entisestään:
- Tietojoukot – rakenna agenttien arviointeja nopeasti alusta alkaen ja laajenna niitä ajan myötä automatisoiduilla arvioijilla ja ihmisten tekemillä merkinnöillä.
- Luokitusten seuranta – suorita agenttipohjaisten työnkulkujen kokonaisvaltaisia arviointeja ja automatisoi arviointi puutteiden paikantamiseksi.
- Automaattinen kehotteiden optimointi – luo parannettuja kehotteita ihmisten tekemien merkintöjen ja arvioijien tuotosten perusteella.
- Tuki kolmannen osapuolen malleille – arvioi muiden tarjoajien malleja OpenAI Evals -alustalla.
Olemme jo nähneet merkittäviä parannuksia suorituskykyyn arviointeja käyttävien asiakkaiden keskuudessa.
”Arviointialusta lyhensi moniagenttisen asianmukaisen huolellisuuden viitekehyksen kehitysaikaa yli 50 % ja paransi agenttien tarkkuutta 30 %.”

Vahvistuksen hienosäätö(avautuu uudessa ikkunassa) (Reinforcement fine-tuning, RFT) antaa kehittäjille mahdollisuuden mukauttaa päättelymallejamme. Se on yleisesti saatavilla OpenAI o4-minissä ja yksityisessä beetaversiossa GPT‑5:lle. Teemme tiivistä yhteistyötä kymmenien asiakkaiden kanssa vahvistuksen hienosäädön hiomiseksi GPT‑5:ssä ennen laajempaa julkaisua.
Tänään esittelemme kaksi uutta ominaisuutta vahvistuksen hienosäädön beetaversiossa, jotka on suunniteltu parantamaan agenttien suorituskykyä entisestään:
- Mukautetut työkalukutsut – kouluta malleja kutsumaan oikeita työkaluja oikeaan aikaan paremman päättelykyvyn saavuttamiseksi
- Mukautetut luokittelijat – aseta mukautettuja arviointikriteerejä käyttötapauksesi kannalta tärkeimpien asioiden mukaan
Tästä päivästä alkaen ChatKit ja uudet arviointiominaisuudet ovat yleisesti kaikkien kehittäjien saatavilla. Agent Builder on saatavilla beeta-vaiheessa, ja yhdistinrekisteri aloittaa beeta-julkaisunsa joillekin API-, ChatGPT Enterprise- ja Edu-asiakkaille, joilla on yleinen ylläpitäjän konsoli (jossa globaalit omistajat voivat hallita toimialueita, kertakirjautumista ja useita API-organisaatioita). Yleinen ylläpitäjän konsoli on (avautuu uudessa ikkunassa)edellytys yhdistinrekisterin käyttöönotolle. Kaikki nämä työkalut sisältyvät API-mallin vakiohinnoitteluun.
Aiomme lisätä ChatGPT:hen pian erillisen työnkulkujen rajapinnan ja vaihtoehtoja agenttien käyttöönottoon.
Odotamme innolla nähdäksemme, mitä rakennat.


