I dag lanserer vi AgentKit, et fullstendig sett med verktøy for utviklere og konsern for å bygge, rulle ut og optimalisere agenter. Til nå har bygging av agenter betydd sjonglering av fragmenterte verktøy – kompleks orkestrering uten versjonskontroll, tilpassede koblinger, manuelle evalueringsprosesser, meldingsjustering og ukevis av grensesnittarbeid før lansering. Med AgentKit kan utviklere nå designe arbeidsflyter visuelt og innlemme agentgrensesnitt raskere med nye byggeblokker som:
- Agent Builder: et visuelt lerret for opprettelse og versjonskontroll av arbeidsflyter med flere agenter
- Connector Registry: et sentralt sted der administratorer kan administrere hvordan data og verktøy er tilkoblet mellom OpenAI-produkter
- ChatKit: et verktøysett for innebygging av tilpassbare chatbaserte agentopplevelser i produktet ditt
Vi utvider også evalueringsfunksjonalitet med nye funksjoner som datasett, sporvurdering, automatisert optimalisering av meldinger og støtte for tredjepartsmodeller for å måle og forbedre agentytelse.
Siden lanseringen av Responses API og Agents SDK i mars, har vi sett at utviklere og konsern bygger ende-til-ende-agentarbeidsflyter for grundig research, kundestøtte med mer. Klarna bygde en støtteagent som håndterer to tredjedeler av alle henvendelser, og Clay hadde tidobbel vekst med en salgsagent. AgentKit er basert på Responses API for å hjelpe utviklere med å bygge agenter mer effektivt og pålitelig.
Når agentarbeidsflyter blir mer komplekse, trenger utviklere tydeligere synlighet i hvordan de jobber. Agent Builder(åpnes i et nytt vindu) gir et visuelt lerret for komponering av logikk med dra-og-slipp-noder, tilkoblingsverktøy og konfigurering av tilpasset beskyttelse. Den støtter kjøring av forhåndsvisninger, konfigurering av direkte evaluering og full versjonskontroll – ideelt for rask iterering.

Byggere kan komme i gang med et tomt lerret eller med forhåndsbygde maler.
Hos Ramp gikk teamet fra et tomt lerret til en innkjøpsagent på bare noen få timer:
«Agent Builder transformerte det som tidligere tok flere måneder kompleks instrumentering, egendefinert koding og manuell optimalisering, til bare noen få timer. Det visuelle lerretet holder produkt, juridisk og teknisk arbeid på samme side, reduserer itereringssykluser med 70 % og får en agent aktiv på to sprinter i stedet for to kvartal.»
På lignende måte bygde LY Corporation – en ledende japansk bedrift innen teknologi- og internettjenester – en arbeidsassistent-agent med Agent Builder på mindre enn to timer.
«Med Agent Builder kunne vi instrumentere agenter på en helt ny måte, med ingeniører og fageksperter som samarbeidet på ett grensesnitt. Vi bygde og kjørte den første arbeidsflyten vår med flere agenter på mindre enn to timer, noe som dramatisk akselererte tiden for å opprette og rulle ut agenter.»
Vi lanserer også Connector Registry som lar konsern styre og opprettholde data mellom flere arbeidsområder og organisasjoner. Connector Registry(åpnes i et nytt vindu) forener datakilder til ett administratorpanel for ChatGPT og API-et. Registeret inkluderer alle forhåndsbygde koblinger som Dropbox, Google Disk, Sharepoint og Microsoft Teams samt MCP-er fra tredjeparter.
Utviklere kan også aktivere Guardrails(åpnes i et nytt vindu) i Agent Builder – et modulært sikkerhetslag med åpen kildekode, som bidrar til å beskytte agenter mot utilsiktet eller skadelig atferd. Guardrails kan maskere eller flagge personlig identifiserbar informasjon, oppdage jailbreaking og bruke annen beskyttelse, noe som gjør det enklere å bygge og rulle ut pålitelige og trygge agenter. Guardrails kan rulles ut frittstående eller via beskyttelsesbiblioteket for Python(åpnes i et nytt vindu) og JavaScript(åpnes i et nytt vindu).
Utrulling av chatgrensesnitt for agenter kan være overraskende kompleks – håndtering av strømmesvar, administrering av tråder, visning av modelltenkingen og design av engasjerende opplevelser i chatten. ChatKit gjør det enkelt å innlemme chatbaserte agenter som føles integrert i produktet ditt. Den kan innlemmes i apper eller nettsteder og tilpasses for å passe temaet ditt eller merkevaren din.
«Vi sparte over to uker med tid på å bygge en støtteagent for Canva-utviklerfellesskapet vårt med ChatKit, og vi integrerte det på mindre enn en time. Denne støtteagenten transformerer måten utviklere engasjerer seg i dokumentene våre på ved å gjøre det om til en samtaleopplevelse, noe som gjør det enkelt å bygge apper og integrasjoner på Canva.»
ChatKit driver allerede en rekke bruksområder, fra assistenter for intern kunnskap og introduksjonsveiledninger til kundestøtte og forskningsagenter. HubSpot(åpnes i et nytt vindu)s kundestøtteagent er ett eksempel:

Å bygge pålitelige produksjonsklare agenter krever strenge ytelsesevalueringer. I fjor lanserte vi evalueringer(åpnes i et nytt vindu) for å hjelpe utviklere med å teste meldinger og måle modellatferd. Nå legger vi til fire nye funksjoner som gjør det enda enklere å bygge evalueringer:
- Datasett – bygg agentevalueringer raskt fra bunnen og utvid dem over tid med automatiserte evaluatorer og menneskelig kommentering.
- Sporvurdering – kjør ende-til-ende-vurderinger av agentarbeidsflyter og automatisert vurdering for å finne mangler.
- Automatisert meldingsoptimalisering – generer forbedrede meldinger basert på menneskelige kommentarer og utdata fra evaluatorer.
- Støtte for tredjepartsmodeller – evaluer modeller fra andre leverandører i OpenAIs evalueringsplattform.
Vi har allerede sett stor fremgang innen ytelse fra kunder som bruker evalueringer.
«Evalueringsplattformen reduserte utviklingstid på aktsomhetsrammeverket vårt med flere agenter med mer enn 50 % og økte agentnøyaktighet 30 %.»

Finjustering av forsterkning(åpnes i et nytt vindu) (RFT) lar utviklere tilpasse resonneringsmodellene våre. Det er generelt sett tilgjengelig på OpenAI o4-mini og i privat beta for GPT‑5. Vi jobber tett med titalls kunder for å finjustere RFT for GPT‑5 før videre utgivelse.
I dag introduserer vi to nye funksjoner i RFT-betaen som er designet til å forbedre agentytelse enda mer:
- Egendefinerte verktøykall – lær opp modeller til å kalle riktige verktøy til riktig tid for bedre resonnement
- Egendefinerte evaluatorer – angi egendefinerte evalueringskriterier for det som er viktigst for bruksområdet ditt
Fra i dag er ChatKit og de nye evalueringsfunksjonene generelt tilgjengelig for alle utviklere. Agent Builder er tilgjengelig i beta, og Connector Registry starter betautrullingen sin til noen API-, ChatGPT Enterprise- og Edu-kunder med en global administratorkonsoll (der globale eiere kan administrere domener, SSO og flere API-organisasjoner). Den globale administratorkonsollen er (åpnes i et nytt vindu)en forutsetning for å aktivere Connector Registry. Alle disse verktøyene er inkludert med standard API-modellpriser.
Vi planlegger å legge til et frittstående Workflows API og alternativer for agentutrulling til ChatGPT snart.
Vi gleder oss til å se hva du bygger.


