6. oktober 2025

Vi introduserer AgentKit

Nye verktøy for å bygge, rulle ut og optimalisere agenter

Laster inn …

I dag lanserer vi AgentKit, et fullstendig sett med verktøy for utviklere og konsern for å bygge, rulle ut og optimalisere agenter. Til nå har bygging av agenter betydd sjonglering av fragmenterte verktøy – kompleks orkestrering uten versjonskontroll, tilpassede koblinger, manuelle evalueringsprosesser, meldingsjustering og ukevis av grensesnittarbeid før lansering. Med AgentKit kan utviklere nå designe arbeidsflyter visuelt og innlemme agentgrensesnitt raskere med nye byggeblokker som:

Agent Builder: et visuelt lerret for opprettelse og versjonskontroll av arbeidsflyter med flere agenter
Connector Registry: et sentralt sted der administratorer kan administrere hvordan data og verktøy er tilkoblet mellom OpenAI-produkter
ChatKit: et verktøysett for innebygging av tilpassbare chatbaserte agentopplevelser i produktet ditt

Vi utvider også evalueringsfunksjonalitet med nye funksjoner som datasett, sporvurdering, automatisert optimalisering av meldinger og støtte for tredjepartsmodeller for å måle og forbedre agentytelse.

Siden lanseringen av Responses API og Agents SDK⁠ i mars, har vi sett at utviklere og konsern bygger ende-til-ende-agentarbeidsflyter for grundig research, kundestøtte med mer. Klarna bygde en støtteagent⁠ som håndterer to tredjedeler av alle henvendelser, og Clay hadde tidobbel vekst⁠ med en salgsagent. AgentKit er basert på Responses API for å hjelpe utviklere med å bygge agenter mer effektivt og pålitelig.

Designe arbeidsflyter med Agent Builder

Når agentarbeidsflyter blir mer komplekse, trenger utviklere tydeligere synlighet i hvordan de jobber. Agent Builder⁠(åpnes i et nytt vindu) gir et visuelt lerret for komponering av logikk med dra-og-slipp-noder, tilkoblingsverktøy og konfigurering av tilpasset beskyttelse. Den støtter kjøring av forhåndsvisninger, konfigurering av direkte evaluering og full versjonskontroll – ideelt for rask iterering.

Grensesnittvisning av en automatiseringsflyt for kundetjeneste i et visuelt byggeverktøy. Lerretet viser tilkoblede noder merket Start, Beskyttelse mot jailbreaking, Klassifiseringsagent, If/else, Returagent, Oppbevaringsagent, Informasjonsagent, Beskyttelse mot hallusinering og Avslutt. Et sidefelt til venstre lister opp tilgjengelige nodetyper som Agent, Notat, Filsøk, Beskyttelse, MCV og Brukergodkjennelse. Kontroller øverst inkluderer alternativer for Evaluer, Kode, Forhåndsvisning og Publiser.

Byggere kan komme i gang med et tomt lerret eller med forhåndsbygde maler.

Hos Ramp gikk teamet fra et tomt lerret til en innkjøpsagent på bare noen få timer:

«Agent Builder transformerte det som tidligere tok flere måneder kompleks instrumentering, egendefinert koding og manuell optimalisering, til bare noen få timer. Det visuelle lerretet holder produkt, juridisk og teknisk arbeid på samme side, reduserer itereringssykluser med 70 % og får en agent aktiv på to sprinter i stedet for to kvartal.»

– Ramp

På lignende måte bygde LY Corporation – en ledende japansk bedrift innen teknologi- og internettjenester – en arbeidsassistent-agent med Agent Builder på mindre enn to timer.

«Med Agent Builder kunne vi instrumentere agenter på en helt ny måte, med ingeniører og fageksperter som samarbeidet på ett grensesnitt. Vi bygde og kjørte den første arbeidsflyten vår med flere agenter på mindre enn to timer, noe som dramatisk akselererte tiden for å opprette og rulle ut agenter.»

– LY Corporation

Vi lanserer også Connector Registry som lar konsern styre og opprettholde data mellom flere arbeidsområder og organisasjoner. Connector Registry⁠(åpnes i et nytt vindu) forener datakilder til ett administratorpanel for ChatGPT og API-et. Registeret inkluderer alle forhåndsbygde koblinger som Dropbox, Google Disk, Sharepoint og Microsoft Teams samt MCP-er fra tredjeparter.

Utviklere kan også aktivere Guardrails⁠(åpnes i et nytt vindu) i Agent Builder – et modulært sikkerhetslag med åpen kildekode, som bidrar til å beskytte agenter mot utilsiktet eller skadelig atferd. Guardrails kan maskere eller flagge personlig identifiserbar informasjon, oppdage jailbreaking og bruke annen beskyttelse, noe som gjør det enklere å bygge og rulle ut pålitelige og trygge agenter. Guardrails kan rulles ut frittstående eller via beskyttelsesbiblioteket for Python⁠(åpnes i et nytt vindu) og JavaScript⁠(åpnes i et nytt vindu).

Innlem agentchatopplevelser med ChatKit

Utrulling av chatgrensesnitt for agenter kan være overraskende kompleks – håndtering av strømmesvar, administrering av tråder, visning av modelltenkingen og design av engasjerende opplevelser i chatten. ChatKit gjør det enkelt å innlemme chatbaserte agenter som føles integrert i produktet ditt. Den kan innlemmes i apper eller nettsteder og tilpasses for å passe temaet ditt eller merkevaren din.

«Vi sparte over to uker med tid på å bygge en støtteagent for Canva-utviklerfellesskapet vårt med ChatKit, og vi integrerte det på mindre enn en time. Denne støtteagenten transformerer måten utviklere engasjerer seg i dokumentene våre på ved å gjøre det om til en samtaleopplevelse, noe som gjør det enkelt å bygge apper og integrasjoner på Canva.»

– Canva

ChatKit driver allerede en rekke bruksområder, fra assistenter for intern kunnskap og introduksjonsveiledninger til kundestøtte og forskningsagenter. HubSpot⁠(åpnes i et nytt vindu)s kundestøtteagent er ett eksempel:

Visning av instrumentpanel av Ramp-plattformen viser et grensesnitt for utgiftsadministrering. Hovedpanelet hilser på brukeren, Daniel, og lister opp forespørsler som «Forespørsel for ChatGPT Business» (venter på gjennomgang) og «Forespørsel for HubSpot» (utkast), sammen med nylige utgifter for flyreise, bildeling og programvare. Til høyre er et skjema for programvareforespørsel åpent for ChatGPT Business med 5 plasser til 125 USD per måned fra 1. oktober 2025 til 1. oktober 2026, med en gul «Send inn forespørsel»-knapp.

Mål agentytelse med nye evalueringsfunksjonaliteter

Å bygge pålitelige produksjonsklare agenter krever strenge ytelsesevalueringer. I fjor lanserte vi evalueringer⁠(åpnes i et nytt vindu) for å hjelpe utviklere med å teste meldinger og måle modellatferd. Nå legger vi til fire nye funksjoner som gjør det enda enklere å bygge evalueringer:

Datasett – bygg agentevalueringer raskt fra bunnen og utvid dem over tid med automatiserte evaluatorer og menneskelig kommentering.
Sporvurdering – kjør ende-til-ende-vurderinger av agentarbeidsflyter og automatisert vurdering for å finne mangler.
Automatisert meldingsoptimalisering – generer forbedrede meldinger basert på menneskelige kommentarer og utdata fra evaluatorer.
Støtte for tredjepartsmodeller – evaluer modeller fra andre leverandører i OpenAIs evalueringsplattform.

Vi har allerede sett stor fremgang innen ytelse fra kunder som bruker evalueringer.

«Evalueringsplattformen reduserte utviklingstid på aktsomhetsrammeverket vårt med flere agenter med mer enn 50 % og økte agentnøyaktighet 30 %.»

– Carlyle

Grensesnitt som viser en datasettabell med kolonner for Vurdering, Tone, Tilbakemelding og Nøyaktighet. Rader viser oppføringer med tommelen opp- eller tommelen ned-ikoner, tonetagger som Profesjonell, Vennlig, Uhøflig og Dårlig, og nøyaktighetsresultater merket Bestått eller Ikke bestått med en poengsum på 3,5. Den øverste verktøylinjen inkluderer alternativer for Last opp, Kolonner, Vurdering, Generer utdata og Lagre.

Forbedre agentytelse med finjustering av forsterkning

Finjustering av forsterkning⁠(åpnes i et nytt vindu) (RFT) lar utviklere tilpasse resonneringsmodellene våre. Det er generelt sett tilgjengelig på OpenAI o4-mini og i privat beta for GPT‑5. Vi jobber tett med titalls kunder for å finjustere RFT for GPT‑5 før videre utgivelse.

I dag introduserer vi to nye funksjoner i RFT-betaen som er designet til å forbedre agentytelse enda mer:

Egendefinerte verktøykall – lær opp modeller til å kalle riktige verktøy til riktig tid for bedre resonnement
Egendefinerte evaluatorer – angi egendefinerte evalueringskriterier for det som er viktigst for bruksområdet ditt

Priser og tilgjengelighet

Fra i dag er ChatKit og de nye evalueringsfunksjonene generelt tilgjengelig for alle utviklere. Agent Builder er tilgjengelig i beta, og Connector Registry starter betautrullingen sin til noen API-, ChatGPT Enterprise- og Edu-kunder med en global administratorkonsoll (der globale eiere kan administrere domener, SSO og flere API-organisasjoner). Den globale administratorkonsollen er ⁠(åpnes i et nytt vindu)en forutsetning for å aktivere Connector Registry. Alle disse verktøyene er inkludert med standard API-modellpriser.

Vi planlegger å legge til et frittstående Workflows API og alternativer for agentutrulling til ChatGPT snart.

Vi gleder oss til å se hva du bygger.

Forfatter

OpenAI

Les videre

Se alle

Flytt grensen for pris og ytelse med GPT-5.6

Produkt30. juli 2026

Health lanseres i ChatGPT

Produkt23. juli 2026

Vi lanserer OpenAI Presence

Produkt22. juli 2026