Idag lanserar vi AgentKit, en komplett uppsättning verktyg för utvecklare och företag, för att skapa, driftsätta och optimera agenter. Hittills har man behövt använda fragmenterade verktyg fram och tillbaka för att skapa agenter, komplex instrumentering utan versionshantering, anpassade anslutningar, manuella Eval-förbindelser, prompt-justering och flera veckors frontend-arbete före lanseringen. Med AgentKit kan utvecklare nu utforma arbetsflöden visuellt och snabbare bädda in agentiska användargränssnitt med nya byggnadsblock som t.ex.:
- Agent Builder: en visuell kanvas för att skapa och versionshantera arbetsflöden med flera agenter
- Connector Registry: en central plats för administratörer att hantera hur data och verktyg sammanlänkar över olika OpenAI-produkter
- ChatKit: en verktygslåda för att bädda in anpassningsbara chatt-baserade agentupplevelser i er produkt
Vi utökar även utvärderingsförmågan med nya funktioner såsom datamängder, spårgradering, automatiserad prompt-optimering och tredje partens modell-support för att mäta och förbättra agentprestandan.
Efter lanseringen av Responses API och Agents SDK i mars har vi sett utvecklare och företag skapa agentiska arbetsflöden från början till slut till djup research, kundtjänst med mera. Klarna skapade en supportagent som hanterar två tredjedelar av alla förfrågningar och Clay tiodubblade sin tillväxt med en försäljningsagent. AgentKit bygger på Responses API för att hjälpa utvecklare att skapa agenter mer effektivt och tillförlitligt.
Allt eftersom agentarbetsflöden blir mer komplexa behöver utvecklare tydligare insyn i hur de fungerar. Agent Builder(öppnas i ett nytt fönster)har en visuell kanvas där man kan skapa logik med drag-och-släpp-noder, ansluta verktyg och konfigurera anpassade skyddsräcken. Den stödjer förhandsgranskningskörningar, integrerad Eval-konfiguration och komplett versionshantering, idealt för snabb iteration.

Konstruktörer kan komma igång med en blank kanvas eller förbyggda mallar.
På Ramp tog sig teamet från att ha en blank kanvas till en upphandlingsagent på bara några timmar:
Agent Builder har förvandlat det som en gång tog månader av komplex orkestrering, anpassad kod och manuell optimering till bara några timmar. Den visuella canvasen behåller produkten, det juridiska och tekniken på samma sida, vilket minskar iterationscyklerna med 70 % och får en agent live på två spurter snarare en två kvartal.
På liknande sätt skapade LY Corporation, ett ledande japanskt företag inom teknik och internettjänster, en arbetsassistent-agent med Agent Builder på mindre än två timmar.
"Agent Builder gjorde att vi kunde orkestrera agenter på ett helt nytt sätt, där ingenjörerna och ämnesexperterna samarbetar på ett och samma gränssnitt. Vi skapade vårt första multi-agentiska arbetsflöde och körde det på mindre än två timmar. Vi påskyndade dramatiskt hur fort vi kunde skapa och driftsätta agenterna.”
Vi lanserar även ett Anslutningsregister för företag att styra och upprätthålla data över flera arbetsytor och organisationer. Anslutningsregistret(öppnas i ett nytt fönster) sammanlänkar datakällor till en enda adminpanel över ChatGPT och API:et. Registret inkluderar alla förbyggda anslutningar, som t.ex. Google Drive, Sharepoint och Microsoft Teams, samt tredje partens MCP:er.
Utvecklare kan också aktivera skyddsräcken(öppnas i ett nytt fönster) i Agent Builder, ett modulärt säkerhetslager med öppen källa som hjälper att skydda agenter mot oavsiktliga eller uppsåtliga handlingar. Skyddsräcken kan maskera eller flagga PII, upptäcka jailbreaks och tillämpa andra skyddsräcken, vilket gör det lättare att skapa och driftsätta tillförlitliga, säkra agenter. Skyddsräcken kan driftsättas enskilt eller via biblioteket för skyddsräcken för Python(öppnas i ett nytt fönster) och JavaScript(öppnas i ett nytt fönster).
Det kan vara förvånansvärt komplicerat att driftsätta chatt-användargränssnitt för agenter. Man ska hantera inkommande svar, trådar, visa hur modellen tänker och utforma engagerande upplevelser i chatten. ChatKit gör det enkelt att bädda in chattbaserade agenter som känns nativa till er produkt. Det kan bäddas in i appar eller webbplatser och anpassas för att matcha ert tema eller varumärke.
"Vi sparade mer än två veckors tid på att bygga en supportagent till vårt community för Canva-utvecklare med ChatKit och integrerade den på mindre än en timme. Den här supportagenten kommer att förvandla sättet på vilket utvecklare interagerar med våra dokument genom att göra det till en samtalsupplevelse, så att det blir lätt att skapa appar och integrationer på Canva.”
ChatKit driver redan många olika användarfall, från interna kunskapsassistenter och onboarding-guider till kundtjänst och research-agenter. HubSpot(öppnas i ett nytt fönster):s kundtjänstagent är ett exempel:

Det krävs rigorösa prestandautvärderingar för att skapa tillförlitliga produktionsredo agenter. Förra året lanserade vi Evals(öppnas i ett nytt fönster) för att hjälpa utvecklare att testa prompter och mäta modellbeteende. Nu har vi lagt till fyra nya funktioner som gör det ännu lättare att skapa evals:
- Datamängder - som snabbt skapar agent-evals från grunden och utvecklar dem över tid med automatiserade betygsättare och mänskliga kommentarer.
- Spårutvärdering - kör bedömningar från början till slut på agentiska arbetsflöden och automatisera betygsättning för att markera brister.
- Automatiserad promptoptimering - generera förbättrade prompter baserat på mänskliga kommentarer och data för betygssättare.
- Tredje partens modellsupport - utvärdera modeller från andra leverantörer inom OpenAI:s Evals-plattform.
Vi har redan sett större prestandaförbättringar från kunder som använder Evals.
”Utvärderingsplattformen minskade utvecklingstiden för vårt multiagent due diligence-ramverk med mer än 50 % och förbättrade agent-noggrannheten med 30 %.”

Förstärkt finjustering(öppnas i ett nytt fönster) (RFT) låter utvecklare anpassa våra resonemangsmodeller. Det finns allmänt tillgängligt på OpenAI o4-mini och på privat beta för GPT‑5. Vi samarbetar med dussintals kunder för att finjustera RFT för GPT‑5 innan den släpps i större skala.
Idag presenterar vi två nya funktioner där RFT betaversionen har utformats till att framdriva agentprestandan ännu mer:
- Anpassade verktygsanrop - träna modeller till att anropa de rätta verktygen vid rätt tillfälle för bättre resonemang
- Anpassade graderare - ange anpassade utvärderingskriterier för vad som är viktigast i ert användningsfall
Från och med idag är ChatKit och de nya Evals-funktionerna allmänt tillgängliga för alla utvecklare. Agent Builder är tillgänglig i beta och Connector Registry påbörjar sin beta-utgåva till vissa API-, ChatGPT Enterprise- och Edu-kunder som har en Global Admin Console (där Global-ägare kan hantera domäner, SSO, flera olika API-org). Global Admin Console (öppnas i ett nytt fönster)krävs för att aktivera Anslutningsregistret. Alla dessa verktyg inkluderas med standardpriserna för AP-modeller.
Vi planerar att tillägga enskilda arbetsflödes-API:er och alternativ för agentdriftssättning i ChatGPT snarast.
Vi ser fram emot att få se vad du skapar.


