Gå direkt till huvudinnehåll
OpenAI

6 oktober 2025

Produkt

Vi presenterar AgentKit

Nya verktyg för att skapa, driftsätta och optimera agenter.

Laddar …

Idag lanserar vi AgentKit, en komplett uppsättning verktyg för utvecklare och företag, för att skapa, driftsätta och optimera agenter. Hittills har man behövt använda fragmenterade verktyg fram och tillbaka för att skapa agenter, komplex instrumentering utan versionshantering, anpassade anslutningar, manuella Eval-förbindelser, prompt-justering och flera veckors frontend-arbete före lanseringen. Med AgentKit kan utvecklare nu utforma arbetsflöden visuellt och snabbare bädda in agentiska användargränssnitt med nya byggnadsblock som t.ex.:

  • Agent Builder: en visuell kanvas för att skapa och versionshantera arbetsflöden med flera agenter
  • Connector Registry: en central plats för administratörer att hantera hur data och verktyg sammanlänkar över olika OpenAI-produkter
  • ChatKit: en verktygslåda för att bädda in anpassningsbara chatt-baserade agentupplevelser i er produkt

Vi utökar även utvärderingsförmågan med nya funktioner såsom datamängder, spårgradering, automatiserad prompt-optimering och tredje partens modell-support för att mäta och förbättra agentprestandan.

Efter lanseringen av Responses API och Agents SDK i mars har vi sett utvecklare och företag skapa agentiska arbetsflöden från början till slut till djup research, kundtjänst med mera. Klarna skapade en supportagent som hanterar två tredjedelar av alla förfrågningar och Clay tiodubblade sin tillväxt med en försäljningsagent. AgentKit bygger på Responses API för att hjälpa utvecklare att skapa agenter mer effektivt och tillförlitligt.

Utforma arbetsflöden med Agent Builder

Allt eftersom agentarbetsflöden blir mer komplexa behöver utvecklare tydligare insyn i hur de fungerar. Agent Builder(öppnas i ett nytt fönster)har en visuell kanvas där man kan skapa logik med drag-och-släpp-noder, ansluta verktyg och konfigurera anpassade skyddsräcken. Den stödjer förhandsgranskningskörningar, integrerad Eval-konfiguration och komplett versionshantering, idealt för snabb iteration.

Gränssnittsvy av ett automatiserad flöde för kundtjänst i ett visuellt byggverktyg. Kanvasen visar anslutna noder som är märkta start, jailbreak-skyddsräcke, klassificeringsagent, om/annars, returagent, retentionsagent, informationsagent, hallucinationsskyddsräcke, och slut. En sidopanel till vänster listar tillgängliga nodtyper som t.ex. agent, anteckning, filsökning, skyddsräcken, MCP och användargodkännande. De främsta kontrollerna inkluderar alternativ för Utvärdera, Koda, Förhandsgranska och Publicera.

Konstruktörer kan komma igång med en blank kanvas eller förbyggda mallar.

På Ramp tog sig teamet från att ha en blank kanvas till en upphandlingsagent på bara några timmar:

Agent Builder har förvandlat det som en gång tog månader av komplex orkestrering, anpassad kod och manuell optimering till bara några timmar. Den visuella canvasen behåller produkten, det juridiska och tekniken på samma sida, vilket minskar iterationscyklerna med 70 % och får en agent live på två spurter snarare en två kvartal.
— Ramp

På liknande sätt skapade LY Corporation, ett ledande japanskt företag inom teknik och internettjänster, en arbetsassistent-agent med Agent Builder på mindre än två timmar.

"Agent Builder gjorde att vi kunde orkestrera agenter på ett helt nytt sätt, där ingenjörerna och ämnesexperterna samarbetar på ett och samma gränssnitt. Vi skapade vårt första multi-agentiska arbetsflöde och körde det på mindre än två timmar. Vi påskyndade dramatiskt hur fort vi kunde skapa och driftsätta agenterna.”
— LY Corporation

Vi lanserar även ett Anslutningsregister för företag att styra och upprätthålla data över flera arbetsytor och organisationer. Anslutningsregistret(öppnas i ett nytt fönster) sammanlänkar datakällor till en enda adminpanel över ChatGPT och API:et. Registret inkluderar alla förbyggda anslutningar, som t.ex. Google Drive, Sharepoint och Microsoft Teams, samt tredje partens MCP:er.

Utvecklare kan också aktivera skyddsräcken(öppnas i ett nytt fönster) i Agent Builder, ett modulärt säkerhetslager med öppen källa som hjälper att skydda agenter mot oavsiktliga eller uppsåtliga handlingar. Skyddsräcken kan maskera eller flagga PII, upptäcka jailbreaks och tillämpa andra skyddsräcken, vilket gör det lättare att skapa och driftsätta tillförlitliga, säkra agenter. Skyddsräcken kan driftsättas enskilt eller via biblioteket för skyddsräcken för Python(öppnas i ett nytt fönster) och JavaScript(öppnas i ett nytt fönster).

Bädda in agentiska chattupplevelser med ChatKit

Det kan vara förvånansvärt komplicerat att driftsätta chatt-användargränssnitt för agenter. Man ska hantera inkommande svar, trådar, visa hur modellen tänker och utforma engagerande upplevelser i chatten. ChatKit gör det enkelt att bädda in chattbaserade agenter som känns nativa till er produkt. Det kan bäddas in i appar eller webbplatser och anpassas för att matcha ert tema eller varumärke.

"Vi sparade mer än två veckors tid på att bygga en supportagent till vårt community för Canva-utvecklare med ChatKit och integrerade den på mindre än en timme. Den här supportagenten kommer att förvandla sättet på vilket utvecklare interagerar med våra dokument genom att göra det till en samtalsupplevelse, så att det blir lätt att skapa appar och integrationer på Canva.”
— Canva

ChatKit driver redan många olika användarfall, från interna kunskapsassistenter och onboarding-guider till kundtjänst och research-agenter. HubSpot(öppnas i ett nytt fönster):s kundtjänstagent är ett exempel:

Infopanelvy av Ramp-plattformen som visar ett gränssnitt för utgiftshantering. Huvudpanelen välkomnar användaren, Daniel, och listar förfrågningar såsom ”Begäran om ChatGPT Business” (väntar på granskning) och ”Begäran om HubSpot (utkast), samt nya utgifter för flygbolag, samåkning och programvara. Till höger syns ett öppet förfrågningsformulär för ChatGPT Business som visar 5 platser för 125 $ per månad från 1 oktober 2025 till 1 oktober 2026, med en gul ”Skicka förfrågan” knapp.

Mät agentprestanda med nya Evals-funktioner

Det krävs rigorösa prestandautvärderingar för att skapa tillförlitliga produktionsredo agenter. Förra året lanserade vi Evals(öppnas i ett nytt fönster) för att hjälpa utvecklare att testa prompter och mäta modellbeteende. Nu har vi lagt till fyra nya funktioner som gör det ännu lättare att skapa evals:

  • Datamängder - som snabbt skapar agent-evals från grunden och utvecklar dem över tid med automatiserade betygsättare och mänskliga kommentarer.
  • Spårutvärdering - kör bedömningar från början till slut på agentiska arbetsflöden och automatisera betygsättning för att markera brister.
  • Automatiserad promptoptimering - generera förbättrade prompter baserat på mänskliga kommentarer och data för betygssättare.
  • Tredje partens modellsupport - utvärdera modeller från andra leverantörer inom OpenAI:s Evals-plattform.

Vi har redan sett större prestandaförbättringar från kunder som använder Evals.

”Utvärderingsplattformen minskade utvecklingstiden för vårt multiagent due diligence-ramverk med mer än 50 % och förbättrade agent-noggrannheten med 30 %.”
— Carlyle
Gränssnitt som visar en datamängdtabell med kolumner för betyg, ton, feedback och noggrannhet. Rader visar poster med tumme upp eller tumme ner-ikoner, tontaggar såsom professionell, vänlig, oförskämd, och dålig samt noggrannhetsresultat märkta godkänd eller underkänd med ett betyg på 3,5. Den översta verktygsraden inkluderar alternativ för ladda upp, kolumner, betygsätt, generera utdata och spara.

Förbättra agentprestandan med förstärkt finjustering

Förstärkt finjustering(öppnas i ett nytt fönster) (RFT) låter utvecklare anpassa våra resonemangsmodeller. Det finns allmänt tillgängligt på OpenAI o4-mini och på privat beta för GPT‑5. Vi samarbetar med dussintals kunder för att finjustera RFT för GPT‑5 innan den släpps i större skala.

Idag presenterar vi två nya funktioner där RFT betaversionen har utformats till att framdriva agentprestandan ännu mer:

  • Anpassade verktygsanrop - träna modeller till att anropa de rätta verktygen vid rätt tillfälle för bättre resonemang 
  • Anpassade graderare - ange anpassade utvärderingskriterier för vad som är viktigast i ert användningsfall

Priser och tillgänglighet

Från och med idag är ChatKit och de nya Evals-funktionerna allmänt tillgängliga för alla utvecklare. Agent Builder är tillgänglig i beta och Connector Registry påbörjar sin beta-utgåva till vissa API-, ChatGPT Enterprise- och Edu-kunder som har en Global Admin Console (där Global-ägare kan hantera domäner, SSO, flera olika API-org). Global Admin Console (öppnas i ett nytt fönster)krävs för att aktivera Anslutningsregistret. Alla dessa verktyg inkluderas med standardpriserna för AP-modeller.

Vi planerar att tillägga enskilda arbetsflödes-API:er och alternativ för agentdriftssättning i ChatGPT snarast.

Vi ser fram emot att få se vad du skapar.

Författare

OpenAI