6. oktober 2025

Vi præsenterer AgentKit

Nye værktøjer til bygning, udrulning og optimering af agenter.

Indlæser ...

Vi har i dag lanceret AgentKit, et komplet sæt værktøjer til udviklere og virksomheder til bygning, udrulning og optimering af agenter. Hidtil har bygning af agenter betydet håndtering af forskellige værktøjer – kompleks orkestrering uden versionering, tilpassede forbindelser, manuelle evaluerings-pipelines, finjustering af forespørgsler og ugevis af frontend-arbejde før lancering. Med AgentKit kan udviklerne nu visuelt designe arbejdsgange og hurtigere integrere agentiske brugergrænseflader med nye byggesten som f.eks.:

Agent Builder: Et visuelt lærred til at skabe og versionere multiagent-arbejdsgange
Connector Registry: Et centralt sted for administratorer til håndtering af, hvordan data og værktøjer opretter forbindelse på tværs af OpenAI-produkter
ChatKit: Et værktøjssæt til hurtig og nem indlejring af skræddersyede chatbaserede agenter i dit produkt

Vi udvider også evalueringsmulighederne med nye funktioner, som f.eks. datasæt, AI-vurderinger, automatiseret forespørgselsoptimering og understøttelse af tredjepartsmodeller for at måle og forbedre agentpræstationer.

Siden lanceringen af Responses API og Agents SDK⁠ i marts har vi set udviklere og virksomheder bygge helhedsorienterede agentiske arbejdsgange til grundig research, kundesupport m.m. Klarna byggede en supportagent⁠, der håndterer to tredjedele af alle supportsager, og Clay tidoblede væksten⁠ med en salgsagent. AgentKit bygger på Responses API som en hjælp til udviklerne til mere effektivt og pålideligt at bygge agenter.

Design arbejdsgange med Agent Builder

Når agentarbejdsgange bliver mere komplekse, har udviklerne brug for bedre at forstå, hvordan de fungerer. Agent Builder⁠(åbner i et nyt vindue) leverer et visuelt lærred til sammensætning af logik med træk-og-slip-noder, forbindelsesværktøjer og konfiguration af tilpassede sikkerhedsforanstaltninger. Den understøtter preview-kørsler, konfiguration af inline-evalueringer og fuld versionsstyring.

Grænsefladevisning af en automatiseringsproces for kundeservice i et visuelt byggeværktøj. Lærredet viser forbundne noder mærket Start, Jailbreak-sikkerhed, Klassificeringsagent, hvis/ellers, Returagent, Opbevaringsagent, Informationsagent, Hallucination-sikkerhed og Slut. En sidebjælke til venstre viser tilgængelige nodetyper, som f.eks. Agent, Note, Filsøgning, Guardrails, MCP og Brugergodkendelse. Kontrolelementerne øverst inkluderer valgmulighederne Evaluering, Kode, Forhåndsvisning og Offentliggør.

Udviklere kan begynde med et tomt lærred eller med forhåndsskabte skabeloner.

Hos Ramp gik teamet fra et tomt lærred til en indkøbsagent på blot nogle få timer:

Agent Builder transformerede det, der engang tog flere måneder med kompleks orkestrering, tilpasset kode og manuelle optimeringer, til blot nogle få timer. Det visuelle lærred holder produkt, jura og teknik på samme side og skærer 70 % af iterationsarbejdet, så agenter kan gå live i to sprints i stedet for to kvartaler.”

– Ramp

Tilsvarende byggede LY Corporation – en førende japansk teknologi- og internetvirksomhed – en arbejdsassistentagent med Agent Builders på mindre end to timer.

"Med Agent Builder kunne vi orkestrere agenter på en helt ny måde, hvor teknikere og emneeksperter samarbejdede i samme grænseflade. Vi byggede vores første multi-agentiske arbejdsgang og kørte den på mindre end to timer, hvilket dramatisk forkortede den tid, vi skulle bruge til at skabe og udrulle agenter."

– LY Corporation

Vi lancerer desuden en Connector Registry til virksomheder til at regulere og vedligeholde data på tværs af flere arbejdsområder og organisationer. Vores Connector Registry⁠(åbner i et nyt vindue) konsoliderer datakilder til et enkelt administrationspanel på tværs af ChatGPT og API'en. Registreringsdatabasen omfatter alle på forhånd byggede forbindelser, som f.eks. Dropbox, Google Drev, Sharepoint og Microsoft Teams, samt tredjeparts-MCP'er.

Udviklere kan også aktivere Guardrails⁠(åbner i et nyt vindue) i Agent Builder – et open-source modulopbygget sikkerhedslag, der hjælper med at beskytte agenter mod uforsætlig eller ondsindet adfærd. Guardrails kan maskere eller markere personligt identificerbare oplysninger (PII), registrere jailbreaks og anvende andre beskyttelsesforanstaltninger, hvilket gør det lettere at bygge og udrulle pålidelige og sikre agenter. Sikkerhedsforanstaltninger kan udrulles individuelt eller via sikkerhedsbiblioteket for Python⁠(åbner i et nyt vindue) og JavaScript⁠(åbner i et nyt vindue).

Integrer agentiske chatoplevelser med ChatKit

Udrulning af chatgrænseflader for agenter kan være overraskende kompleks – håndtering af streaming-svar, administration af tråde, visualisering af modellens tænkning og design af engagerende chatoplevelser. ChatKit gør det enkelt at integrere chatbaserede agenter, der føles som en naturlig del af dit produkt. Den kan integreres i apps eller på websteder og tilpasses til at matche dit tema eller brand.

"Vi sparede over to uger i opbygningen af en supportagent til vores Canva-udvikler-community med ChatKit og integrerede den på mindre end en time. Supportagenten vil transformere den måde, som udviklere bruger vores dokumentation ved at gøre det til en samtalebaseret oplevelse og dermed nemmere at bygge apps og integrationer på Canva."

– Canva

ChatKit driver allerede en række use cases, fra interne vidensassistenter og onboarding-guider til kundesupport og researchagenter. Kundesupportagenten hos HubSpot⁠(åbner i et nyt vindue) er ét eksempel:

Dashboard-visning af Ramp-platformen, der viser en grænseflade med administration af udgifter. Det primære panel hilser på brugeren, Daniel, og viser anmodninger som f.eks. ‘Anmodning om ChatGPT Business’ (afventer gennemgang) og ‘Anmodning om HubSpot’ (udkast), sammen med seneste udgifter til flyrejser, delebiler og software. Til højre er en åben formular med en softwareanmodning om ChatGPT Business for 5 pladser til USD 125 per måned fra 1. oktober 2025 til 1. oktober 2026 med en gul knap ‘Send anmodning’.

Mål agentpræstationer med nye evalueringsmuligheder

Bygning af pålidelige og produktionsklare agenter kræver metodiske præstationsevalueringer. Sidste år lancerede vi Evals⁠(åbner i et nyt vindue) for at hjælpe udviklerne med at teste forespørgsler og måle modeladfærd. Vi tilføjer nu fire nye muligheder, de gør det endnu nemmere at bygge evalueringer:

Datasæt – byg agentevalueringer hurtigt fra bunden, og udvid dem med tiden med automatiserede evaluatorer og menneskebaserede kommentarer.
AI-vurderinger – kør helhedsbaserede vurderinger af agentiske arbejdsgange, og automatiser vurderinger for at påpege mangler.
Automatiseret forespørgselsoptimering – generer forbedrede forespørgsler baseret på menneskebaserede kommentarer og evaluatorresultater.
Understøttelse af tredjepartsmodeller – evaluer modeller fra andre leverandører inden for rammerne af OpenAI-evalueringsplatformen.

Vi har allerede set store præstationsgevinster fra kunder, der bruger Evals.

"Evalueringsplatformen mindskede tiden for udvikling af due diligence-rammeværket til vores multiagent med over 50 % og øgede agentens præcision med 30 %".

– Carlyle

Grænseflade, der viser en datasættabel med kolonnerne Bedømmelse, Tone, Feedback og Præcision. Rækkerne viser poster med tommelfinger op- eller tommelfinger ned-symboler, tone-tags som f.eks. Professionel, Venlig, Fræk og Dårlig og præcisionsresultater markeret som Bestået eller Ikke bestået med en score på 3,5. Den øverste værktøjslinje omfatter valgmulighederne Upload, Kolonner, Vurder, Generer output og Gem.

Gør agentpræstationen bedre med forstærket finjustering (RFT)

Med Forstærket finjustering⁠(åbner i et nyt vindue) (RFT) kan udviklere tilpasse vores ræsonneringsmodeller. Den er generelt tilgængelig på OpenAI o4-mini og i privat beta for GPT‑5. Vi arbejder tæt sammen med mange kunder for at finjustere TRFT for GPT‑5 før en bredere lancering.

I dag introducerer vi to nye funktioner i den RFT-beta, der er designet til at forbedre agentpræstationen yderligere:

Tilpassede værktøjskald – træn modeller i at kalde de rigtige værktøjer på det rigtige tidspunkt for at forbedre avanceret tænkning
Tilpassede evaluatorer – angiv tilpassede evalueringskriterier for det, der betyder mest i din kontekst.

Priser og tilgængelighed

Fra i dag er ChatKit og de nye evalueringsmuligheder generelt tilgængelige for alle udviklere. Agent Builder er tilgængelig i beta, og Connector Registry er begyndt udrulning i beta til visse API-, ChatGPT Enterprise- og Edu-kunder med en Global Admin-konsol (hvor globale ejere kan administrere domæner, SSO og flere API-organisationer). Global Admin-konsollen er ⁠(åbner i et nyt vindue)en forudsætning for aktivering af Connector Registry. Alle disse værktøjer er inkluderet i prisen på standard API-modellen.

Vi har planer om at tilføje et individuelt arbejdsgangs-API og muligheder for agentudrulning i ChatGPT snarest.

Vi glæder os til at se, hvad du bygger.

Skrevet af

OpenAI

Læs videre

Se alle

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 er nu den foretrukne model i Microsoft 365 Copilot

Produkt9. jul. 2026

GPT-5.6: Banebrydende intelligens, der skalerer med dine ambitioner

Produkt9. jul. 2026

ChatGPT er nu en partner til dit mest ambitiøse arbejde

Produkt9. jul. 2026