Vi har i dag lanceret AgentKit, et komplet sæt værktøjer til udviklere og virksomheder til bygning, udrulning og optimering af agenter. Hidtil har bygning af agenter betydet håndtering af forskellige værktøjer – kompleks orkestrering uden versionering, tilpassede forbindelser, manuelle evaluerings-pipelines, finjustering af forespørgsler og ugevis af frontend-arbejde før lancering. Med AgentKit kan udviklerne nu visuelt designe arbejdsgange og hurtigere integrere agentiske brugergrænseflader med nye byggesten som f.eks.:
- Agent Builder: Et visuelt lærred til at skabe og versionere multiagent-arbejdsgange
- Connector Registry: Et centralt sted for administratorer til håndtering af, hvordan data og værktøjer opretter forbindelse på tværs af OpenAI-produkter
- ChatKit: Et værktøjssæt til hurtig og nem indlejring af skræddersyede chatbaserede agenter i dit produkt
Vi udvider også evalueringsmulighederne med nye funktioner, som f.eks. datasæt, AI-vurderinger, automatiseret forespørgselsoptimering og understøttelse af tredjepartsmodeller for at måle og forbedre agentpræstationer.
Siden lanceringen af Responses API og Agents SDK i marts har vi set udviklere og virksomheder bygge helhedsorienterede agentiske arbejdsgange til grundig research, kundesupport m.m. Klarna byggede en supportagent, der håndterer to tredjedele af alle supportsager, og Clay tidoblede væksten med en salgsagent. AgentKit bygger på Responses API som en hjælp til udviklerne til mere effektivt og pålideligt at bygge agenter.
Når agentarbejdsgange bliver mere komplekse, har udviklerne brug for bedre at forstå, hvordan de fungerer. Agent Builder(åbner i et nyt vindue) leverer et visuelt lærred til sammensætning af logik med træk-og-slip-noder, forbindelsesværktøjer og konfiguration af tilpassede sikkerhedsforanstaltninger. Den understøtter preview-kørsler, konfiguration af inline-evalueringer og fuld versionsstyring.

Udviklere kan begynde med et tomt lærred eller med forhåndsskabte skabeloner.
Hos Ramp gik teamet fra et tomt lærred til en indkøbsagent på blot nogle få timer:
Agent Builder transformerede det, der engang tog flere måneder med kompleks orkestrering, tilpasset kode og manuelle optimeringer, til blot nogle få timer. Det visuelle lærred holder produkt, jura og teknik på samme side og skærer 70 % af iterationsarbejdet, så agenter kan gå live i to sprints i stedet for to kvartaler.”
Tilsvarende byggede LY Corporation – en førende japansk teknologi- og internetvirksomhed – en arbejdsassistentagent med Agent Builders på mindre end to timer.
"Med Agent Builder kunne vi orkestrere agenter på en helt ny måde, hvor teknikere og emneeksperter samarbejdede i samme grænseflade. Vi byggede vores første multi-agentiske arbejdsgang og kørte den på mindre end to timer, hvilket dramatisk forkortede den tid, vi skulle bruge til at skabe og udrulle agenter."
Vi lancerer desuden en Connector Registry til virksomheder til at regulere og vedligeholde data på tværs af flere arbejdsområder og organisationer. Vores Connector Registry(åbner i et nyt vindue) konsoliderer datakilder til et enkelt administrationspanel på tværs af ChatGPT og API'en. Registreringsdatabasen omfatter alle på forhånd byggede forbindelser, som f.eks. Dropbox, Google Drev, Sharepoint og Microsoft Teams, samt tredjeparts-MCP'er.
Udviklere kan også aktivere Guardrails(åbner i et nyt vindue) i Agent Builder – et open-source modulopbygget sikkerhedslag, der hjælper med at beskytte agenter mod uforsætlig eller ondsindet adfærd. Guardrails kan maskere eller markere personligt identificerbare oplysninger (PII), registrere jailbreaks og anvende andre beskyttelsesforanstaltninger, hvilket gør det lettere at bygge og udrulle pålidelige og sikre agenter. Sikkerhedsforanstaltninger kan udrulles individuelt eller via sikkerhedsbiblioteket for Python(åbner i et nyt vindue) og JavaScript(åbner i et nyt vindue).
Udrulning af chatgrænseflader for agenter kan være overraskende kompleks – håndtering af streaming-svar, administration af tråde, visualisering af modellens tænkning og design af engagerende chatoplevelser. ChatKit gør det enkelt at integrere chatbaserede agenter, der føles som en naturlig del af dit produkt. Den kan integreres i apps eller på websteder og tilpasses til at matche dit tema eller brand.
"Vi sparede over to uger i opbygningen af en supportagent til vores Canva-udvikler-community med ChatKit og integrerede den på mindre end en time. Supportagenten vil transformere den måde, som udviklere bruger vores dokumentation ved at gøre det til en samtalebaseret oplevelse og dermed nemmere at bygge apps og integrationer på Canva."
ChatKit driver allerede en række use cases, fra interne vidensassistenter og onboarding-guider til kundesupport og researchagenter. Kundesupportagenten hos HubSpot(åbner i et nyt vindue) er ét eksempel:

Bygning af pålidelige og produktionsklare agenter kræver metodiske præstationsevalueringer. Sidste år lancerede vi Evals(åbner i et nyt vindue) for at hjælpe udviklerne med at teste forespørgsler og måle modeladfærd. Vi tilføjer nu fire nye muligheder, de gør det endnu nemmere at bygge evalueringer:
- Datasæt – byg agentevalueringer hurtigt fra bunden, og udvid dem med tiden med automatiserede evaluatorer og menneskebaserede kommentarer.
- AI-vurderinger – kør helhedsbaserede vurderinger af agentiske arbejdsgange, og automatiser vurderinger for at påpege mangler.
- Automatiseret forespørgselsoptimering – generer forbedrede forespørgsler baseret på menneskebaserede kommentarer og evaluatorresultater.
- Understøttelse af tredjepartsmodeller – evaluer modeller fra andre leverandører inden for rammerne af OpenAI-evalueringsplatformen.
Vi har allerede set store præstationsgevinster fra kunder, der bruger Evals.
"Evalueringsplatformen mindskede tiden for udvikling af due diligence-rammeværket til vores multiagent med over 50 % og øgede agentens præcision med 30 %".

Med Forstærket finjustering(åbner i et nyt vindue) (RFT) kan udviklere tilpasse vores ræsonneringsmodeller. Den er generelt tilgængelig på OpenAI o4-mini og i privat beta for GPT‑5. Vi arbejder tæt sammen med mange kunder for at finjustere TRFT for GPT‑5 før en bredere lancering.
I dag introducerer vi to nye funktioner i den RFT-beta, der er designet til at forbedre agentpræstationen yderligere:
- Tilpassede værktøjskald – træn modeller i at kalde de rigtige værktøjer på det rigtige tidspunkt for at forbedre avanceret tænkning
- Tilpassede evaluatorer – angiv tilpassede evalueringskriterier for det, der betyder mest i din kontekst.
Fra i dag er ChatKit og de nye evalueringsmuligheder generelt tilgængelige for alle udviklere. Agent Builder er tilgængelig i beta, og Connector Registry er begyndt udrulning i beta til visse API-, ChatGPT Enterprise- og Edu-kunder med en Global Admin-konsol (hvor globale ejere kan administrere domæner, SSO og flere API-organisationer). Global Admin-konsollen er (åbner i et nyt vindue)en forudsætning for aktivering af Connector Registry. Alle disse værktøjer er inkluderet i prisen på standard API-modellen.
Vi har planer om at tilføje et individuelt arbejdsgangs-API og muligheder for agentudrulning i ChatGPT snarest.
Vi glæder os til at se, hvad du bygger.


