6 oktober 2025

Maak kennis met AgentKit

Nieuwe tools voor het bouwen, implementeren en optimaliseren van agents.

Bezig met laden...

Vandaag lanceren we AgentKit, een complete set tools voor ontwikkelaars en bedrijven om agents te bouwen, implementeren en optimaliseren. Tot nu toe betekende het bouwen van agents dat je moest jongleren met gefragmenteerde tools: complexe coördinatie zonder versiebeheer, aangepaste connectoren, handmatige evaluatiepijplijnen, snelle afstemming en wekenlang front-endwerk vóór de lancering. Met AgentKit kunnen ontwikkelaars nu workflows visueel ontwerpen en agentic gebruikersinterfaces sneller integreren met nieuwe bouwstenen zoals:

Agent Builder: een visueel canvas voor het creëren en versiebeheer van multi-agent workflows
Connector Registry: een centrale plek voor beheerders om in te stellen hoe gegevens en tools binnen OpenAI-producten met elkaar worden verbonden
ChatKit: een toolkit voor het integreren van aanpasbare chat-gebaseerde agentervaringen in je product

We breiden ook onze evaluatiemogelijkheden uit met nieuwe functies zoals datasets, traceer-classificatie, geautomatiseerde promptoptimalisatie en ondersteuning voor modellen van derden om de prestaties van agents te meten en verbeteren.

Sinds de release van de Responses API en Agents SDK⁠ in maart hebben we gezien dat ontwikkelaars en bedrijven end-to-end agentic workflows hebben gebouwd voor diepgaand onderzoek, klantenondersteuning en meer. Klarna heeft een ondersteuningsagent gebouwd⁠ die twee derde van alle tickets afhandelt. En Clay is tien keer zo snel gegroeid⁠ met een salesagent. AgentKit bouwt voort op de Responses API om ontwikkelaars te helpen agents efficiënter en betrouwbaarder te bouwen.

Ontwerpworkflows met Agent Builder

Naarmate agentworkflows complexer worden, hebben ontwikkelaars behoefte aan meer inzicht in hoe ze werken. Agent Builder⁠(opent in een nieuw venster) biedt een visueel canvas voor het samenstellen van logica met drag-and-drop-knooppunten, het verbinden van tools en het configureren van aangepaste beschermingsmaatregelen. Het ondersteunt preview-runs, inline evaluatieconfiguratie en volledig versiebeheer: ideaal voor snelle iteratie.

Interfaceweergave van een automatiseringsflow voor klantenservice in een visuele builder-tool. Het canvas toont verbonden knooppunten met de labels Start, Jailbreak-beschermingsmaatregel, Classificatieagent, Als/anders, Retouragent, Retentieagent, Informatieagent, Hallucinatie-beschermingsmaatregel en Einde. In een zijbalk aan de linkerkant staan de beschikbare knooppunttypen, zoals Agent, Notitie, Zoeken in bestanden, Beschermingsmaatregelen, MCP en Gebruikersgoedkeuring. De belangrijkste bedieningselementen zijn onder meer opties voor Evalueren, Programmeren, Voorbeeld en Publiceren.

Bouwers kunnen aan de slag met een leeg canvas of met vooraf gemaakte sjablonen.

Bij Ramp ging het team in slechts een paar uur tijd van een leeg canvas naar een inkoopagent:

Met Agent Builder kun je nu in een paar uur bouwen wat vroeger maanden van complexe coördinatie, aangepaste code en handmatige optimalisaties kostte. Dankzij het visuele canvas blijven productontwikkeling, juridische zaken en engineering op één lijn, waardoor iteratiecycli met 70% worden verkort en een agent in twee sprints in plaats van twee kwartalen live kan gaan.

— Ramp

Op dezelfde manier heeft LY Corporation, een toonaangevend Japans technologie- en internetbedrijf, in minder dan twee uur een werkassistent-agent gebouwd met Agent Builder.

"Met Agent Builder konden we agents op een geheel nieuwe manier coördineren, waarbij ingenieurs en vakexperts allemaal samenwerkten in één interface. We hebben onze eerste multi-agentic workflow gebouwd en deze in minder dan twee uur uitgevoerd, waardoor de tijd die nodig is om agents te creëren en in te zetten drastisch is verkort."

— LY Corporation

We lanceren ook een Connector Registry voor ondernemingen om gegevens in meerdere werkruimten en organisaties te beheren en onderhouden. De Connector Registry⁠(opent in een nieuw venster) consolideert gegevensbronnen in één enkel beheervenster voor ChatGPT en de API. Het register bevat alle vooraf gebouwde connectoren zoals Dropbox, Google Drive, Sharepoint en Microsoft Teams, evenals MCP's van derden.

Ontwikkelaars kunnen ook Guardrails⁠(opent in een nieuw venster) inschakelen in Agent Builder, een open-source, modulaire veiligheidslaag waarmee agents worden beschermd tegen onbedoeld of kwaadwillig gedrag. Guardrails kunnen PII maskeren of markeren, jailbreaks detecteren en andere beveiligingsmaatregelen toepassen. Hierdoor wordt het eenvoudiger om betrouwbare, veilige agents te bouwen en implementeren. Guardrails kan zelfstandig worden geïmplementeerd of via de Guardrails-bibliotheek voor Python⁠(opent in een nieuw venster) en JavaScript⁠(opent in een nieuw venster).

Integreer agentic chat-ervaringen met ChatKit

De implementatie van chat-UI's voor agents kan verrassend complex zijn: de verwerking van streaming-reacties, het beheer van threads, de weergave van het denkproces van het model en het ontwerp van boeiende chat-ervaringen. Met ChatKit kun je eenvoudig chatgebaseerde agents integreren die naadloos aansluiten bij je product. Het kan worden geïntegreerd in apps of websites, en worden aangepast aan je thema of merk.

"We hebben meer dan twee weken tijd bespaard bij het bouwen van een supportagent voor onze Canva Developers-community met ChatKit. En we hebben deze in minder dan een uur geïntegreerd. Deze ondersteuningsagent zal de manier waarop ontwikkelaars met onze documentatie omgaan veranderen door er een conversatie-ervaring van te maken. Hierdoor kunnen gebruikers gemakkelijk apps en integraties op Canva bouwen."

— Canva

ChatKit wordt al gebruikt voor een breed scala aan usecases, van interne kennisassistenten en onboarding-gidsen tot klantenservice en onderzoeksagents. De klantenservice-agent van HubSpot⁠(opent in een nieuw venster) is een voorbeeld:

Dashboardweergave van het Ramp-platform met een interface voor onkostenbeheer. Het hoofdvenster begroet de gebruiker, Daniel, en geeft een overzicht van verzoeken zoals ‘Verzoek voor ChatGPT Business’ (beoordeling in behandeling) en ‘Verzoek voor HubSpot’ (concept), samen met recente uitgaven voor luchtvaartmaatschappijen, carpoolen en software. Aan de rechterkant is een softwareaanvraagformulier geopend voor ChatGPT Business, met daarin 5 plaatsen voor $ 125 per maand van 1 oktober 2025 tot 1 oktober 2026, met een gele knop ‘Aanvraag indienen’.

Meet de prestaties van agents met nieuwe evaluatieopties

Het bouwen van betrouwbare, productieklare agents vereist strenge prestatie-evaluaties. Vorig jaar hebben we Evals⁠(opent in een nieuw venster) gelanceerd om ontwikkelaars te helpen prompts te testen en modelgedrag te meten. We voegen nu vier nieuwe functies toe die het nog gemakkelijker maken om evaluaties te bouwen:

Datasets: bouw snel agent-evaluaties vanaf nul op en breid ze in de loop van de tijd uit met geautomatiseerde beoordelaars en menselijke annotaties.
Traceer-classificatie: voer end-to-end beoordelingen uit van agentic workflows en automatiseer de classificatie om tekortkomingen op te sporen.
Geautomatiseerde promptoptimalisatie: genereer verbeterde prompts op basis van menselijke annotaties en de uitvoer van beoordelaars.
Ondersteuning voor modellen van derden: evalueer modellen van andere aanbieders binnen het OpenAI Evals-platform.

We hebben al aanzienlijke prestatieverbeteringen gezien bij klanten die Evals gebruiken.

"Het evaluatieplatform heeft de ontwikkelingstijd van ons multi-agent due diligence-raamwerk met meer dan 50% verkort en de nauwkeurigheid van de agents met 30% verhoogd."

— Carlyle

Interface met een tabel met gegevenssets en kolommen voor Beoordeling, Toon, Feedback en Nauwkeurigheid. Rijen geven vermeldingen weer met pictogrammen voor duim omhoog of duim omlaag, toontags zoals Professioneel, Vriendelijk, Onbeleefd en Slecht, en nauwkeurigheidsresultaten met het label Geslaagd of Niet geslaagd en een score van 3,5. De bovenste werkbalk bevat opties voor Uploaden, Kolommen, Cijfer, Uitvoer genereren en Opslaan.

Verbeter agentprestaties met aangescherpte afstemming

Aangescherpte afstemming⁠(opent in een nieuw venster) (RFT, reinforcement fine tuning) stelt ontwikkelaars in staat om onze redeneringsmodellen aan te passen. Het is algemeen beschikbaar op OpenAI o4-mini en in een privé-bèta voor GPT‑5. We werken nauw samen met tientallen klanten om de RFT voor GPT‑5 te verfijnen voordat deze op grotere schaal wordt uitgebracht.

Vandaag introduceren we twee nieuwe functies in die RFT-bèta die bedoeld zijn om agentprestaties nog verder te verbeteren:

Aangepaste toolaanroepen: train modellen om op het juiste moment de juiste tools aan te roepen voor beter redeneren
Aangepaste beoordelaars: stel aangepaste evaluatiecriteria in voor wat het belangrijkst is in je toepassing

Prijzen en beschikbaarheid

Vanaf vandaag zijn ChatKit en de nieuwe Evals-mogelijkheden algemeen beschikbaar voor alle ontwikkelaars. Agent Builder is beschikbaar in bèta en Connector Registry begint met de bèta-uitrol naar sommige API-, ChatGPT Enterprise- en Edu-klanten met een Global Admin Console (waar Global Owners domeinen, SSO en meerdere API-organisaties kunnen beheren). De Global Admin Console is ⁠(opent in een nieuw venster)een vereiste om Connector Registry in te schakelen. Al deze tools zijn inbegrepen in de standaard API-modelprijzen.

We zijn van plan om binnenkort een zelfstandige Workflows API en agent-implementatieopties aan ChatGPT toe te voegen.

We kunnen niet wachten om te zien wat je bouwt!

Auteur

OpenAI

Andere interessante artikelen

Alles weergeven

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 is nu het voorkeursmodel in Microsoft 365 Copilot

Product9 jul 2026

GPT-5.6: grensverleggende intelligentie die meegroeit met je ambitie

Product9 jul 2026

ChatGPT is nu een partner voor je meest ambitieuze werk

Product9 jul 2026