Maak kennis met AgentKit
Nieuwe tools voor het bouwen, implementeren en optimaliseren van agents.
Vandaag lanceren we AgentKit, een complete set tools voor ontwikkelaars en bedrijven om agents te bouwen, implementeren en optimaliseren. Tot nu toe betekende het bouwen van agents dat je moest jongleren met gefragmenteerde tools: complexe coördinatie zonder versiebeheer, aangepaste connectoren, handmatige evaluatiepijplijnen, snelle afstemming en wekenlang front-endwerk vóór de lancering. Met AgentKit kunnen ontwikkelaars nu workflows visueel ontwerpen en agentic gebruikersinterfaces sneller integreren met nieuwe bouwstenen zoals:
- Agent Builder: een visueel canvas voor het creëren en versiebeheer van multi-agent workflows
- Connector Registry: een centrale plek voor beheerders om in te stellen hoe gegevens en tools binnen OpenAI-producten met elkaar worden verbonden
- ChatKit: een toolkit voor het integreren van aanpasbare chat-gebaseerde agentervaringen in je product
We breiden ook onze evaluatiemogelijkheden uit met nieuwe functies zoals datasets, traceer-classificatie, geautomatiseerde promptoptimalisatie en ondersteuning voor modellen van derden om de prestaties van agents te meten en verbeteren.
Sinds de release van de Responses API en Agents SDK in maart hebben we gezien dat ontwikkelaars en bedrijven end-to-end agentic workflows hebben gebouwd voor diepgaand onderzoek, klantenondersteuning en meer. Klarna heeft een ondersteuningsagent gebouwd die twee derde van alle tickets afhandelt. En Clay is tien keer zo snel gegroeid met een salesagent. AgentKit bouwt voort op de Responses API om ontwikkelaars te helpen agents efficiënter en betrouwbaarder te bouwen.
Naarmate agentworkflows complexer worden, hebben ontwikkelaars behoefte aan meer inzicht in hoe ze werken. Agent Builder(opent in een nieuw venster) biedt een visueel canvas voor het samenstellen van logica met drag-and-drop-knooppunten, het verbinden van tools en het configureren van aangepaste beschermingsmaatregelen. Het ondersteunt preview-runs, inline evaluatieconfiguratie en volledig versiebeheer: ideaal voor snelle iteratie.

Bouwers kunnen aan de slag met een leeg canvas of met vooraf gemaakte sjablonen.
Bij Ramp ging het team in slechts een paar uur tijd van een leeg canvas naar een inkoopagent:
Met Agent Builder kun je nu in een paar uur bouwen wat vroeger maanden van complexe coördinatie, aangepaste code en handmatige optimalisaties kostte. Dankzij het visuele canvas blijven productontwikkeling, juridische zaken en engineering op één lijn, waardoor iteratiecycli met 70% worden verkort en een agent in twee sprints in plaats van twee kwartalen live kan gaan.
Op dezelfde manier heeft LY Corporation, een toonaangevend Japans technologie- en internetbedrijf, in minder dan twee uur een werkassistent-agent gebouwd met Agent Builder.
"Met Agent Builder konden we agents op een geheel nieuwe manier coördineren, waarbij ingenieurs en vakexperts allemaal samenwerkten in één interface. We hebben onze eerste multi-agentic workflow gebouwd en deze in minder dan twee uur uitgevoerd, waardoor de tijd die nodig is om agents te creëren en in te zetten drastisch is verkort."
We lanceren ook een Connector Registry voor ondernemingen om gegevens in meerdere werkruimten en organisaties te beheren en onderhouden. De Connector Registry(opent in een nieuw venster) consolideert gegevensbronnen in één enkel beheervenster voor ChatGPT en de API. Het register bevat alle vooraf gebouwde connectoren zoals Dropbox, Google Drive, Sharepoint en Microsoft Teams, evenals MCP's van derden.
Ontwikkelaars kunnen ook Guardrails(opent in een nieuw venster) inschakelen in Agent Builder, een open-source, modulaire veiligheidslaag waarmee agents worden beschermd tegen onbedoeld of kwaadwillig gedrag. Guardrails kunnen PII maskeren of markeren, jailbreaks detecteren en andere beveiligingsmaatregelen toepassen. Hierdoor wordt het eenvoudiger om betrouwbare, veilige agents te bouwen en implementeren. Guardrails kan zelfstandig worden geïmplementeerd of via de Guardrails-bibliotheek voor Python(opent in een nieuw venster) en JavaScript(opent in een nieuw venster).
De implementatie van chat-UI's voor agents kan verrassend complex zijn: de verwerking van streaming-reacties, het beheer van threads, de weergave van het denkproces van het model en het ontwerp van boeiende chat-ervaringen. Met ChatKit kun je eenvoudig chatgebaseerde agents integreren die naadloos aansluiten bij je product. Het kan worden geïntegreerd in apps of websites, en worden aangepast aan je thema of merk.
"We hebben meer dan twee weken tijd bespaard bij het bouwen van een supportagent voor onze Canva Developers-community met ChatKit. En we hebben deze in minder dan een uur geïntegreerd. Deze ondersteuningsagent zal de manier waarop ontwikkelaars met onze documentatie omgaan veranderen door er een conversatie-ervaring van te maken. Hierdoor kunnen gebruikers gemakkelijk apps en integraties op Canva bouwen."
ChatKit wordt al gebruikt voor een breed scala aan usecases, van interne kennisassistenten en onboarding-gidsen tot klantenservice en onderzoeksagents. De klantenservice-agent van HubSpot(opent in een nieuw venster) is een voorbeeld:

Het bouwen van betrouwbare, productieklare agents vereist strenge prestatie-evaluaties. Vorig jaar hebben we Evals(opent in een nieuw venster) gelanceerd om ontwikkelaars te helpen prompts te testen en modelgedrag te meten. We voegen nu vier nieuwe functies toe die het nog gemakkelijker maken om evaluaties te bouwen:
- Datasets: bouw snel agent-evaluaties vanaf nul op en breid ze in de loop van de tijd uit met geautomatiseerde beoordelaars en menselijke annotaties.
- Traceer-classificatie: voer end-to-end beoordelingen uit van agentic workflows en automatiseer de classificatie om tekortkomingen op te sporen.
- Geautomatiseerde promptoptimalisatie: genereer verbeterde prompts op basis van menselijke annotaties en de uitvoer van beoordelaars.
- Ondersteuning voor modellen van derden: evalueer modellen van andere aanbieders binnen het OpenAI Evals-platform.
We hebben al aanzienlijke prestatieverbeteringen gezien bij klanten die Evals gebruiken.
"Het evaluatieplatform heeft de ontwikkelingstijd van ons multi-agent due diligence-raamwerk met meer dan 50% verkort en de nauwkeurigheid van de agents met 30% verhoogd."

Aangescherpte afstemming(opent in een nieuw venster) (RFT, reinforcement fine tuning) stelt ontwikkelaars in staat om onze redeneringsmodellen aan te passen. Het is algemeen beschikbaar op OpenAI o4-mini en in een privé-bèta voor GPT‑5. We werken nauw samen met tientallen klanten om de RFT voor GPT‑5 te verfijnen voordat deze op grotere schaal wordt uitgebracht.
Vandaag introduceren we twee nieuwe functies in die RFT-bèta die bedoeld zijn om agentprestaties nog verder te verbeteren:
- Aangepaste toolaanroepen: train modellen om op het juiste moment de juiste tools aan te roepen voor beter redeneren
- Aangepaste beoordelaars: stel aangepaste evaluatiecriteria in voor wat het belangrijkst is in je toepassing
Vanaf vandaag zijn ChatKit en de nieuwe Evals-mogelijkheden algemeen beschikbaar voor alle ontwikkelaars. Agent Builder is beschikbaar in bèta en Connector Registry begint met de bèta-uitrol naar sommige API-, ChatGPT Enterprise- en Edu-klanten met een Global Admin Console (waar Global Owners domeinen, SSO en meerdere API-organisaties kunnen beheren). De Global Admin Console is (opent in een nieuw venster)een vereiste om Connector Registry in te schakelen. Al deze tools zijn inbegrepen in de standaard API-modelprijzen.
We zijn van plan om binnenkort een zelfstandige Workflows API en agent-implementatieopties aan ChatGPT toe te voegen.
We kunnen niet wachten om te zien wat je bouwt!


