Overslaan naar hoofdinhoud
OpenAI

15 mei 2026

Databricks brengt GPT‑5.5 naar agentworkflows voor ondernemingen

GPT‑5.5 zette een nieuwe state-of-the-art neer op OfficeQA Pro, de benchmark van Databricks voor complexe agenttaken in ondernemingen.

Hero-afbeelding van het klantverhaal van Databricks.
Grootte van de onderneming: Enterprise
Regio: Noord-Amerika
Sector: Technologie
Producten: Codex

50%

Nauwkeurigheid op de OfficeQA Pro-benchmark (state-of-the-art)

46%

Minder fouten op de OfficeQA Pro-benchmark vergeleken met GPT-5.4

Bezig met laden...

Databricks maakt GPT‑5.5 beschikbaar voor agentworkflows van klanten nadat het model een nieuwe state-of-the-art neerzette op OfficeQA Pro, de benchmark van het bedrijf voor complexe documenttaken in ondernemingen.

OfficeQA Pro beoordeelt hoe modellen omgaan met parsing, retrieval en gegronde redenering in workflows met gescande pdf's, legacybestanden en documenten met lange context, taken waarop productie-agentsystemen vaak vastlopen.

In de agent-harness-setting verminderde GPT‑5.5 het aantal fouten met 46% vergeleken met GPT‑5.4 en werd het het eerste model dat meer dan 50% nauwkeurigheid behaalde op OfficeQA Pro.

'Codex met 5.5 is nu state-of-the-art onder alle agents en modellen die er zijn.'
–Arnav Singhvi, Research Engineer

SOTA-prestaties op OfficeQA Pro

OfficeQA Pro bevat grote aantallen gescande of verouderde ondernemingsdocumenten, waarbij kleine extractiefouten tijdens het parsen zich verderop in de rest van de workflow kunnen opstapelen. 'Zodra je een bepaald cijfer of getal niet kunt extraheren, verandert dat het hele verloop van waar de agent mee werkt', legt Singhvi uit.

Databricks zag de grootste winst van GPT‑5.5 in deze parsing-zware workflows. 'Eerdere modellen zoals 5.4 konden niet alle cijfers correct parsen, maar het lijkt erop dat 5.5 een sprongsgewijze verbetering biedt bij het parsen van oudere documenten en gescande pdf's', zegt Singhvi.

Het team zag ook verbeteringen in de orkestratie van meerstapstaken. 'Iets wat we bij 5.4 zagen, is dat het soms onnodige zoekomwegen maakte, en dat leidde tot erg inefficiënte trajecten', zegt Singhvi.

Vergeleken met eerdere modellen was GPT‑5.5 betrouwbaarder in het ophalen van relevante context en het voltooien van complexe workflows zonder extra toezicht.

GPT‑5.5 naar productieworkflows brengen

Databricks maakt GPT‑5.5 nu beschikbaar via AI Unity Gateway, waar klanten het model gebruiken in workflows die zijn gebouwd met AgentBricks en de Agent Supervisor API. In deze systemen orkestreert GPT‑5.5 parsing, retrieval en uitvoering over gespecialiseerde agents heen.

'We gaan veel klanten zien die AgentBricks en de Agent Supervisor API gebruiken voor aangepaste agentworkflows', zegt Singhvi. 'Dat GPT‑5.5 deze workflows aanstuurt, is echt heel spannend.'

'GPT-5.5 is geweldig geweest als het gaat om kenniswinst. Het is een sprongsgewijze verandering in hoe we kenniswerk doen.'
—Arnav Singhvi, Research Engineer

Stap in het nieuwe tijdperk van werk

Meer dan 1 miljoen bedrijven wereldwijd boeken betekenisvolle resultaten met OpenAI.