Hopp til hovedinnhold
OpenAI

15. mai 2026

Databricks fører GPT‑5.5 til agentarbeidsflyter for bedrifter

GPT‑5.5 satte et nytt toppnivå (state of the art) på OfficeQA Pro, Databricks' benchmark for komplekse agentoppgaver i bedrifter.

Hovedbilde for Databricks-kundehistorie.
Bedriftsstørrelse: Enterprise
Region: Nord-Amerika
Bransje: Teknologi
Produkter: Codex

50%

Nøyaktighet på OfficeQA Pro-benchmarken (state of the art)

46%

Reduksjon i feil på OfficeQA Pro-benchmarken sammenlignet med GPT-5.4

Laster inn …

Databricks gjør GPT‑5.5 tilgjengelig for agentarbeidsflyter hos kunder etter at modellen har etablert et nytt toppnivå (state of the art) på OfficeQA Pro, selskapets benchmark for komplekse dokumentoppgaver i bedrifter.

OfficeQA Pro evaluerer hvordan modeller håndterer parsing, henting og forankret resonnering på tvers av arbeidsflyter med skannede PDF-er, eldre filer og dokumenter med lang kontekst, oppgaver som ofte får agentsystemer i produksjon til å svikte.

I oppsettet med agentrammeverk reduserte GPT‑5.5 feil med 46 % sammenlignet med GPT‑5.4 og ble den første modellen som passerte 50 % nøyaktighet på OfficeQA Pro.

«Codex med 5.5 er nå state of the art blant alle agentene og modellene der ute.»
–Arnav Singhvi, forskningsingeniør

SOTA-ytelse på OfficeQA Pro

OfficeQA Pro omfatter store mengder skannede eller eldre bedriftsdokumenter, der små uttrekksfeil under parsing kan forplante seg videre gjennom resten av arbeidsflyten. «Når du ikke klarer å hente ut et bestemt siffer eller tall, endrer det hele forløpet for det agenten jobber med», forklarer Singhvi.

Databricks så de største gevinstene fra GPT‑5.5 i disse arbeidsflytene med mye parsing. «Tidligere modeller som 5.4 klarte ikke å parse alle sifrene riktig, men det virker som om 5.5 har gitt et sprangvis løft i parsing av eldre dokumenter og skannede PDF-er», sier Singhvi.

Teamet så også forbedringer i orkestrering på tvers av oppgaver med flere trinn. «Én ting vi så med 5.4, var at den noen ganger tok disse unødvendige søkeomveiene, og det førte til svært ineffektive forløp», sier Singhvi.

Sammenlignet med tidligere modeller var GPT‑5.5 mer pålitelig når det gjaldt å hente relevant kontekst og fullføre komplekse arbeidsflyter uten ekstra tilsyn.

Å ta GPT‑5.5 i bruk i produksjonsarbeidsflyter

Databricks gjør nå GPT‑5.5 tilgjengelig gjennom AI Unity Gateway, der kunder bruker modellen i arbeidsflyter bygget med AgentBricks og Agent Supervisor API. I disse systemene orkestrerer GPT‑5.5 parsing, henting og utførelse på tvers av spesialiserte agenter.

«Vi kommer til å se mange kunder bruke AgentBricks og Agent Supervisor API til tilpassede agentarbeidsflyter», sier Singhvi. «Å ha GPT‑5.5 til å overvåke disse arbeidsflytene er virkelig spennende.»

«GPT-5.5 har vært svært bra når det gjelder kunnskapsløft. Det er en sprangvis endring i hvor godt det utfører kunnskapsarbeid for oss.»
—Arnav Singhvi, forskningsingeniør

Bli med på den nye æraen i arbeidsliv

Mer enn 1 million virksomheter over hele verden oppnår meningsfulle resultater med OpenAI.