Gå til hovedindhold
OpenAI

15. maj 2026

Databricks bringer GPT‑5.5 til agent-workflows i virksomheder

GPT‑5.5 satte en ny state of the art på OfficeQA Pro, Databricks' benchmark for komplekse agent-opgaver i virksomheder.

Hero-billede til Databricks' kundehistorie.
Virksomhedsstørrelse: Enterprise
Region: Nordamerika
Branche: Teknologi
Produkter: Codex

50%

Nøjagtighed på OfficeQA Pro-benchmarken (state of the art)

46%

Reduktion i fejl på OfficeQA Pro-benchmarken vs. GPT-5.4

Indlæser ...

Databricks gør GPT‑5.5 tilgængelig til kunde-agent-workflows, efter at modellen satte en ny state of the art på OfficeQA Pro, virksomhedens benchmark for komplekse dokumentopgaver i virksomheder.

OfficeQA Pro evaluerer, hvordan modeller håndterer parsing, hentning og forankret ræsonnering på tværs af workflows med scannede PDF'er, ældre filer og dokumenter med lang kontekst, opgaver som ofte får agent-systemer i produktion til at bryde sammen.

I agent-harness-opsætningen reducerede GPT‑5.5 fejl med 46 % sammenlignet med GPT‑5.4 og blev den første model, der kom over 50 % nøjagtighed på OfficeQA Pro.

„Codex med 5.5 er nu state of the art blandt alle de agenter og modeller, der findes.“
–Arnav Singhvi, forskningsingeniør

SOTA-ydeevne på OfficeQA Pro

OfficeQA Pro omfatter store mængder scannede eller ældre virksomheds-dokumenter, hvor små udtræksfejl under parsing kan forplante sig nedstrøms gennem resten af workflowet. „Når man ikke kan udtrække et bestemt ciffer eller tal, ændrer det hele forløbet for det, agenten arbejder med,“ forklarer Singhvi.

Databricks så de største gevinster fra GPT‑5.5 i disse parsing-tunge workflows. „Tidligere modeller som 5.4 kunne ikke parse alle cifrene korrekt, men det ser ud til, at 5.5 giver et markant løft i parsing af ældre dokumenter og scannede PDF'er,“ siger Singhvi.

Teamet så også forbedringer i orkestrering på tværs af opgaver i flere trin. „En ting, vi så med 5.4, var, at den nogle gange tog unødvendige omveje i søgningen, og det gav meget ineffektive forløb,“ siger Singhvi.

Sammenlignet med tidligere modeller var GPT‑5.5 mere pålidelig til at hente relevant kontekst og fuldføre komplekse workflows uden ekstra overvågning.

At bringe GPT‑5.5 ind i produktions-workflows

Databricks gør nu GPT‑5.5 tilgængelig gennem AI Unity Gateway, hvor kunder bruger modellen i workflows bygget med AgentBricks og Agent Supervisor API. I disse systemer orkestrerer GPT‑5.5 parsing, hentning og eksekvering på tværs af specialiserede agenter.

„Vi kommer til at se mange kunder bruge AgentBricks og Agent Supervisor API til tilpassede agent-workflows,“ siger Singhvi. „At have GPT‑5.5 til at overvåge disse workflows er virkelig spændende.“

„GPT-5.5 har været fantastisk, når det gælder vidensløft. Det er en trinvis funktionsændring i forhold til at udføre vidensarbejde for os.“
—Arnav Singhvi, forskningsingeniør

Bliv en del af den nye arbejdsæra

Mere end 1 million virksomheder verden over opnår meningsfulde resultater med OpenAI.