Gå direkt till huvudinnehåll
OpenAI

15 maj 2026

Databricks tar GPT‑5.5 till Agent-arbetsflöden för företag

GPT‑5.5 satte en ny standard på OfficeQA Pro, Databricks riktmärke för komplexa Agent-uppgifter i företag.

Huvudbild för Databricks kundberättelse.
Företagets storlek: Enterprise
Region: Nordamerika
Bransch: Teknik
Produkter: Codex

50%

Träffsäkerhet i OfficeQA Pro-riktmärket (bäst i klassen)

46%

Minskning av fel i OfficeQA Pro-riktmärket jämfört med GPT-5.4

Laddar …

Databricks gör GPT‑5.5 tillgängligt för kunders Agent-arbetsflöden efter att Modellen satt en ny standard på OfficeQA Pro, företagets riktmärke för komplexa dokumentuppgifter i företag.

OfficeQA Pro utvärderar hur Modeller hanterar parsning, hämtning och grundat Resonemang i arbetsflöden med skannade PDF:er, äldre filer och dokument med lång kontext, uppgifter som ofta knäcker Agent-system i produktion.

I agent-harness-miljön minskade GPT‑5.5 felen med 46 % jämfört med GPT‑5.4 och blev den första Modellen som översteg 50 % träffsäkerhet på OfficeQA Pro.

”Codex med 5.5 är nu bäst i klassen bland alla Agent-system och Modeller där ute.”
–Arnav Singhvi, forskningsingenjör

SOTA-prestanda på OfficeQA Pro

OfficeQA Pro innehåller stora mängder skannade eller äldre företagsdokument, där små extraktionsfel under parsning kan fortplanta sig nedströms genom resten av arbetsflödet. ”När du inte kan extrahera en viss siffra eller ett visst tal förändrar det hela banan för det Agenten arbetar med”, förklarar Singhvi.

Databricks såg de största förbättringarna från GPT‑5.5 i dessa parsningstunga arbetsflöden. ”Tidigare Modeller som 5.4 kunde inte tolka alla siffror korrekt, men det verkar som att 5.5 ger ett stegfunktionslyft i parsning av äldre dokument och skannade PDF:er”, säger Singhvi.

Teamet såg också förbättringar i orkestrering över uppgifter i flera steg. ”En sak vi såg med 5.4 var att den ibland gjorde onödiga sökomvägar, och det ledde till mycket ineffektiva banor”, säger Singhvi.

Jämfört med tidigare Modeller var GPT‑5.5 mer tillförlitlig när det gällde att hämta relevant kontext och slutföra komplexa arbetsflöden utan extra övervakning.

Att ta in GPT‑5.5 i produktionsarbetsflöden

Databricks gör nu GPT‑5.5 tillgängligt via AI Unity Gateway, där kunder använder Modellen i arbetsflöden byggda med AgentBricks och Agent Supervisor API. I dessa system orkestrerar GPT‑5.5 parsning, hämtning och körning mellan specialiserade Agenter.

”Vi kommer att se många kunder använda AgentBricks och Agent Supervisor API för anpassade Agent-arbetsflöden”, säger Singhvi. ”Att ha GPT‑5.5 som övervakar dessa arbetsflöden är verkligen spännande.”

”GPT-5.5 har varit fantastiskt när det gäller kunskapslyft. Det är en stegvis funktionsförändring för vårt kunskapsarbete.”
—Arnav Singhvi, forskningsingenjör

Bli en del av den nya eran av arbete

Mer än 1 miljon företag världen runt uppnår meningsfulla resultat med OpenAI.