Databricks tar GPT‑5.5 till Agent-arbetsflöden för företag
GPT‑5.5 satte en ny standard på OfficeQA Pro, Databricks riktmärke för komplexa Agent-uppgifter i företag.

50%
Träffsäkerhet i OfficeQA Pro-riktmärket (bäst i klassen)
46%
Minskning av fel i OfficeQA Pro-riktmärket jämfört med GPT-5.4
Databricks gör GPT‑5.5 tillgängligt för kunders Agent-arbetsflöden efter att Modellen satt en ny standard på OfficeQA Pro, företagets riktmärke för komplexa dokumentuppgifter i företag.
OfficeQA Pro utvärderar hur Modeller hanterar parsning, hämtning och grundat Resonemang i arbetsflöden med skannade PDF:er, äldre filer och dokument med lång kontext, uppgifter som ofta knäcker Agent-system i produktion.
I agent-harness-miljön minskade GPT‑5.5 felen med 46 % jämfört med GPT‑5.4 och blev den första Modellen som översteg 50 % träffsäkerhet på OfficeQA Pro.
”Codex med 5.5 är nu bäst i klassen bland alla Agent-system och Modeller där ute.”
OfficeQA Pro innehåller stora mängder skannade eller äldre företagsdokument, där små extraktionsfel under parsning kan fortplanta sig nedströms genom resten av arbetsflödet. ”När du inte kan extrahera en viss siffra eller ett visst tal förändrar det hela banan för det Agenten arbetar med”, förklarar Singhvi.
Databricks såg de största förbättringarna från GPT‑5.5 i dessa parsningstunga arbetsflöden. ”Tidigare Modeller som 5.4 kunde inte tolka alla siffror korrekt, men det verkar som att 5.5 ger ett stegfunktionslyft i parsning av äldre dokument och skannade PDF:er”, säger Singhvi.
Teamet såg också förbättringar i orkestrering över uppgifter i flera steg. ”En sak vi såg med 5.4 var att den ibland gjorde onödiga sökomvägar, och det ledde till mycket ineffektiva banor”, säger Singhvi.
Jämfört med tidigare Modeller var GPT‑5.5 mer tillförlitlig när det gällde att hämta relevant kontext och slutföra komplexa arbetsflöden utan extra övervakning.
Databricks gör nu GPT‑5.5 tillgängligt via AI Unity Gateway, där kunder använder Modellen i arbetsflöden byggda med AgentBricks och Agent Supervisor API. I dessa system orkestrerar GPT‑5.5 parsning, hämtning och körning mellan specialiserade Agenter.
”Vi kommer att se många kunder använda AgentBricks och Agent Supervisor API för anpassade Agent-arbetsflöden”, säger Singhvi. ”Att ha GPT‑5.5 som övervakar dessa arbetsflöden är verkligen spännande.”
”GPT-5.5 har varit fantastiskt när det gäller kunskapslyft. Det är en stegvis funktionsförändring för vårt kunskapsarbete.”


