Databricks iġib GPT‑5.5 għall-flussi tax-xogħol ta’ aġenti
GPT‑5.5 stabbilixxa livell ġdid mill-aqwa fuq OfficeQA Pro, il-benchmark ta’ Databricks għal kompiti kumplessi ta’ aġenti għall-intrapriżi.

50%
Preċiżjoni fuq il-benchmark OfficeQA Pro (l-aqwa livell)
46%
Tnaqqis fl-iżbalji fuq il-benchmark OfficeQA Pro meta mqabbel ma’ GPT-5.4
Databricks qed jagħmel GPT‑5.5 disponibbli għall-flussi tax-xogħol ta’ aġenti tal-klijenti wara li l-mudell stabbilixxa livell ġdid mill-aqwa fuq OfficeQA Pro, il-benchmark tal-kumpanija għal kompiti kumplessi ta’ dokumenti tal-intrapriżi.
OfficeQA Pro jevalwa kif il-mudelli jimmaniġġjaw il-parsing, l-irkupru u r-raġunament ibbażat fuq evidenza f’diversi flussi tax-xogħol li jinvolvu PDFs skennjati, fajls antiki u dokumenti b’kuntest twil, kompiti li spiss ifixklu sistemi ta’ aġenti fil-produzzjoni.
Fl-ambjent agent-harness, GPT‑5.5 naqqas l-iżbalji b’46% meta mqabbel ma’ GPT‑5.4 u sar l-ewwel mudell li qabeż 50% preċiżjoni fuq OfficeQA Pro.
“Codex bil-5.5 issa huwa l-aqwa fost l-aġenti u l-mudelli kollha li hemm.”
OfficeQA Pro jinkludi għadd kbir ta’ dokumenti tal-intrapriżi skennjati jew antiki, fejn żbalji żgħar fl-estrazzjoni waqt il-parsing jistgħu jkomplu jinfirxu fil-bqija tal-fluss tax-xogħol. “Ladarba ma tkunx tista’ tiġbed ċerta ċifra jew numru, dan ibiddel it-trajettorja kollha ta’ dak li jaħdem bih l-aġent,” jispjega Singhvi.
Databricks ra l-akbar titjib minn GPT‑5.5 f’dawn il-flussi tax-xogħol b’enfasi qawwija fuq il-parsing. “Mudelli preċedenti bħall-5.4 ma kinux kapaċi janalizzaw iċ-ċifri kollha b’mod korrett, iżda jidher li l-5.5 għandu qabża kbira fil-parsing ta’ dokumenti antiki u PDFs skennjati,” jgħid Singhvi.
It-tim ra wkoll titjib fl-orkestrazzjoni tul kompiti b’diversi passi. “Ħaġa waħda li rajna bil-5.4 hi li xi drabi kien jidħol f’dawn id-devjazzjonijiet ta’ tfittxija bla bżonn, u dan kien jikkawża trajettorji ineffiċjenti ħafna,” jgħid Singhvi.
Meta mqabbel ma’ mudelli preċedenti, GPT‑5.5 kien aktar affidabbli fl-irkupru ta’ kuntest rilevanti u fit-tlestija ta’ flussi tax-xogħol kumplessi mingħajr superviżjoni addizzjonali.
Databricks issa jagħmel GPT‑5.5 disponibbli permezz ta’ AI Unity Gateway, fejn il-klijenti jużaw il-mudell ġewwa flussi tax-xogħol mibnija b’AgentBricks u l-Agent Supervisor API. F’dawn is-sistemi, GPT‑5.5 jorkestra l-parsing, l-irkupru u l-eżekuzzjoni bejn aġenti speċjalizzati.
“Se naraw ħafna klijenti jużaw AgentBricks u l-Agent Supervisor API għal flussi tax-xogħol ta’ aġenti personalizzati,” jgħid Singhvi. “Li GPT‑5.5 jissorvelja dawn il-flussi tax-xogħol huwa tassew eċċitanti.”
“GPT-5.5 kien eċċellenti f’termini ta’ żieda fl-għarfien. Hija bidla kbira ħafna f’termini ta’ xogħol tal-għarfien għalina.”


