Databricks ievieš GPT‑5.5 uzņēmumu aģentu darbplūsmās
GPT‑5.5 sasniedza jaunu labāko rezultātu nozarē OfficeQA Pro, Databricks etalonā sarežģītiem uzņēmumu aģentu uzdevumiem.

50%
Precizitāte OfficeQA Pro etalonā (labākais rezultāts nozarē)
46%
Kļūdu samazinājums OfficeQA Pro etalonā salīdzinājumā ar GPT-5.4
Databricks padara GPT‑5.5 pieejamu klientu aģentu darbplūsmām pēc tam, kad modelis OfficeQA Pro, uzņēmuma etalonā sarežģītiem uzņēmumu dokumentu uzdevumiem, sasniedza jaunu labāko rezultātu nozarē.
OfficeQA Pro novērtē, kā modeļi tiek galā ar parsēšanu, izgūšanu un pamatotu spriestspēju darbplūsmās ar skenētiem PDF, mantotajiem failiem un gara konteksta dokumentiem, uzdevumiem, kas bieži izjauc produkcijas aģentu sistēmas.
Aģentu testēšanas vidē GPT‑5.5 samazināja kļūdas par 46% salīdzinājumā ar GPT‑5.4 un kļuva par pirmo modeli, kas OfficeQA Pro pārsniedza 50% precizitāti.
"Codex ar 5.5 tagad ir modernākais risinājums starp visiem pieejamajiem aģentiem un modeļiem."
OfficeQA Pro ietver lielu skaitu skenētu vai mantotu uzņēmumu dokumentu, kuros nelielas izvilkšanas kļūdas parsēšanas laikā var ķēdes veidā ietekmēt pārējo darbplūsmu. "Tiklīdz neizdodas izvilkt noteiktu ciparu vai skaitli, tas pilnībā maina to, ar ko aģents strādā," skaidro Singhvi.
Databricks vislielāko ieguvumu no GPT‑5.5 novēroja tieši šajās parsēšanā intensīvajās darbplūsmās. "Iepriekšējie modeļi, piemēram, 5.4, nespēja pareizi parsēt visus ciparus, bet šķiet, ka 5.5 nodrošina lēcienveida uzlabojumu vecāku dokumentu un skenētu PDF parsēšanā," saka Singhvi.
Komanda novēroja arī uzlabojumus orķestrācijā daudzsoļu uzdevumos. "Viena lieta, ko redzējām ar 5.4, bija tāda, ka tas dažkārt devās nevajadzīgos meklēšanas līkločos, un tas radīja ļoti neefektīvas trajektorijas," saka Singhvi.
Salīdzinājumā ar iepriekšējiem modeļiem GPT‑5.5 uzticamāk izgūst atbilstošu kontekstu un pabeidz sarežģītas darbplūsmas bez papildu uzraudzības.
Databricks tagad padara GPT‑5.5 pieejamu caur AI Unity Gateway, kur klienti izmanto modeli darbplūsmās, kas veidotas ar AgentBricks un Agent Supervisor API. Šajās sistēmās GPT‑5.5 koordinē parsēšanu, izgūšanu un izpildi starp specializētiem aģentiem.
"Mēs redzēsim daudz klientu, kas pielāgotām aģentu darbplūsmām izmantos AgentBricks un Agent Supervisor API," saka Singhvi. "Tas, ka GPT‑5.5 uzrauga šīs darbplūsmas, ir patiešām aizraujoši."
"GPT-5.5 ir bijis lielisks zināšanu pieauguma ziņā. Mums tas ir lēcienveida uzlabojums zināšanu darba veikšanā."


