Databricks tuo GPT‑5.5:n yritysten agenttityönkulkuihin
GPT‑5.5 saavutti uuden huipputason OfficeQA Prossa, Databricksin vertailussa monimutkaisille yritysten agenttitehtäville.

50%
Tarkkuus OfficeQA Pro -vertailussa (huipputaso)
46%
Virheiden väheneminen OfficeQA Pro -vertailussa verrattuna GPT-5.4:ään
Databricks tuo GPT‑5.5:n saataville asiakkaiden agenttityönkulkuihin sen jälkeen, kun malli saavutti uuden huipputason OfficeQA Prossa, yhtiön vertailussa monimutkaisille yritysdokumenttitehtäville.
OfficeQA Pro arvioi, kuinka mallit selviävät jäsennelystä, tiedonhausta ja kontekstipohjaisesta päättelystä työnkuluissa, joissa käsitellään skannattuja PDF-tiedostoja, vanhoja tiedostoja ja laajoja asiakirjoja – tehtäviä, jotka aiheuttavat usein ongelmia tuotantokäytössä oleville agenttijärjestelmille.
Agent-harness-asetelmassa GPT‑5.5 vähensi virheitä 46 % verrattuna GPT‑5.4:ään ja siitä tuli ensimmäinen malli, joka ylitti 50 %:n tarkkuuden OfficeQA Prossa.
”Codex 5.5:n kanssa on nyt huipputasoa kaikkien saatavilla olevien agenttien ja mallien joukossa.”
OfficeQA Pro sisältää suuren määrän skannattuja tai vanhoja yritysdokumentteja, joissa pienet poimintavirheet jäsentämisen aikana voivat kertautua työnkulun myöhemmissä vaiheissa. ”Kun et pysty poimimaan tiettyä numeroa tai lukua, se muuttaa koko sen kehityskulun, jonka kanssa agentti työskentelee”, Singhvi selittää.
Databricks näki suurimmat parannukset GPT‑5.5:stä näissä jäsentämispainotteisissa työnkuluissa. ”Aiemmat mallit, kuten 5.4, eivät pystyneet jäsentämään kaikkia numeroita oikein, mutta näyttää siltä, että 5.5 tuo askelmaisen parannuksen vanhempien dokumenttien ja skannattujen PDF-tiedostojen jäsentämiseen”, Singhvi sanoo.
Tiimi näki myös parannuksia orkestroinnissa monivaiheisissa tehtävissä. ”Yksi asia, jonka huomasimme versiossa 5.4, oli se, että järjestelmä saattoi toisinaan tehdä tarpeettomia hakukierroksia, mikä johti erittäin tehottomiin reitteihin”, Singhvi sanoo.
Aiempiin malleihin verrattuna GPT‑5.5 haki luotettavammin olennaisen kontekstin ja suoritti monimutkaiset työnkulut ilman lisävalvontaa.
Databricks tarjoaa nyt GPT‑5.5:n AI Unity Gatewayn kautta, jossa asiakkaat käyttävät mallia AgentBricksillä ja Agent Supervisor API:lla rakennetuissa työnkuluissa. Näissä järjestelmissä GPT‑5.5 orkestroi jäsentämisen, haun ja suorituksen erikoistuneiden agenttien välillä.
”Näemme paljon asiakkaita, jotka käyttävät AgentBricksiä ja Agent Supervisor API:a mukautettuihin agenttityönkulkuihin”, Singhvi sanoo. ”On todella innostavaa, että GPT‑5.5 valvoo näitä työnkulkuja.”
”GPT-5.5 on ollut erinomainen tiedollisen parannuksen kannalta. Se on ennennäkemätön teknologinen harppaus tietotyössämme.”


