Databricks-ը GPT‑5.5‑ը բերում է ձեռնարկության ագենտային հոսքեր
GPT‑5.5‑ը նոր առաջատար արդյունք գրանցեց OfficeQA Pro-ում՝ Databricks-ի հենանիշում բարդ ձեռնարկատիրական ագենտային առաջադրանքների համար։

50%
Ճշգրտություն OfficeQA Pro բենչմարքում (լավագույն արդյունք)
46%
Սխալների նվազում OfficeQA Pro բենչմարքում՝ համեմատած GPT-5.4-ի հետ
Databricks-ը GPT‑5.5‑ը հասանելի է դարձնում հաճախորդների ագենտային աշխատահոսքերի համար այն բանից հետո, երբ մոդելը OfficeQA Pro հենանիշում գրանցեց լավագույն արդյունքը բարդ ձեռնարկատիրական փաստաթղթերի մշակման առաջադրանքներում։
OfficeQA Pro-ն գնահատում է, թե մոդելներն ինչպես են հաղթահարում վերլուծումը, որոնումն ու փաստարկված հիմնավորումը այնպիսի աշխատանքային հոսքերում, որոնք ներառում են սկանավորված PDF-ներ, հին ֆայլեր և մեծ համատեքստով փաստաթղթեր․ սրանք այն առաջադրանքներն են, որոնք հաճախ խնդիրներ են առաջացնում արտադրական ագենտային համակարգերում։
Ագենտ-harness միջավայրում GPT‑5.5‑ը GPT‑5.4‑ի համեմատ նվազեցրեց սխալները 46%-ով և դարձավ առաջին մոդելը, որը գերազանցեց 50% ճշգրտությունը OfficeQA Pro հենանիշում։
«5.5-ով Codex-ն այժմ լավագույն մակարդակի վրա է բոլոր առկա ագենտների և մոդելների շարքում»։
OfficeQA Pro-ն ներառում է բազմաթիվ սկանավորված և հին կորպորատիվ փաստաթղթեր, որտեղ մշակման ընթացքում առաջացած տվյալների դուրսբերման փոքր սխալները կարող են հետագայում շղթայական խնդիրներ առաջացնել ամբողջ աշխատանքային հոսքում։ «Բավական է, որ որևէ թիվ սխալ դուրս բերվի կամ չճանաչվի, և դա կարող է ամբողջությամբ փոխել ագենտի աշխատանքի հետագա ընթացքը», բացատրում է Սինգվին։
Databricks-ը GPT‑5.5‑ից ամենամեծ առաջընթացը նկատեց հենց այն աշխատանքային հոսքերում, որոնք մեծապես հիմնված են parsing-ի վրա։ «Ավելի վաղ մոդելները, օրինակ՝ 5.4-ը, չէին կարողանում բոլոր թվանշանները ճիշտ վերլուծել, բայց թվում է, որ 5.5-ը կտրուկ առաջընթաց է ապահովել հին փաստաթղթերի և սկանավորված PDF-ների վերլուծության մեջ», ասում է Սինգվին։
Թիմը նաև նկատեց բարելավումներ բազմաքայլ առաջադրանքների կառավարման և համակարգման մեջ: «5.4-ի հետ մեր նկատած խնդիրներից մեկն այն էր, որ մոդելը երբեմն անցնում էր ավելորդ որոնողական շրջանցումների, և արդյունքում առաջանում էին շատ անարդյունավետ գործողությունների շղթաներ», ասում է Սինգվին։
Ավելի վաղ մոդելների համեմատ GPT‑5.5‑ն ավելի հուսալի էր համապատասխան համատեքստի առբերման և բարդ աշխատանքային հոսքերի՝ առանց լրացուցիչ վերահսկողության ավարտման գործում:
Databricks-ն այժմ GPT‑5.5‑ը հասանելի է դարձնում AI Unity Gateway-ի միջոցով, որտեղ հաճախորդները մոդելն օգտագործում են AgentBricks-ով և Agent Supervisor API-ով կառուցված հոսքերում։ Այս համակարգերում GPT‑5.5‑ը կազմակերպում է վերլուծումը, որոնումը և կատարումը մասնագիտացված ագենտների միջև։
«Մենք տեսնելու ենք, որ շատ հաճախորդներ հարմարեցված ագենտային հոսքերի համար օգտագործում են AgentBricks-ը և Agent Supervisor API-ն», ասում է Սինգվին։ «Իսկապես ոգևորիչ է, որ GPT‑5.5‑ը վերահսկում է այս հոսքերը»։
«GPT-5.5-ը հիանալի է եղել գիտելիքի աճի առումով։ «Սա մեզ համար գիտելիքային աշխատանքի արդյունավետության մեջ արմատական առաջընթաց է»։


