2026 ж. 15 мамыр

Databricks GPT‑5.5‑ті кәсіпорын агент жұмыс ағындарына әкеледі

GPT‑5.5 күрделі кәсіпорын агент тапсырмаларына арналған Databricks бенчмаркі OfficeQA Pro-да жаңа ең озық нәтижені көрсетті.

Сатылым бөліміне хабарласу

Databricks клиент оқиғасының негізгі суреті.

Компания көлемі: Корпоративтік

Аймақ: Солтүстік Америка

Сала: Технология

Өнімдер: Codex

50%

OfficeQA Pro бенчмаркіндегі дәлдік (ең озық деңгей)

46%

OfficeQA Pro бенчмаркіндегі қателердің GPT-5.4-пен салыстырғандағы азаюы

Жүктелуде…

Databricks GPT‑5.5‑ті клиенттердің агент жұмыс ағындары үшін қолжетімді етіп отыр, себебі бұл модель күрделі кәсіпорын құжат тапсырмаларына арналған компания бенчмаркі OfficeQA Pro-да жаңа ең озық нәтижені көрсетті.

OfficeQA Pro сканерленген PDF файлдары, ескі файлдар және ұзын контексті құжаттар қамтылған жұмыс ағындарында модельдердің талдау, іздеп табу және негізделген ой қорыту міндеттерін қалай орындайтынын бағалайды; мұндай тапсырмалар өндірістегі агент жүйелерін жиі бұзады.

Agent-harness жағдайында GPT‑5.5 GPT‑5.4‑пен салыстырғанда қателерді 46%-ға азайтып, OfficeQA Pro-да 50% дәлдіктен асқан алғашқы модель болды.

«5.5-пен жұмыс істейтін Codex қазір қолданыстағы барлық агенттер мен модельдердің ішіндегі ең озық деңгейге жетті.»

— Арнав Сингхви, зерттеу инженері

OfficeQA Pro-дағы SOTA өнімділігі

OfficeQA Pro құрамына сканерленген немесе ескі кәсіпорын құжаттарының көп саны кіреді, мұнда талдау кезіндегі шағын шығарып алу қателері жұмыс ағынының қалған бөлігіне тізбектеле таралуы мүмкін. «Белгілі бір цифрды не санды шығарып ала алмасаңыз, бұл агент жұмыс істейтін нәрсенің бүкіл бағытын өзгертеді», — деп түсіндіреді Singhvi.

Databricks GPT‑5.5‑тен ең үлкен өсімді дәл осы талдауға көп сүйенетін жұмыс ағындарында байқады. «5.4 сияқты ертеректегі модельдер барлық цифрларды дұрыс талдай алмады, бірақ 5.5 ескі құжаттар мен сканерленген PDF файлдарын талдауда адымдық серпіліс берген сияқты», — дейді Singhvi.

Команда сондай-ақ көпқадамды тапсырмалардағы оркестрацияның жақсарғанын байқады. «5.4-пен байқаған бір нәрсе — кейде ол қажетсіз іздеу айналма жолдарына кетіп қалатын, ал бұл өте тиімсіз траекторияларға әкелетін», — дейді Singhvi.

Ертеректегі модельдермен салыстырғанда, GPT‑5.5 тиісті контексті табуда және қосымша қадағалаусыз күрделі жұмыс ағындарын аяқтауда сенімдірек болды.

GPT‑5.5‑ті өндірістік жұмыс ағындарына енгізу

Databricks енді GPT‑5.5‑ті AI Unity Gateway арқылы қолжетімді етеді, мұнда клиенттер модельді AgentBricks және Agent Supervisor API көмегімен құрылған жұмыс ағындарының ішінде пайдаланады. Бұл жүйелерде GPT‑5.5 мамандандырылған агенттер арасында талдауды, іздеп табуды және орындауды оркестрлейді.

«Көптеген клиенттердің арнайы агент жұмыс ағындары үшін AgentBricks пен Agent Supervisor API қолданатынын көреміз», — дейді Singhvi. «GPT‑5.5‑тің осы жұмыс ағындарын қадағалауы шынымен де қызықты.»

«GPT-5.5 зияткерлік жұмыстың сапасын арттыру тұрғысынан өте жақсы нәтиже көрсетті. Бұл біз үшін зияткерлік жұмысты орындауда сапалық секіріс болды.»

— Арнав Сингхви, зерттеу инженері

Жұмыстың жаңа дәуіріне қосылыңыз

Дүние жүзіндегі 1 миллионнан астам бизнес OpenAI көмегімен елеулі нәтижелерге қол жеткізіп жатыр.

Сату бөліміне хабарласыңыз

Оқуды жалғастырыңыз

How agents are transforming work

Компания2026 ж. 25 мау.

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

Компания2026 ж. 24 мау.

Helping build shared standards for advanced AI - card image

Озық ЖИ үшін ортақ стандарттар құруға көмектесу

Жаһандық мәселелер2026 ж. 23 мау.