Databricks GPT‑5.5‑ті кәсіпорын агент жұмыс ағындарына әкеледі
GPT‑5.5 күрделі кәсіпорын агент тапсырмаларына арналған Databricks бенчмаркі OfficeQA Pro-да жаңа ең озық нәтижені көрсетті.

50%
OfficeQA Pro бенчмаркіндегі дәлдік (ең озық деңгей)
46%
OfficeQA Pro бенчмаркіндегі қателердің GPT-5.4-пен салыстырғандағы азаюы
Databricks GPT‑5.5‑ті клиенттердің агент жұмыс ағындары үшін қолжетімді етіп отыр, себебі бұл модель күрделі кәсіпорын құжат тапсырмаларына арналған компания бенчмаркі OfficeQA Pro-да жаңа ең озық нәтижені көрсетті.
OfficeQA Pro сканерленген PDF файлдары, ескі файлдар және ұзын контексті құжаттар қамтылған жұмыс ағындарында модельдердің талдау, іздеп табу және негізделген ой қорыту міндеттерін қалай орындайтынын бағалайды; мұндай тапсырмалар өндірістегі агент жүйелерін жиі бұзады.
Agent-harness жағдайында GPT‑5.5 GPT‑5.4‑пен салыстырғанда қателерді 46%-ға азайтып, OfficeQA Pro-да 50% дәлдіктен асқан алғашқы модель болды.
«5.5-пен жұмыс істейтін Codex қазір қолданыстағы барлық агенттер мен модельдердің ішіндегі ең озық деңгейге жетті.»
OfficeQA Pro құрамына сканерленген немесе ескі кәсіпорын құжаттарының көп саны кіреді, мұнда талдау кезіндегі шағын шығарып алу қателері жұмыс ағынының қалған бөлігіне тізбектеле таралуы мүмкін. «Белгілі бір цифрды не санды шығарып ала алмасаңыз, бұл агент жұмыс істейтін нәрсенің бүкіл бағытын өзгертеді», — деп түсіндіреді Singhvi.
Databricks GPT‑5.5‑тен ең үлкен өсімді дәл осы талдауға көп сүйенетін жұмыс ағындарында байқады. «5.4 сияқты ертеректегі модельдер барлық цифрларды дұрыс талдай алмады, бірақ 5.5 ескі құжаттар мен сканерленген PDF файлдарын талдауда адымдық серпіліс берген сияқты», — дейді Singhvi.
Команда сондай-ақ көпқадамды тапсырмалардағы оркестрацияның жақсарғанын байқады. «5.4-пен байқаған бір нәрсе — кейде ол қажетсіз іздеу айналма жолдарына кетіп қалатын, ал бұл өте тиімсіз траекторияларға әкелетін», — дейді Singhvi.
Ертеректегі модельдермен салыстырғанда, GPT‑5.5 тиісті контексті табуда және қосымша қадағалаусыз күрделі жұмыс ағындарын аяқтауда сенімдірек болды.
Databricks енді GPT‑5.5‑ті AI Unity Gateway арқылы қолжетімді етеді, мұнда клиенттер модельді AgentBricks және Agent Supervisor API көмегімен құрылған жұмыс ағындарының ішінде пайдаланады. Бұл жүйелерде GPT‑5.5 мамандандырылған агенттер арасында талдауды, іздеп табуды және орындауды оркестрлейді.
«Көптеген клиенттердің арнайы агент жұмыс ағындары үшін AgentBricks пен Agent Supervisor API қолданатынын көреміз», — дейді Singhvi. «GPT‑5.5‑тің осы жұмыс ағындарын қадағалауы шынымен де қызықты.»
«GPT-5.5 зияткерлік жұмыстың сапасын арттыру тұрғысынан өте жақсы нәтиже көрсетті. Бұл біз үшін зияткерлік жұмысты орындауда сапалық секіріс болды.»


