Przejdź do treści głównej
OpenAI

15 maja 2026

Databricks wprowadza GPT‑5.5 do firmowych przepływów agentów

GPT‑5.5 ustanowił nowy najlepszy wynik w OfficeQA Pro, benchmarku Databricks dla złożonych firmowych zadań agentów.

Główny obraz historii klienta Databricks.
Rozmiar przedsiębiorstwa: Korporacja
Region: Ameryka Północna
Branża: Technologia
Produkty: Codex

50%

Dokładność w benchmarku OfficeQA Pro (najlepsza w swojej klasie)

46%

Zmniejszenie liczby błędów w benchmarku OfficeQA Pro względem GPT-5.4

Ładowanie…

Databricks udostępnia GPT‑5.5 do przepływów pracy agentów klientów po tym, jak model ustanowił nowy najlepszy wynik w OfficeQA Pro, benchmarku firmy dla złożonych zadań na dokumentach firmowych.

OfficeQA Pro ocenia, jak modele radzą sobie z parsowaniem, wyszukiwaniem i rozumowaniem opartym na źródłach w przepływach obejmujących skanowane PDF-y, starsze pliki i dokumenty o długim kontekście — zadania, które często psują produkcyjne systemy agentów.

W środowisku agent-harness GPT‑5.5 zmniejszył liczbę błędów o 46% względem GPT‑5.4 i został pierwszym modelem, który przekroczył 50% dokładności w OfficeQA Pro.

„Codex z 5.5 jest teraz najlepszy w swojej klasie spośród wszystkich dostępnych agentów i modeli.”
–Arnav Singhvi, inżynier badawczy

Wynik SOTA w OfficeQA Pro

OfficeQA Pro obejmuje dużą liczbę skanowanych lub starszych dokumentów firmowych, gdzie drobne błędy ekstrakcji podczas parsowania mogą kaskadowo wpływać na dalszą część przepływu pracy. „Gdy nie da się wyodrębnić konkretnej cyfry lub liczby, zmienia to całą trajektorię tego, z czym pracuje agent” — wyjaśnia Singhvi.

Databricks odnotował największe korzyści z GPT‑5.5 właśnie w tych przepływach opartych głównie na parsowaniu. „Wcześniejsze modele, takie jak 5.4, nie potrafiły poprawnie sparsować wszystkich cyfr, ale wygląda na to, że 5.5 daje skokową poprawę w parsowaniu starszych dokumentów i skanowanych PDF-ów” — mówi Singhvi.

Zespół zauważył też poprawę w orkiestracji zadań wieloetapowych. „Jedną z rzeczy, które widzieliśmy w 5.4, było to, że czasem wpadał w niepotrzebne objazdy wyszukiwania, a to prowadziło do bardzo nieefektywnych trajektorii” — mówi Singhvi.

W porównaniu z wcześniejszymi modelami GPT‑5.5 był bardziej niezawodny w wyszukiwaniu trafnego kontekstu i realizowaniu złożonych przepływów pracy bez dodatkowego nadzoru.

Wdrażanie GPT‑5.5 do produkcyjnych przepływów pracy

Databricks udostępnia teraz GPT‑5.5 przez AI Unity Gateway, gdzie klienci używają modelu w przepływach zbudowanych z AgentBricks i Agent Supervisor API. W tych systemach GPT‑5.5 orkiestruje parsowanie, wyszukiwanie i wykonywanie zadań między wyspecjalizowanymi agentami.

„Zobaczymy wielu klientów korzystających z AgentBricks i Agent Supervisor API do niestandardowych przepływów pracy agentów” — mówi Singhvi. „To naprawdę ekscytujące, że GPT‑5.5 nadzoruje te przepływy pracy.”

„GPT-5.5 świetnie się sprawdza pod względem wzrostu wiedzy. To skokowa zmiana, jeśli chodzi o wykonywanie dla nas pracy opartej na wiedzy.”
—Arnav Singhvi, inżynier badawczy

Dołącz do nowej ery pracy

Ponad 1 milion firm na całym świecie osiąga znaczące wyniki z OpenAI.