15 mai 2026

Databricks aduce GPT‑5.5 în fluxurile enterprise cu agenți

GPT‑5.5 a stabilit un nou nivel de ultimă generație pe OfficeQA Pro, testul de performanță Databricks pentru sarcini complexe enterprise cu agenți.

Contactează vânzările

Imagine principală pentru povestea clientului Databricks.

Dimensiunea companiei: Enterprise

Regiune: America de Nord

Sector de activitate: Tehnologie

Produse: Codex

50%

Acuratețe pe testul de performanță OfficeQA Pro (de ultimă generație)

46%

Reducere a erorilor pe testul de performanță OfficeQA Pro față de GPT-5.4

Se încarcă…

Databricks pune GPT‑5.5 la dispoziție pentru fluxurile de lucru ale clienților cu agenți, după ce modelul a stabilit un nou nivel de ultimă generație pe OfficeQA Pro, testul de performanță al companiei pentru sarcini complexe pe documente enterprise.

OfficeQA Pro evaluează modul în care modelele gestionează analiza și extragerea informațiilor, regăsirea datelor și raționamentul bazat pe surse în fluxuri de lucru care implică PDF-uri scanate, fișiere vechi și documente cu context extins, sarcini care provoacă frecvent erori în sistemele de agenți utilizate în producție.

În mediul de testare pentru agenți AI, GPT‑5.5 a redus erorile cu 46% comparativ cu GPT‑5.4 și a devenit primul model care a depășit pragul de 50% acuratețe în OfficeQA Pro.

„Codex cu 5.5 este acum la cel mai înalt nivel actual dintre toți agenții și modelele existente.”

– Arnav Singhvi, inginer de cercetare

Performanță SOTA pe OfficeQA Pro

OfficeQA Pro include un număr mare de documente enterprise scanate sau vechi, în care erori minore de extragere a informațiilor apărute în etapa de analiză pot genera efecte în lanț pe parcursul întregului flux de lucru. „Odată ce nu mai poți extrage o anumită cifră sau un anumit număr, asta schimbă întreaga traiectorie a ceea ce procesează agentul”, explică Singhvi.

Databricks a observat cele mai semnificative îmbunătățiri de performanță cu GPT‑5.5 în aceste fluxuri de lucru bazate pe analizarea și extragerea informațiilor din documente. „Modelele anterioare, precum 5.4, nu reușeau să extragă corect toate cifrele, dar se pare că 5.5 aduce un salt semnificativ în extragerea datelor din documentele mai vechi și din PDF-urile scanate”, spune Singhvi.

Echipa a observat și îmbunătățiri în orchestrarea sarcinilor în mai mulți pași. „Un lucru pe care l-am văzut la 5.4 este că uneori pornea pe aceste ocoluri inutile de căutare, iar asta ducea la traiectorii foarte ineficiente”, spune Singhvi.

Comparativ cu modelele anterioare, GPT‑5.5 a fost mai fiabil în regăsirea contextului relevant și în finalizarea fluxurilor de lucru complexe fără supraveghere suplimentară.

Aducerea GPT‑5.5 în fluxurile de lucru de producție

Databricks pune acum GPT‑5.5 la dispoziție prin AI Unity Gateway, unde clienții folosesc modelul în fluxuri de lucru construite cu AgentBricks și Agent Supervisor API. În aceste sisteme, GPT‑5.5 orchestrează procesele de analiză și extragere a informațiilor, regăsire a datelor și execuție între agenți specializați.

„Vom vedea mulți clienți folosind AgentBricks și Agent Supervisor API pentru fluxuri de lucru personalizate cu agenți”, spune Singhvi. „Faptul că GPT‑5.5 supraveghează aceste fluxuri de lucru este cu adevărat promițător.”

„GPT-5.5 a fost excelent în ceea ce privește creșterea nivelului de cunoștințe. Este o schimbare majoră de ordinul unui salt semnificativ în modul în care desfășurăm activitățile bazate pe cunoaștere.”

— Arnav Singhvi, inginer de cercetare

Alătură-te noii ere a muncii

Peste 1 milion de firme din întreaga lume obțin rezultate semnificative cu OpenAI.

Contactează echipa de vânzări

Continuă să citești

How agents are transforming work

Companie25 iun. 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

Companie24 iun. 2026

Helping build shared standards for advanced AI - card image

Sprijinim crearea de standarde comune pentru AI avansată

Afaceri globale23 iun. 2026