15 maggio 2026

Databricks porta GPT‑5.5 nei flussi agenti aziendali

GPT‑5.5 ha stabilito un nuovo stato dell’arte su OfficeQA Pro, il benchmark di Databricks per attività complesse degli agenti aziendali.

Contatta il team vendite

Immagine principale della customer story di Databricks.

Dimensioni azienda: Aziende

Regione: America del Nord

Settore: Tecnologia

Prodotti: Codex

50%

Livello di accuratezza nel benchmark OfficeQA Pro (stato dell'arte)

46%

Riduzione degli errori nel benchmark OfficeQA Pro rispetto a GPT-5.4

Caricamento in corso...

Databricks rende disponibile GPT‑5.5 per i flussi di lavoro degli agenti dei clienti dopo che il modello ha stabilito un nuovo stato dell’arte su OfficeQA Pro, il benchmark dell’azienda per attività complesse su documenti aziendali.

OfficeQA Pro valuta come i modelli gestiscono parsing, recupero e ragionamento fondato in flussi di lavoro che coinvolgono PDF scansionati, file legacy e documenti a contesto lungo, attività che spesso mandano in errore i sistemi di agenti in produzione.

Nello scenario agent-harness, GPT‑5.5 ha ridotto gli errori del 46% rispetto a GPT‑5.4 ed è diventato il primo modello a superare il 50% di accuratezza su OfficeQA Pro.

«Codex con la versione 5.5 è ora all'avanguardia rispetto a tutti gli altri agenti e modelli disponibili sul mercato».

–Arnav Singhvi, Research Engineer

Prestazioni SOTA su OfficeQA Pro

OfficeQA Pro include grandi quantità di documenti aziendali scansionati o legacy, in cui piccoli errori di estrazione durante il parsing possono propagarsi a valle nel resto del flusso di lavoro. «Una volta che non riesci a estrarre una certa cifra o numero, cambia l’intera traiettoria di ciò con cui lavora l’agente», spiega Singhvi.

Databricks ha registrato i maggiori miglioramenti con GPT‑5.5 in questi flussi di lavoro ad alta intensità di parsing. «I modelli precedenti come 5.4 non riuscivano a interpretare correttamente tutte le cifre, ma sembra che 5.5 abbia portato un salto netto nel parsing di documenti più vecchi e PDF scansionati», afferma Singhvi.

Il team ha inoltre osservato miglioramenti nell’orchestrazione delle attività in più passaggi. «Una cosa che abbiamo visto con 5.4 è che a volte intraprendeva deviazioni di ricerca non necessarie, e questo causava traiettorie molto inefficienti», dice Singhvi.

Rispetto ai modelli precedenti, GPT‑5.5 era più affidabile nel recuperare il contesto pertinente e completare flussi di lavoro complessi senza supervisione aggiuntiva.

Portare GPT‑5.5 nei flussi di lavoro di produzione

Databricks ora rende disponibile GPT‑5.5 tramite AI Unity Gateway, dove i clienti usano il modello all’interno di flussi di lavoro creati con AgentBricks e l’API Agent Supervisor. In questi sistemi, GPT‑5.5 orchestra parsing, recupero ed esecuzione tra agenti specializzati.

«Vedremo molti clienti usare AgentBricks e l’API Agent Supervisor per flussi di lavoro di agenti personalizzati», afferma Singhvi. «Avere GPT‑5.5 a supervisionare questi flussi di lavoro è davvero entusiasmante.»

«GPT-5.5 si è rivelato eccezionale per quanto riguarda l'incremento delle competenze. Rappresenta una vera e propria svolta epocale nel modo in cui svolge il lavoro intellettuale al posto nostro».

—Arnav Singhvi, Research Engineer

Entra nella nuova era del lavoro

Più di 1.000.000 di aziende in tutto il mondo stanno ottenendo risultati significativi con OpenAI.

Contatta il Team vendite

Continua a leggere

How agents are transforming work

Azienda25 giu 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI e Broadcom svelano chip di inferenza ottimizzato per LLM

Azienda24 giu 2026

Helping build shared standards for advanced AI - card image

Contribuire a standard condivisi per l’IA avanzata

Affari globali23 giu 2026