Vai al contenuto principale
OpenAI

15 maggio 2026

Databricks porta GPT‑5.5 nei flussi agenti aziendali

GPT‑5.5 ha stabilito un nuovo stato dell’arte su OfficeQA Pro, il benchmark di Databricks per attività complesse degli agenti aziendali.

Immagine principale della customer story di Databricks.
Dimensioni azienda: Enterprise
Regione: Nord America
Settore: Tecnologia
Prodotti: Codex

50%

Livello di accuratezza nel benchmark OfficeQA Pro (stato dell'arte)

46%

Riduzione degli errori nel benchmark OfficeQA Pro rispetto a GPT-5.4

Caricamento in corso...

Databricks rende disponibile GPT‑5.5 per i flussi di lavoro degli agenti dei clienti dopo che il modello ha stabilito un nuovo stato dell’arte su OfficeQA Pro, il benchmark dell’azienda per attività complesse su documenti aziendali.

OfficeQA Pro valuta come i modelli gestiscono parsing, recupero e ragionamento fondato in flussi di lavoro che coinvolgono PDF scansionati, file legacy e documenti a contesto lungo, attività che spesso mandano in errore i sistemi di agenti in produzione.

Nello scenario agent-harness, GPT‑5.5 ha ridotto gli errori del 46% rispetto a GPT‑5.4 ed è diventato il primo modello a superare il 50% di accuratezza su OfficeQA Pro.

«Codex con la versione 5.5 è ora all'avanguardia rispetto a tutti gli altri agenti e modelli disponibili sul mercato».
–Arnav Singhvi, Research Engineer

Prestazioni SOTA su OfficeQA Pro

OfficeQA Pro include grandi quantità di documenti aziendali scansionati o legacy, in cui piccoli errori di estrazione durante il parsing possono propagarsi a valle nel resto del flusso di lavoro. «Una volta che non riesci a estrarre una certa cifra o numero, cambia l’intera traiettoria di ciò con cui lavora l’agente», spiega Singhvi.

Databricks ha registrato i maggiori miglioramenti con GPT‑5.5 in questi flussi di lavoro ad alta intensità di parsing. «I modelli precedenti come 5.4 non riuscivano a interpretare correttamente tutte le cifre, ma sembra che 5.5 abbia portato un salto netto nel parsing di documenti più vecchi e PDF scansionati», afferma Singhvi.

Il team ha inoltre osservato miglioramenti nell’orchestrazione delle attività in più passaggi. «Una cosa che abbiamo visto con 5.4 è che a volte intraprendeva deviazioni di ricerca non necessarie, e questo causava traiettorie molto inefficienti», dice Singhvi.

Rispetto ai modelli precedenti, GPT‑5.5 era più affidabile nel recuperare il contesto pertinente e completare flussi di lavoro complessi senza supervisione aggiuntiva.

Portare GPT‑5.5 nei flussi di lavoro di produzione

Databricks ora rende disponibile GPT‑5.5 tramite AI Unity Gateway, dove i clienti usano il modello all’interno di flussi di lavoro creati con AgentBricks e l’API Agent Supervisor. In questi sistemi, GPT‑5.5 orchestra parsing, recupero ed esecuzione tra agenti specializzati.

«Vedremo molti clienti usare AgentBricks e l’API Agent Supervisor per flussi di lavoro di agenti personalizzati», afferma Singhvi. «Avere GPT‑5.5 a supervisionare questi flussi di lavoro è davvero entusiasmante.»

«GPT-5.5 si è rivelato eccezionale per quanto riguarda l'incremento delle competenze. Rappresenta una vera e propria svolta epocale nel modo in cui svolge il lavoro intellettuale al posto nostro».
—Arnav Singhvi, Research Engineer

Entra nella nuova era del lavoro

Oltre 1 milione di aziende in tutto il mondo ottengono risultati concreti con OpenAI.