Zum Hauptinhalt springen
OpenAI

15. Mai 2026

Databricks nutzt GPT‑5.5 in Agenten-Workflows für Unternehmen

GPT‑5.5 erzielte im OfficeQA Pro, dem Databricks-Benchmark für komplexe Agentenaufgaben in Unternehmen, einen neuen Bestwert.

Hero-Bild zur Databricks-Kundengeschichte.
Unternehmensgröße: Enterprise
Region: Nordamerika
Branche: Technologie
Produkte: Codex

50%

Genauigkeit im OfficeQA-Pro-Benchmark (führend)

46%

Weniger Fehler im OfficeQA-Pro-Benchmark im Vergleich zu GPT-5.4

Laden …

Databricks stellt GPT‑5.5 für Agenten-Workflows von Kund:innen bereit, nachdem das Modell im OfficeQA Pro, dem Benchmark des Unternehmens für komplexe Dokumentaufgaben in Unternehmen, einen neuen Bestwert erreicht hat.

OfficeQA Pro bewertet, wie Modelle Parsing, Abruf und fundiertes Schlussfolgern in Workflows mit gescannten PDFs, Legacy-Dateien und Dokumenten mit langem Kontext bewältigen – Aufgaben, an denen produktive Agentensysteme häufig scheitern.

Im Agent-Harness-Setting reduzierte GPT‑5.5 die Fehler im Vergleich zu GPT‑5.4 um 46 % und war das erste Modell, das im OfficeQA Pro eine Genauigkeit von über 50 % erreichte.

„Codex mit 5.5 ist jetzt führend unter allen verfügbaren Agenten und Modellen.“
– Arnav Singhvi, Research Engineer

Spitzenleistung im OfficeQA Pro

OfficeQA Pro umfasst große Mengen gescannter oder älterer Unternehmensdokumente, bei denen kleine Extraktionsfehler beim Parsing nachgelagert den restlichen Workflow beeinträchtigen können. „Sobald sich eine bestimmte Ziffer oder Zahl nicht extrahieren lässt, verändert das den gesamten Verlauf dessen, womit der Agent arbeitet“, erklärt Singhvi.

Databricks verzeichnete bei diesen parsing-intensiven Workflows die größten Zugewinne durch GPT‑5.5. „Frühere Modelle wie 5.4 konnten nicht alle Ziffern korrekt parsen, aber es scheint, als hätte 5.5 beim Parsen älterer Dokumente und gescannter PDFs einen sprunghaften Leistungsanstieg erzielt“, sagt Singhvi.

Das Team beobachtete außerdem Verbesserungen bei der Orchestrierung über mehrstufige Aufgaben hinweg. „Eine Sache, die wir bei 5.4 gesehen haben, war, dass es manchmal unnötige Suchumwege machte, und das führte zu sehr ineffizienten Abläufen“, sagt Singhvi.

Im Vergleich zu früheren Modellen war GPT‑5.5 zuverlässiger darin, relevanten Kontext abzurufen und komplexe Workflows ohne zusätzliche Aufsicht abzuschließen.

GPT‑5.5 in produktive Workflows einbringen

Databricks stellt GPT‑5.5 jetzt über AI Unity Gateway bereit, wo Kund:innen das Modell in Workflows nutzen, die mit AgentBricks und der Agent Supervisor API erstellt wurden. In diesen Systemen orchestriert GPT‑5.5 Parsing, Abruf und Ausführung über spezialisierte Agenten hinweg.

„Wir werden viele Kund:innen sehen, die AgentBricks und die Agent Supervisor API für benutzerdefinierte Agenten-Workflows nutzen“, so Singhvi. „Dass GPT‑5.5 diese Workflows überwacht, ist wirklich spannend.“

„GPT-5.5 war in Bezug auf Wissenszuwachs großartig. Für unsere Wissensarbeit ist das eine sprunghafte Veränderung.“
– Arnav Singhvi, Research Engineer

Werde Teil der neuen Arbeitswelt

Mehr als 1 Million Unternehmen weltweit erzielen mit OpenAI bedeutende Ergebnisse.