Ana içeriğe atla
OpenAI

15 Mayıs 2026

Databricks, GPT‑5.5'i kurumsal otonom ajan iş akışlarına taşıyor

GPT‑5.5, Databricks'in karmaşık kurumsal otonom ajan görevlerine yönelik kıyaslaması OfficeQA Pro'da yeni bir en ileri düzey belirledi.

Databricks müşteri hikâyesi ana görseli.
Şirket büyüklüğü: Kurumsal
Bölge: Kuzey Amerika
Sektör: Teknoloji
Ürünler: Codex

50%

OfficeQA Pro kıyaslamasında doğruluk (en ileri düzey)

46%

OfficeQA Pro kıyaslamasında GPT-5.4'e kıyasla hata azalması

Yükleniyor...

Databricks, modelin şirketin karmaşık kurumsal belge görevlerine yönelik kıyaslaması OfficeQA Pro'da yeni bir en ileri düzey belirlemesinin ardından GPT‑5.5'i müşteri otonom ajan iş akışları için kullanıma sunuyor.

OfficeQA Pro, modellerin taranmış PDF'ler, eski dosyalar ve uzun bağlamlı belgeleri içeren iş akışlarında ayrıştırma, erişim ve temellendirilmiş akıl yürütmeyi nasıl ele aldığını değerlendirir; bunlar üretimdeki otonom ajan sistemlerini sık sık bozan görevlerdir.

Otonom ajan düzeneği ortamında GPT‑5.5, GPT‑5.4'e kıyasla hataları %46 azalttı ve OfficeQA Pro'da %50 doğruluğu aşan ilk model oldu.

“5.5 ile Codex, piyasadaki tüm otonom ajanlar ve modeller arasında artık en ileri düzeyde.”
–Arnav Singhvi, Araştırma Mühendisi

OfficeQA Pro'da en ileri düzey performans

OfficeQA Pro, çok sayıda taranmış veya eski kurumsal belge içerir; burada ayrıştırma sırasındaki küçük çıkarım hataları iş akışının geri kalanına doğru aşağı akışta zincirleme yayılabilir. Singhvi, “Belirli bir rakamı ya da sayıyı çıkaramadığınızda, bu otonom ajanın üzerinde çalıştığı şeyin tüm gidişatını değiştiriyor,” diye açıklıyor.

Databricks, GPT‑5.5'ten en büyük kazanımları bu ayrıştırma ağırlıklı iş akışlarında gördü. Singhvi, “5.4 gibi önceki modeller tüm rakamları doğru ayrıştıramıyordu, ancak 5.5'in eski belgeleri ve taranmış PDF'leri ayrıştırmada basamaklı bir sıçrama sağladığı görülüyor,” diyor.

Ekip ayrıca çok adımlı görevlerde orkestrasyonda da iyileşmeler gördü. Singhvi, “5.4'te gördüğümüz şeylerden biri, bazen bu gereksiz arama sapmalarına girmesiydi ve bu da çok verimsiz gidişatlara neden oluyordu,” diyor.

Önceki modellere kıyasla GPT‑5.5, ilgili bağlamı getirmede ve karmaşık iş akışlarını ek gözetim olmadan tamamlamada daha güvenilirdi.

GPT‑5.5'i üretim iş akışlarına taşımak

Databricks artık GPT‑5.5'i AI Unity Gateway üzerinden sunuyor; burada müşteriler modeli AgentBricks ve Agent Supervisor API ile oluşturulan iş akışlarının içinde kullanıyor. Bu sistemlerde GPT‑5.5, uzmanlaşmış otonom ajanlar arasında ayrıştırma, erişim ve yürütmeyi orkestre eder.

Singhvi, “Birçok müşterinin özel otonom ajan iş akışları için AgentBricks ve Agent Supervisor API kullanacağını göreceğiz,” diyor. “GPT‑5.5'in bu iş akışlarını denetlemesi gerçekten heyecan verici.”

“GPT-5.5, bilgi artışı açısından harika oldu. Bizim için bilgi işlerini yapma açısından basamaklı bir değişim.”
—Arnav Singhvi, Araştırma Mühendisi

Yeni çalışma çağına katılın

Dünya genelinde 1 milyondan fazla işletme OpenAI ile anlamlı sonuçlar elde ediyor.