۱۵ مئی، ۲۰۲۶

Databricks انٹرپرائز ایجنٹ ورک فلوز میں GPT‑5.5 لاتا ہے

GPT‑5.5 نے OfficeQA Pro پر نیا جدید ترین معیار قائم کیا، جو پیچیدہ انٹرپرائز ایجنٹ کاموں کے لیے Databricks کا بینچ مارک ہے.

سیلز سے رابطہ کریں

Databricks کی کسٹمر کہانی کی مرکزی تصویر.

کمپنی کا سائز: Enterprise

خطہ: شمالی امریکہ

صنعت: ٹیکنالوجی

پراڈکٹس: Codex

50%

OfficeQA Pro بینچ مارک پر درستگی (جدید ترین معیار)

46%

OfficeQA Pro بینچ مارک پر GPT-5.4 کے مقابلے میں غلطیوں میں کمی

لوڈ ہو رہا ہے…

Databricks OfficeQA Pro پر ماڈل کے نئے جدید ترین معیار قائم کرنے کے بعد GPT‑5.5 کو کسٹمر ایجنٹ ورک فلوز کے لیے دستیاب کر رہا ہے، جو پیچیدہ انٹرپرائز دستاویزی کاموں کے لیے کمپنی کا بینچ مارک ہے.

OfficeQA Pro یہ جانچتا ہے کہ ماڈلز اسکین شدہ PDFs، پرانی فائلوں اور طویل سیاقی دستاویزات پر مشتمل ورک فلوز، پارسنگ، بازیافت اور grounded ریزننگ کو کیسے سنبھالتے ہیں، ایسے کام جو اکثر پروڈکشن ایجنٹ سسٹمز کو ناکام کر دیتے ہیں.

ایجنٹ-ہارنس سیٹنگ میں، GPT‑5.5 نے GPT‑5.4 کے مقابلے میں غلطیاں 46% کم کیں اور OfficeQA Pro پر 50% درستگی سے آگے جانے والا پہلا ماڈل بن گیا.

“5.5 کے ساتھ Codex اب موجود تمام ایجنٹس اور ماڈلز میں جدید ترین معیار ہے.”

–Arnav Singhvi، ریسرچ انجینئر

OfficeQA Pro پر جدید ترین کارکردگی

OfficeQA Pro میں بڑی تعداد میں اسکین شدہ یا پرانی انٹرپرائز دستاویزات شامل ہیں، جہاں پارسنگ کے دوران نکالنے کی چھوٹی غلطیاں ورک فلو کے باقی حصے میں آگے تک اثر ڈال سکتی ہیں. “جب آپ کسی خاص ہندسے یا نمبر کو نکال نہیں پاتے، تو اس سے پورا رخ بدل جاتا ہے کہ ایجنٹ کس چیز کے ساتھ کام کرتا ہے،” Singhvi وضاحت کرتے ہیں.

Databricks نے ان پارسنگ پر مبنی ورک فلوز میں GPT‑5.5 سے سب سے زیادہ بہتری دیکھی. “پہلے کے ماڈلز جیسے 5.4 تمام ہندسوں کو درست طور پر پارس نہیں کر پاتے تھے، لیکن لگتا ہے کہ 5.5 نے پرانی دستاویزات اور اسکین شدہ PDFs کی پارسنگ میں نمایاں بہتری دی ہے،” Singhvi کہتے ہیں.

ٹیم نے کثیر مرحلہ کاموں میں آرکیسٹریشن میں بھی بہتری دیکھی. “ایک چیز جو ہم نے 5.4 میں دیکھی وہ یہ تھی کہ کبھی کبھی یہ غیر ضروری تلاش کے چکروں میں چلا جاتا تھا، اور اس سے راستے بہت غیر مؤثر ہو جاتے تھے،” Singhvi کہتے ہیں.

پہلے کے ماڈلز کے مقابلے میں، GPT‑5.5 متعلقہ سیاق بازیافت کرنے اور اضافی نگرانی کے بغیر پیچیدہ ورک فلوز مکمل کرنے میں زیادہ قابلِ اعتماد تھا.

GPT‑5.5 کو پروڈکشن ورک فلوز میں لانا

Databricks اب GPT‑5.5 کو AI Unity Gateway کے ذریعے دستیاب کرتا ہے، جہاں صارفین AgentBricks اور Agent Supervisor API سے بنے ورک فلوز کے اندر اس ماڈل کو استعمال کرتے ہیں. ان سسٹمز میں، GPT‑5.5 خصوصی ایجنٹس کے درمیان پارسنگ، بازیافت اور عمل درآمد کی آرکیسٹریشن کرتا ہے.

“ہم بہت سے صارفین کو حسبِ ضرورت ایجنٹ ورک فلوز کے لیے AgentBricks اور Agent Supervisor API استعمال کرتے دیکھیں گے،” Singhvi کہتے ہیں. “ان ورک فلوز کی نگرانی GPT‑5.5 سے کروانا واقعی بہت پُرجوش ہے.”

“علمی بہتری کے لحاظ سے GPT-5.5 بہت شاندار رہا ہے. ہمارے لیے علمی کام کرنے کے لحاظ سے یہ ایک بڑی سطحی تبدیلی ہے.”

—Arnav Singhvi، ریسرچ انجینئر

کام کے نئے دور میں شامل ہوں

دنیا بھر میں 10 لاکھ سے زیادہ کاروبار OpenAI کے ساتھ معنی خیز نتائج حاصل کر رہے ہیں۔

سیلز سے رابطہ کریں

پڑھتے رہیں

How agents are transforming work

کمپنی۲۵ جون، ۲۰۲۶

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI اور Broadcom نے LLM کیلئے موزوں انفیرنس چپ متعارف کرایا ہے

کمپنی۲۴ جون، ۲۰۲۶

Helping build shared standards for advanced AI - card image

جدید AI کے مشترک معیارات بنانے میں مدد

عالمی امور۲۳ جون، ۲۰۲۶