Databricks انٹرپرائز ایجنٹ ورک فلوز میں GPT‑5.5 لاتا ہے
GPT‑5.5 نے OfficeQA Pro پر نیا جدید ترین معیار قائم کیا، جو پیچیدہ انٹرپرائز ایجنٹ کاموں کے لیے Databricks کا بینچ مارک ہے.

50%
OfficeQA Pro بینچ مارک پر درستگی (جدید ترین معیار)
46%
OfficeQA Pro بینچ مارک پر GPT-5.4 کے مقابلے میں غلطیوں میں کمی
Databricks OfficeQA Pro پر ماڈل کے نئے جدید ترین معیار قائم کرنے کے بعد GPT‑5.5 کو کسٹمر ایجنٹ ورک فلوز کے لیے دستیاب کر رہا ہے، جو پیچیدہ انٹرپرائز دستاویزی کاموں کے لیے کمپنی کا بینچ مارک ہے.
OfficeQA Pro یہ جانچتا ہے کہ ماڈلز اسکین شدہ PDFs، پرانی فائلوں اور طویل سیاقی دستاویزات پر مشتمل ورک فلوز، پارسنگ، بازیافت اور grounded ریزننگ کو کیسے سنبھالتے ہیں، ایسے کام جو اکثر پروڈکشن ایجنٹ سسٹمز کو ناکام کر دیتے ہیں.
ایجنٹ-ہارنس سیٹنگ میں، GPT‑5.5 نے GPT‑5.4 کے مقابلے میں غلطیاں 46% کم کیں اور OfficeQA Pro پر 50% درستگی سے آگے جانے والا پہلا ماڈل بن گیا.
“5.5 کے ساتھ Codex اب موجود تمام ایجنٹس اور ماڈلز میں جدید ترین معیار ہے.”
OfficeQA Pro میں بڑی تعداد میں اسکین شدہ یا پرانی انٹرپرائز دستاویزات شامل ہیں، جہاں پارسنگ کے دوران نکالنے کی چھوٹی غلطیاں ورک فلو کے باقی حصے میں آگے تک اثر ڈال سکتی ہیں. “جب آپ کسی خاص ہندسے یا نمبر کو نکال نہیں پاتے، تو اس سے پورا رخ بدل جاتا ہے کہ ایجنٹ کس چیز کے ساتھ کام کرتا ہے،” Singhvi وضاحت کرتے ہیں.
Databricks نے ان پارسنگ پر مبنی ورک فلوز میں GPT‑5.5 سے سب سے زیادہ بہتری دیکھی. “پہلے کے ماڈلز جیسے 5.4 تمام ہندسوں کو درست طور پر پارس نہیں کر پاتے تھے، لیکن لگتا ہے کہ 5.5 نے پرانی دستاویزات اور اسکین شدہ PDFs کی پارسنگ میں نمایاں بہتری دی ہے،” Singhvi کہتے ہیں.
ٹیم نے کثیر مرحلہ کاموں میں آرکیسٹریشن میں بھی بہتری دیکھی. “ایک چیز جو ہم نے 5.4 میں دیکھی وہ یہ تھی کہ کبھی کبھی یہ غیر ضروری تلاش کے چکروں میں چلا جاتا تھا، اور اس سے راستے بہت غیر مؤثر ہو جاتے تھے،” Singhvi کہتے ہیں.
پہلے کے ماڈلز کے مقابلے میں، GPT‑5.5 متعلقہ سیاق بازیافت کرنے اور اضافی نگرانی کے بغیر پیچیدہ ورک فلوز مکمل کرنے میں زیادہ قابلِ اعتماد تھا.
Databricks اب GPT‑5.5 کو AI Unity Gateway کے ذریعے دستیاب کرتا ہے، جہاں صارفین AgentBricks اور Agent Supervisor API سے بنے ورک فلوز کے اندر اس ماڈل کو استعمال کرتے ہیں. ان سسٹمز میں، GPT‑5.5 خصوصی ایجنٹس کے درمیان پارسنگ، بازیافت اور عمل درآمد کی آرکیسٹریشن کرتا ہے.
“ہم بہت سے صارفین کو حسبِ ضرورت ایجنٹ ورک فلوز کے لیے AgentBricks اور Agent Supervisor API استعمال کرتے دیکھیں گے،” Singhvi کہتے ہیں. “ان ورک فلوز کی نگرانی GPT‑5.5 سے کروانا واقعی بہت پُرجوش ہے.”
“علمی بہتری کے لحاظ سے GPT-5.5 بہت شاندار رہا ہے. ہمارے لیے علمی کام کرنے کے لحاظ سے یہ ایک بڑی سطحی تبدیلی ہے.”


