Databricks تجلب GPT‑5.5 إلى سير عمل الوكيل للمؤسسات
سجل GPT‑5.5 مستوى جديدًا هو الأفضل على الإطلاق في OfficeQA Pro، معيار Databricks لمهام الوكيل المعقدة للمؤسسات.

50%
الدقة في معيار OfficeQA Pro (الأفضل على الإطلاق)
46%
انخفاض الأخطاء في معيار OfficeQA Pro مقارنةً بـ GPT-5.4
تتيح Databricks الآن GPT‑5.5 لسير عمل الوكيل لدى العملاء بعد أن سجل النموذج مستوى جديدًا هو الأفضل على الإطلاق في OfficeQA Pro، وهو معيار الشركة لمهام مستندات المؤسسات المعقدة.
يقيّم OfficeQA Pro كيفية تعامل النماذج مع التحليل والاسترجاع والاستدلال المؤسس عبر سير عمل يتضمن ملفات PDF ممسوحة ضوئيًا وملفات قديمة ومستندات طويلة السياق، وهي مهام كثيرًا ما تعطل أنظمة الوكيل في بيئات الإنتاج.
في إعداد agent-harness، خفّض GPT‑5.5 الأخطاء بنسبة 46% مقارنةً بـ GPT‑5.4، وأصبح أول نموذج يتجاوز دقة 50% على OfficeQA Pro.
«أصبح Codex مع 5.5 الآن الأفضل على الإطلاق بين جميع الوكلاء والنماذج الموجودة.»
يتضمن OfficeQA Pro أعدادًا كبيرة من مستندات المؤسسات الممسوحة ضوئيًا أو القديمة، حيث يمكن لأخطاء الاستخراج الصغيرة أثناء التحليل أن تتفاقم لاحقًا عبر بقية سير العمل. «بمجرد أن تعجز عن استخراج رقم أو خانة معينة، يتغير المسار الكامل لما يعمل عليه الوكيل»، كما يوضح سينغفي.
شهدت Databricks أكبر المكاسب من GPT‑5.5 في مسارات العمل الثقيلة بالتحليل هذه. «كانت النماذج السابقة مثل 5.4 غير قادرة على تحليل جميع الأرقام بشكل صحيح، لكن يبدو أن 5.5 حقق قفزة نوعية في تحليل المستندات الأقدم وملفات PDF الممسوحة ضوئيًا»، كما يقول سينغفي.
كما لاحظ الفريق تحسينات في التنسيق عبر المهام متعددة الخطوات. «أحد الأمور التي رأيناها مع 5.4 هو أنه كان أحيانًا ينحرف إلى مسارات بحث غير ضرورية، وكان ذلك يسبب مسارات تنفيذ شديدة عدم الكفاءة»، كما يقول سينغفي.
مقارنةً بالنماذج السابقة، كان GPT‑5.5 أكثر موثوقية في استرجاع السياق ذي الصلة وإكمال مسارات العمل المعقدة دون إشراف إضافي.
تتيح Databricks الآن GPT‑5.5 عبر AI Unity Gateway، حيث يستخدم العملاء النموذج داخل مسارات عمل مبنية باستخدام AgentBricks وAgent Supervisor API. في هذه الأنظمة، يتولى GPT‑5.5 تنسيق التحليل والاسترجاع والتنفيذ عبر وكلاء متخصصين.
«سنرى كثيرًا من العملاء يستخدمون AgentBricks وAgent Supervisor API لسير عمل وكيل مخصص»، كما يقول سينغفي. «إن جعل GPT‑5.5 يشرف على مسارات العمل هذه أمر مثير للغاية.»
«كان GPT-5.5 رائعًا من حيث تعزيز المعرفة. إنه تغيير قفزي في ما يتعلق بإنجاز العمل المعرفي بالنسبة لنا.»


