Databricks एंटरप्राइझ एजंट वर्कफ्लोजमध्ये GPT‑5.5 आणत आहे
GPT‑5.5 ने OfficeQA Pro मध्ये एक नवीन अत्याधुनिक मापदंड स्थापित केला आहे, जे जटिल एंटरप्राइझ एजंट कार्यांसाठी डेटाब्रिक्सचे बेंचमार्क आहे.

50%
OfficeQA Pro बेंचमार्कवरील अचूकता (अत्याधुनिक स्तर)
46%
GPT-5.4 च्या तुलनेत OfficeQA Pro बेंचमार्कवरील त्रुटींमध्ये घट
जटिल एंटरप्राइझ दस्तऐवज कार्यांसाठी कंपनीचा बेंचमार्क असलेल्या OfficeQA Pro वर या मॉडेलने एक नवीन अत्याधुनिक मापदंड स्थापित केल्यानंतर, डेटाब्रिक्स ग्राहक एजंट वर्कफ्लोसाठी GPT‑5.5 उपलब्ध करून देत आहे.
OfficeQA Pro हे स्कॅन केलेल्या PDF, लेगसी फाइल्स आणि दीर्घ-संदर्भ दस्तऐवजांचा समावेश असलेल्या वर्कफ्लोमध्ये मॉडेल्स पार्सिंग, पुनर्प्राप्ती आणि ग्राउंडेड रीझनिंग कसे हाताळतात याचे मूल्यांकन करते; ही अशी कार्ये आहेत ज्यामुळे प्रोडक्शन एजंट सिस्टीममध्ये वारंवार बिघाड होतो.
एजंट-हार्नेस सेटिंगमध्ये, GPT‑5.5 ने GPT‑5.4 च्या तुलनेत त्रुटी 46% ने कमी केल्या आणि OfficeQA Pro वर 50% पेक्षा जास्त अचूकता मिळवणारे पहिले मॉडेल ठरले.
“5.5 सह Codex आता उपलब्ध असलेल्या सर्व एजंट्स आणि मॉडेल्समध्ये अत्याधुनिक स्तरावर पोहोचले आहे.”
OfficeQA Pro मध्ये मोठ्या संख्येने स्कॅन केलेले किंवा लेगसी एंटरप्राइझ दस्तऐवज समाविष्ट असतात, जिथे पार्सिंग दरम्यान होणाऱ्या लहान एक्स्ट्रॅक्शन त्रुटी संपूर्ण वर्कफ्लोमध्ये पसरू शकतात. “एकदा का तुम्हाला एखादा विशिष्ट अंक किंवा संख्या काढता आली नाही, की एजंट ज्या गोष्टींवर काम करतो त्याची संपूर्ण दिशाच बदलते,” असे Singhvi स्पष्ट करतात.
या पार्सिंग-केंद्रित वर्कफ्लोजमध्ये Databricks ला GPT‑5.5 मुळे सर्वाधिक फायदा झाला. "5.4 सारखे पूर्वीचे मॉडेल सर्व अंक अचूकपणे पार्स करू शकत नव्हते, परंतु असे दिसते की 5.5 मध्ये जुने दस्तऐवज आणि स्कॅन केलेल्या PDF पार्स करण्यामध्ये लक्षणीय सुधारणा झाली आहे," असे Singhvi म्हणतात.
या टीमला बहु-टप्प्यांच्या कामांमधील ऑर्केस्ट्रेशनमध्येही सुधारणा दिसून आल्या. "5.4 च्या बाबतीत आमच्या लक्षात आले की, कधीकधी ते शोधासाठी अनावश्यक वळणे घेत असे आणि त्यामुळे मार्ग अत्यंत अकार्यक्षम बनत असत," असे Singhvi म्हणतात.
पूर्वीच्या मॉडेल्सच्या तुलनेत, GPT‑5.5 हे अतिरिक्त पर्यवेक्षणाशिवाय संबंधित संदर्भ मिळवण्यात आणि गुंतागुंतीचे वर्कफ्लो पूर्ण करण्यात अधिक विश्वसनीय होते.
Databricks आता AI युनिटी गेटवेद्वारे GPT‑5.5 उपलब्ध करून दिले आहे, जिथे ग्राहक एजंटब्रिक्स आणि एजंट सुपरवायझर API वापरून तयार केलेल्या वर्कफ्लोमध्ये या मॉडेलचा वापर करतात. या सिस्टिम्समध्ये, GPT‑5.5 विशेष एजंट्सद्वारे पार्सिंग, पुनर्प्राप्ती आणि अंमलबजावणीचे समन्वय साधते.
“आपण पाहणार आहोत की बरेच ग्राहक कस्टम एजंट वर्कफ्लोसाठी एजंटब्रिक्स आणि एजंट सुपरवायझर API वापरतील,” असे Singhvi म्हणतात. “या वर्कफ्लोजचे पर्यवेक्षण GPT‑5.5 कडून होणे खरोखरच उत्साहवर्धक आहे.”
“ज्ञानवृद्धीच्या दृष्टीने GPT-5.5 अतिशय उत्कृष्ट ठरले आहे. “आमच्यासाठी ज्ञानाधारित काम करण्याच्या दृष्टीने हा एक मोठा बदल ठरला आहे.”


