Databricks, GPT‑5.5 को एंटरप्राइज़ एजेंट वर्कफ़्लो में ला रहा है
GPT‑5.5 ने OfficeQA Pro पर एक नया अत्याधुनिक स्तर स्थापित किया है, जो मुश्किल एंटरप्राइज़ एजेंट कार्यों के लिए Databricks का एक बेंचमार्क है.

50%
OfficeQA Pro बेंचमार्क पर सटीकता (अत्याधुनिक)
46%
GPT-5.4 की तुलना में OfficeQA Pro बेंचमार्क पर गलतियों में कमी
Databricks, GPT‑5.5 को कस्टमर एजेंट वर्कफ़्लो के लिए उपलब्ध करा रहा है; ऐसा इसलिए किया जा रहा है क्योंकि इस मॉडल ने OfficeQA Pro पर एक नया अत्याधुनिक स्तर स्थापित किया है, जो कि मुश्किल एंटरप्राइज़ डॉक्यूमेंट संबंधी कार्यों के लिए कंपनी का एक बेंचमार्क है.
OfficeQA Pro यह आकलन करता है कि मॉडल स्कैन किए गए PDF, पुरानी फ़ाइलों और लंबे संदर्भ वाले डाक्यूमेंट्स से जुड़े वर्कफ़्लो में पार्सिंग, रिट्रीवल और ग्राउंडेड रीज़निंग को कैसे संभालते हैं, ये ऐसे काम हैं जो अक्सर प्रोडक्शन एजेंट सिस्टम को बाधित कर देते हैं.
एजेंट-हार्नेस सेटिंग में, GPT‑5.5 ने GPT‑5.4 की तुलना में गलतियों को 46% तक कम कर दिया, और OfficeQA Pro पर 50% सटीकता को पार करने वाला पहला मॉडल बन गया.
'5.5 वाला Codex अब उपलब्ध सभी एजेंट और मॉडल के बीच सबसे अत्याधुनिक है.'
OfficeQA Pro में बड़ी संख्या में स्कैन किए गए या पुराने एंटरप्राइज़ डाक्यूमेंट्स शामिल होते हैं, जहाँ पार्सिंग के दौरान होने वाली छोटी एक्सट्रैक्शन संबंधी गलतियाँ बाकी वर्कफ़्लो में आगे तक फैल सकती हैं. 'जब आप किसी ख़ास डिजिट या संख्या को निकाल नहीं पाते, तो इससे एजेंट जिस चीज़ के साथ काम करता है उसकी पूरी दिशा बदल जाती है,' सिंहवी बताते हैं.
Databricks को इन पार्सिंग-प्रधान वर्कफ़्लो में GPT‑5.5 से सबसे ज़्यादा फ़ायदा हुआ. "5.4 जैसे पुराने मॉडल सभी डिजिट को सही ढंग से पार्स नहीं कर पाते थे, लेकिन ऐसा लगता है कि 5.5 में पुराने डाक्यूमेंट्स और स्कैन की गई PDF को पार्स करने की क्षमता में काफ़ी सुधार हुआ है," सिंहवी कहते हैं.
टीम ने कई स्टेप वाले कार्यों के तालमेल में भी सुधार देखा. '5.4 के साथ हमने एक बात यह देखी कि कभी-कभी यह बेवजह की खोज के लिए अनावश्यक भटकाव की ओर चला जाता था, और इसकी वजह से बहुत ही अकुशल ट्रैजेक्टरी बनती थी,' सिंहवी बताते हैं.
पिछले सभी मॉडल की तुलना में, GPT‑5.5 उपयुक्त संदर्भ को पाने और बिना किसी अतिरिक्त निगरानी के मुश्किल वर्कफ़्लो को पूरा करने में ज़्यादा भरोसेमंद था.
Databricks अब AI Unity Gateway के ज़रिए GPT‑5.5 उपलब्ध कराता है, जहाँ ग्राहक AgentBricks और Agent Supervisor API से बनाए गए वर्कफ़्लो के अंदर इस मॉडल का इस्तेमाल करते हैं. इन सिस्टम में, GPT‑5.5 विशेषज्ञ एजेंट के बीच पार्सिंग, रिट्रीवल और एक्सेक्यूशन का तालमेल तय करता है.
'हम देखेंगे कि बहुत से ग्राहक कस्टम एजेंट वर्कफ़्लो के लिए AgentBricks और Agent Supervisor API का इस्तेमाल कर रहे हैं,' सिंहवी बताते हैं. 'इन वर्कफ़्लो की देखरेख GPT‑5.5 से करवाना सचमुच बहुत रोमांचक है.'
'ज्ञान में बढ़ोतरी के मामले में GPT-5.5 शानदार रहा है. हमारे लिए ज्ञान-आधारित काम करने के मामले में यह एक बड़ा बदलाव है.'


