स्किप करके मेन कंटेंट पर जाऍं
OpenAI

15 मई 2026

Databricks, GPT‑5.5 को एंटरप्राइज़ एजेंट वर्कफ़्लो में ला रहा है

GPT‑5.5 ने OfficeQA Pro पर एक नया अत्याधुनिक स्तर स्थापित किया है, जो मुश्किल एंटरप्राइज़ एजेंट कार्यों के लिए Databricks का एक बेंचमार्क है.

Databricks की ग्राहक कहानी की मुख्य छवि.
कंपनी की साइज़: एंटरप्राइज़
क्षेत्र: उत्तरी अमेरिका
इंडस्‍ट्री: टेक्नोलॉजी
प्रॉडक्ट्स: Codex

50%

OfficeQA Pro बेंचमार्क पर सटीकता (अत्याधुनिक)

46%

GPT-5.4 की तुलना में OfficeQA Pro बेंचमार्क पर गलतियों में कमी

लोड किया जा रहा है...

Databricks, GPT‑5.5 को कस्टमर एजेंट वर्कफ़्लो के लिए उपलब्ध करा रहा है; ऐसा इसलिए किया जा रहा है क्योंकि इस मॉडल ने OfficeQA Pro पर एक नया अत्याधुनिक स्तर स्थापित किया है, जो कि मुश्किल एंटरप्राइज़ डॉक्यूमेंट संबंधी कार्यों के लिए कंपनी का एक बेंचमार्क है.

OfficeQA Pro यह आकलन करता है कि मॉडल स्कैन किए गए PDF, पुरानी फ़ाइलों और लंबे संदर्भ वाले डाक्यूमेंट्स से जुड़े वर्कफ़्लो में पार्सिंग, रिट्रीवल और ग्राउंडेड रीज़निंग को कैसे संभालते हैं, ये ऐसे काम हैं जो अक्सर प्रोडक्शन एजेंट सिस्टम को बाधित कर देते हैं.

एजेंट-हार्नेस सेटिंग में, GPT‑5.5 ने GPT‑5.4 की तुलना में गलतियों को 46% तक कम कर दिया, और OfficeQA Pro पर 50% सटीकता को पार करने वाला पहला मॉडल बन गया.

'5.5 वाला Codex अब उपलब्ध सभी एजेंट और मॉडल के बीच सबसे अत्याधुनिक है.'
–अर्नव सिंहवी, रिसर्च इंजीनियर

OfficeQA Pro पर SOTA परफ़ॉर्मेंस

OfficeQA Pro में बड़ी संख्या में स्कैन किए गए या पुराने एंटरप्राइज़ डाक्यूमेंट्स शामिल होते हैं, जहाँ पार्सिंग के दौरान होने वाली छोटी एक्सट्रैक्शन संबंधी गलतियाँ बाकी वर्कफ़्लो में आगे तक फैल सकती हैं. 'जब आप किसी ख़ास डिजिट या संख्या को निकाल नहीं पाते, तो इससे एजेंट जिस चीज़ के साथ काम करता है उसकी पूरी दिशा बदल जाती है,' सिंहवी बताते हैं.

Databricks को इन पार्सिंग-प्रधान वर्कफ़्लो में GPT‑5.5 से सबसे ज़्यादा फ़ायदा हुआ. "5.4 जैसे पुराने मॉडल सभी डिजिट को सही ढंग से पार्स नहीं कर पाते थे, लेकिन ऐसा लगता है कि 5.5 में पुराने डाक्यूमेंट्स और स्कैन की गई PDF को पार्स करने की क्षमता में काफ़ी सुधार हुआ है," सिंहवी कहते हैं.

टीम ने कई स्टेप वाले कार्यों के तालमेल में भी सुधार देखा. '5.4 के साथ हमने एक बात यह देखी कि कभी-कभी यह बेवजह की खोज के लिए अनावश्यक भटकाव की ओर चला जाता था, और इसकी वजह से बहुत ही अकुशल ट्रैजेक्टरी बनती थी,' सिंहवी बताते हैं.

पिछले सभी मॉडल की तुलना में, GPT‑5.5 उपयुक्त संदर्भ को पाने और बिना किसी अतिरिक्त निगरानी के मुश्किल वर्कफ़्लो को पूरा करने में ज़्यादा भरोसेमंद था.

GPT‑5.5 को प्रोडक्शन वर्कफ़्लो में शामिल करना

Databricks अब AI Unity Gateway के ज़रिए GPT‑5.5 उपलब्ध कराता है, जहाँ ग्राहक AgentBricks और Agent Supervisor API से बनाए गए वर्कफ़्लो के अंदर इस मॉडल का इस्तेमाल करते हैं. इन सिस्टम में, GPT‑5.5 विशेषज्ञ एजेंट के बीच पार्सिंग, रिट्रीवल और एक्सेक्यूशन का तालमेल तय करता है.

'हम देखेंगे कि बहुत से ग्राहक कस्टम एजेंट वर्कफ़्लो के लिए AgentBricks और Agent Supervisor API का इस्तेमाल कर रहे हैं,' सिंहवी बताते हैं. 'इन वर्कफ़्लो की देखरेख GPT‑5.5 से करवाना सचमुच बहुत रोमांचक है.'

'ज्ञान में बढ़ोतरी के मामले में GPT-5.5 शानदार रहा है. हमारे लिए ज्ञान-आधारित काम करने के मामले में यह एक बड़ा बदलाव है.'
—अर्नव सिंहवी, रिसर्च इंजीनियर

काम के नए युग से जुड़ें

दुनिया भर के 10 लाख से ज़्यादा बिज़नेस OpenAI के साथ सार्थक नतीजे पा रहे हैं.