मुख्य मजकूराकडे जा
OpenAI

१५ मे, २०२६

Databricks एंटरप्राइझ एजंट वर्कफ्लोजमध्ये GPT‑5.5 आणत आहे

GPT‑5.5 ने OfficeQA Pro मध्ये एक नवीन अत्याधुनिक मापदंड स्थापित केला आहे, जे जटिल एंटरप्राइझ एजंट कार्यांसाठी डेटाब्रिक्सचे बेंचमार्क आहे.

Databricks कस्टमर स्टोरी हिरो इमेज.
कंपनीचा आकार: एंटरप्राइज
प्रदेश: उत्तर अमेरिका
उद्योग: तंत्रज्ञान
प्रॉडक्ट्स: कोडेक्स

50%

OfficeQA Pro बेंचमार्कवरील अचूकता (अत्याधुनिक स्तर)

46%

GPT-5.4 च्या तुलनेत OfficeQA Pro बेंचमार्कवरील त्रुटींमध्ये घट

लोड होत आहे...

जटिल एंटरप्राइझ दस्तऐवज कार्यांसाठी कंपनीचा बेंचमार्क असलेल्या OfficeQA Pro वर या मॉडेलने एक नवीन अत्याधुनिक मापदंड स्थापित केल्यानंतर, डेटाब्रिक्स ग्राहक एजंट वर्कफ्लोसाठी GPT‑5.5 उपलब्ध करून देत आहे.

OfficeQA Pro हे स्कॅन केलेल्या PDF, लेगसी फाइल्स आणि दीर्घ-संदर्भ दस्तऐवजांचा समावेश असलेल्या वर्कफ्लोमध्ये मॉडेल्स पार्सिंग, पुनर्प्राप्ती आणि ग्राउंडेड रीझनिंग कसे हाताळतात याचे मूल्यांकन करते; ही अशी कार्ये आहेत ज्यामुळे प्रोडक्शन एजंट सिस्टीममध्ये वारंवार बिघाड होतो.

एजंट-हार्नेस सेटिंगमध्ये, GPT‑5.5 ने GPT‑5.4 च्या तुलनेत त्रुटी 46% ने कमी केल्या आणि OfficeQA Pro वर 50% पेक्षा जास्त अचूकता मिळवणारे पहिले मॉडेल ठरले.

“5.5 सह Codex आता उपलब्ध असलेल्या सर्व एजंट्स आणि मॉडेल्समध्ये अत्याधुनिक स्तरावर पोहोचले आहे.”
–Arnav Singhvi, संशोधन अभियंता

OfficeQA Pro वर अत्याधुनिक कार्यक्षमता

OfficeQA Pro मध्ये मोठ्या संख्येने स्कॅन केलेले किंवा लेगसी एंटरप्राइझ दस्तऐवज समाविष्ट असतात, जिथे पार्सिंग दरम्यान होणाऱ्या लहान एक्स्ट्रॅक्शन त्रुटी संपूर्ण वर्कफ्लोमध्ये पसरू शकतात. “एकदा का तुम्हाला एखादा विशिष्ट अंक किंवा संख्या काढता आली नाही, की एजंट ज्या गोष्टींवर काम करतो त्याची संपूर्ण दिशाच बदलते,” असे Singhvi स्पष्ट करतात.

या पार्सिंग-केंद्रित वर्कफ्लोजमध्ये Databricks ला GPT‑5.5 मुळे सर्वाधिक फायदा झाला. "5.4 सारखे पूर्वीचे मॉडेल सर्व अंक अचूकपणे पार्स करू शकत नव्हते, परंतु असे दिसते की 5.5 मध्ये जुने दस्तऐवज आणि स्कॅन केलेल्या PDF पार्स करण्यामध्ये लक्षणीय सुधारणा झाली आहे," असे Singhvi म्हणतात.

या टीमला बहु-टप्प्यांच्या कामांमधील ऑर्केस्ट्रेशनमध्येही सुधारणा दिसून आल्या. "5.4 च्या बाबतीत आमच्या लक्षात आले की, कधीकधी ते शोधासाठी अनावश्यक वळणे घेत असे आणि त्यामुळे मार्ग अत्यंत अकार्यक्षम बनत असत," असे Singhvi म्हणतात.

पूर्वीच्या मॉडेल्सच्या तुलनेत, GPT‑5.5 हे अतिरिक्त पर्यवेक्षणाशिवाय संबंधित संदर्भ मिळवण्यात आणि गुंतागुंतीचे वर्कफ्लो पूर्ण करण्यात अधिक विश्वसनीय होते.

GPT‑5.5 ला उत्पादन वर्कफ्लोजमध्ये आणणे

Databricks आता AI युनिटी गेटवेद्वारे GPT‑5.5 उपलब्ध करून दिले आहे, जिथे ग्राहक एजंटब्रिक्स आणि एजंट सुपरवायझर API वापरून तयार केलेल्या वर्कफ्लोमध्ये या मॉडेलचा वापर करतात. या सिस्टिम्समध्ये, GPT‑5.5 विशेष एजंट्सद्वारे पार्सिंग, पुनर्प्राप्ती आणि अंमलबजावणीचे समन्वय साधते.

“आपण पाहणार आहोत की बरेच ग्राहक कस्टम एजंट वर्कफ्लोसाठी एजंटब्रिक्स आणि एजंट सुपरवायझर API वापरतील,” असे Singhvi म्हणतात. “या वर्कफ्लोजचे पर्यवेक्षण GPT‑5.5 कडून होणे खरोखरच उत्साहवर्धक आहे.”

“ज्ञानवृद्धीच्या दृष्टीने GPT-5.5 अतिशय उत्कृष्ट ठरले आहे. “आमच्यासाठी ज्ञानाधारित काम करण्याच्या दृष्टीने हा एक मोठा बदल ठरला आहे.”
–Arnav Singhvi, संशोधन अभियंता

कामाच्या नव्या युगात सामील व्हा

जगभरातील 10 लाखाहून अधिक व्यवसाय OpenAI सह अर्थपूर्ण परिणाम साध्य करत आहेत.