ಡೇಟಾಬ್ರಿಕ್ಸ್ ಎಂಟರ್ಪ್ರೈಸ್ ಏಜೆಂಟ್ಗೆ GPT‑5.5 ತಂದಿದೆ
ಸಂಕೀರ್ಣ ಎಂಟರ್ಪ್ರೈಸ್ ಏಜೆಂಟ್ ಕಾರ್ಯಗಳಿಗಾಗಿ Databricks ನ ಬೆಂಚ್ಮಾರ್ಕ್ ಆದ OfficeQA Pro ನಲ್ಲಿ GPT‑5.5 ಹೊಸ ಅತ್ಯಾಧುನಿಕ ಮಟ್ಟವನ್ನು ಸ್ಥಾಪಿಸಿತು.

50%
OfficeQA Pro ಬೆಂಚ್ಮಾರ್ಕ್ನಲ್ಲಿ ನಿಖರತೆ (ಅತ್ಯಾಧುನಿಕ)
46%
GPT-5.4 ಜೊತೆ ಹೋಲಿಸಿದರೆ OfficeQA Pro ಬೆಂಚ್ಮಾರ್ಕ್ನಲ್ಲಿ ದೋಷಗಳ ಕಡಿತ
OfficeQA Pro ನಲ್ಲಿ, ಅಂದರೆ ಸಂಕೀರ್ಣ ಎಂಟರ್ಪ್ರೈಸ್ ಡಾಕ್ಯುಮೆಂಟ್ ಕಾರ್ಯಗಳಿಗಾಗಿ ಕಂಪನಿಯ ಬೆಂಚ್ಮಾರ್ಕ್ನಲ್ಲಿ, ಮಾಡೆಲ್ ಹೊಸ ಅತ್ಯಾಧುನಿಕ ಮಟ್ಟವನ್ನು ಸ್ಥಾಪಿಸಿದ ನಂತರ Databricks ಗ್ರಾಹಕರ ಏಜೆಂಟ್ ವರ್ಕ್ಫ್ಲೋಗಳಿಗೆ GPT‑5.5 ಅನ್ನು ಲಭ್ಯವಾಗಿಸುತ್ತಿದೆ.
ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ PDFಗಳು, ಹಳೆಯ ಫೈಲ್ಗಳು ಮತ್ತು ದೀರ್ಘ-ಸಂದರ್ಭದ ಡಾಕ್ಯುಮೆಂಟ್ಗಳನ್ನು ಒಳಗೊಂಡ ವರ್ಕ್ಫ್ಲೋಗಳಲ್ಲಿ ಮಾಡೆಲ್ಗಳು ಪಾರ್ಸಿಂಗ್, ರಿಟ್ರೀವಲ್ ಮತ್ತು ಆಧಾರಿತ ರೀಜನಿಂಗ್ ಅನ್ನು ಹೇಗೆ ನಿಭಾಯಿಸುತ್ತವೆ ಎಂಬುದನ್ನು OfficeQA Pro ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತದೆ. ಇವು ಉತ್ಪಾದನಾ ಏಜೆಂಟ್ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಆಗಾಗ್ಗೆ ವಿಫಲಗೊಳಿಸುವ ಕಾರ್ಯಗಳಾಗಿವೆ.
ಏಜೆಂಟ್-ಹಾರ್ನೆಸ್ (agent-harness) ವ್ಯವಸ್ಥೆಯಲ್ಲಿ, GPT‑5.5 ಮಾದರಿಯು GPT‑5.4 ಗೆ ಹೋಲಿಸಿದರೆ ತಪ್ಪುಗಳನ್ನು ಶೇಕಡಾ 46 ರಷ್ಟು ಕಡಿಮೆ ಮಾಡಿದೆ. ಅಷ್ಟೇ ಅಲ್ಲದೆ, ಆಫೀಸ್ಕ್ಯೂಎ ಪ್ರೊ (OfficeQA Pro) ಪರೀಕ್ಷೆಯಲ್ಲಿ ಶೇಕಡಾ 50 ಕ್ಕಿಂತ ಹೆಚ್ಚು ನಿಖರತೆ (accuracy) ಸಾಧಿಸಿದ ಮೊದಲ ಮಾಡೆಲ್ ಎಂಬ ಹೆಗ್ಗಳಿಕೆಗೆ ಪಾತ್ರವಾಗಿದೆ.
“5.5 ಜೊತೆಯ Codex ಈಗ ಲಭ್ಯವಿರುವ ಎಲ್ಲಾ ಏಜೆಂಟ್ಗಳು ಮತ್ತು ಮಾಡೆಲ್ಗಳ ನಡುವೆ ಅತ್ಯಾಧುನಿಕವಾಗಿದೆ.”
OfficeQA Pro ನಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಅಥವಾ ಹಳೆಯ ಎಂಟರ್ಪ್ರೈಸ್ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು ಬಹಳಷ್ಟು ಸೇರಿವೆ. ಇಲ್ಲಿ ಪಾರ್ಸಿಂಗ್ ಸಮಯದ ಸಣ್ಣ ಎಕ್ಸ್ಟ್ರಾಕ್ಷನ್ ದೋಷಗಳು ಉಳಿದ ವರ್ಕ್ಫ್ಲೋದೆಲ್ಲೆಡೆ ಸರಪಳಿಯಾಗಿ ಪರಿಣಾಮ ಬೀರುತ್ತವೆ. “ಒಂದು ನಿರ್ದಿಷ್ಟ ಅಂಕೆ ಅಥವಾ ಸಂಖ್ಯೆಯನ್ನು ನೀವು ಎಕ್ಸ್ಟ್ರಾಕ್ಟ್ ಮಾಡಲು ಸಾಧ್ಯವಾಗದ ಕ್ಷಣದಿಂದಲೇ, ಏಜೆಂಟ್ ಕೆಲಸ ಮಾಡುವ ಸಂಪೂರ್ಣ ದಿಕ್ಕೇ ಬದಲಾಗುತ್ತದೆ,” ಎಂದು Singhvi ವಿವರಿಸುತ್ತಾರೆ.
ಈ ಪಾರ್ಸಿಂಗ್-ಕೇಂದ್ರಿತ ವರ್ಕ್ಫ್ಲೋಗಳಲ್ಲಿ Databricks ಗೆ GPT‑5.5 ನಿಂದ ಅತಿ ದೊಡ್ಡ ಸುಧಾರಣೆಗಳು ಕಂಡವು. “5.4 ಹೀಗಿನ ಹಿಂದಿನ ಮಾಡೆಲ್ಗಳು ಎಲ್ಲಾ ಅಂಕೆಗಳನ್ನು ಸರಿಯಾಗಿ ಪಾರ್ಸ್ ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತಿರಲಿಲ್ಲ. ಆದರೆ 5.5 ಹಳೆಯ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು ಮತ್ತು ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ PDFಗಳನ್ನು ಪಾರ್ಸ್ ಮಾಡುವಲ್ಲಿ ಹಂತಮಟ್ಟದ ಏರಿಕೆಯನ್ನು ತಂದಂತಿದೆ,” ಎಂದು Singhvi ಹೇಳುತ್ತಾರೆ.
ತಂಡವು ಬಹು-ಹಂತದ ಕಾರ್ಯಗಳಾದ್ಯಂತ ಆರ್ಕೆಸ್ಟ್ರೇಷನ್ನಲ್ಲಿಯೂ ಸುಧಾರಣೆಗಳನ್ನು ಕಂಡಿತು. “5.4 ನಲ್ಲಿ ನಾವು ಕಂಡ ಒಂದು ವಿಷಯವೆಂದರೆ, ಕೆಲವೊಮ್ಮೆ ಅದು ಅನಗತ್ಯ ಹುಡುಕಾಟದ ತಿರುಗಾಟಗಳಿಗೆ ಹೋಗುತ್ತಿತ್ತು. ಅದರಿಂದ ಬಹಳ ಅಸಮರ್ಥ ದಿಕ್ಕುಗಳು ಉಂಟಾಗುತ್ತಿದವು,” ಎಂದು Singhvi ಹೇಳುತ್ತಾರೆ.
ಹಿಂದಿನ ಮಾಡೆಲ್ಗಳ ಜೊತೆ ಹೋಲಿಸಿದರೆ, GPT‑5.5 ಸಂಬಂಧಿತ ಸಂದರ್ಭವನ್ನು ಹಿಂಪಡೆಯುವಲ್ಲಿ ಮತ್ತು ಹೆಚ್ಚುವರಿ ಮೇಲ್ವಿಚಾರಣೆ ಇಲ್ಲದೆ ಸಂಕೀರ್ಣ ವರ್ಕ್ಫ್ಲೋಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸುವಲ್ಲಿ ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿತ್ತು.
Databricks ಈಗ AI Unity Gateway ಮೂಲಕ GPT‑5.5 ಅನ್ನು ಲಭ್ಯವಾಗಿಸಿದೆ. ಇಲ್ಲಿ ಗ್ರಾಹಕರು AgentBricks ಮತ್ತು Agent Supervisor API ಬಳಸಿ ನಿರ್ಮಿಸಿದ ವರ್ಕ್ಫ್ಲೋಗಳೊಳಗೆ ಈ ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸುತ್ತಾರೆ. ಈ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ, GPT‑5.5 ವಿಶೇಷಗೊಳಿಸಿದ ಏಜೆಂಟ್ಗಳಾದ್ಯಂತ ಪಾರ್ಸಿಂಗ್, ರಿಟ್ರೀವಲ್ ಮತ್ತು ಕಾರ್ಯಗತಗೊಳಿಸುವಿಕೆಯನ್ನು ಆರ್ಕೆಸ್ಟ್ರೇಟ್ ಮಾಡುತ್ತದೆ.
“ಕಸ್ಟಮ್ ಏಜೆಂಟ್ ವರ್ಕ್ಫ್ಲೋಗಳಿಗಾಗಿ AgentBricks ಮತ್ತು Agent Supervisor API ಅನ್ನು ಬಳಸುವ ಅನೇಕ ಗ್ರಾಹಕರನ್ನು ನಾವು ನೋಡಲಿದ್ದೇವೆ,” ಎಂದು Singhvi ಹೇಳುತ್ತಾರೆ. “ಈ ವರ್ಕ್ಫ್ಲೋಗಳನ್ನು GPT‑5.5 ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದು ನಿಜವಾಗಿಯೂ ರೋಚಕವಾಗಿದೆ.”
“ಜ್ಞಾನ ವೃದ್ಧಿಯ ದೃಷ್ಟಿಯಿಂದ GPT-5.5 ಅತ್ಯುತ್ತಮವಾಗಿದೆ. ನಮ್ಮಗಾಗಿ ಜ್ಞಾನಾಧಾರಿತ ಕೆಲಸ ಮಾಡುವಲ್ಲಿ ಇದು ಹಂತಮಟ್ಟದ ಬದಲಾವಣೆ.”


