Databricks-ს GPT‑5.5 მოაქვს საწარმოს აგენტის სამუშაო ნაკადებში
GPT‑5.5‑მა ახალი საუკეთესო შედეგი აჩვენა OfficeQA Pro-ზე, Databricks-ის ბენჩმარკზე, რომელიც რთული საწარმოო აგენტური დავალებებისთვისაა განკუთვნილი.

50%
სიზუსტე OfficeQA Pro ბენჩმარკზე (საუკეთესო შედეგი)
46%
შეცდომების შემცირება OfficeQA Pro ბენჩმარკზე GPT-5.4-თან შედარებით
Databricks მომხმარებლის აგენტის სამუშაო ნაკადებისთვის GPT‑5.5‑ს ხელმისაწვდომს ხდის მას შემდეგ, რაც მოდელმა ახალი საუკეთესო შედეგი აჩვენა OfficeQA Pro-ზე, კომპანიის ბენჩმარკზე, რომელიც საწარმოს დოკუმენტაციასთან დაკავშირებული რთული დავალებებისთვისაა განკუთვნილი.
OfficeQA Pro აფასებს, როგორ უმკლავდებიან მოდელები დამუშავებას, მოძიებას და დასაბუთებულ მსჯელობას იმ სამუშაო ნაკადებში, რომლებიც მოიცავს დასკანერებულ PDF-ებს, ძველ ფაილებს და გრძელი კონტექსტის დოკუმენტებს — დავალებებს, რომლებიც ხშირად იწვევს აგენტური სისტემების მუშაობის შეფერხებას საექსპლუატაციო გარემოში.
agent-harness გარემოში GPT‑5.5‑მა შეცდომები 46%-ით შეამცირა GPT‑5.4‑თან შედარებით და გახდა პირველი მოდელი, რომელმაც OfficeQA Pro-ზე 50%-იან სიზუსტეს გადააჭარბა.
„Codex-ი 5.5 მოდელით ახლა საუკეთესოა ყველა არსებულ აგენტსა და მოდელს შორის“.
OfficeQA Pro მოიცავს დიდი რაოდენობით დასკანერებულ ან ძველ საწარმოს დოკუმენტებს, სადაც დამუშავებისას მცირე ამოღების შეცდომები შეიძლება სამუშაო ნაკადის დანარჩენ ნაწილში ჯაჭვურად გავრცელდეს. „როგორც კი რომელიმე ციფრის ან რიცხვის ამოღებას ვეღარ ახერხებ, ეს მთლიანად ცვლის იმ ტრაექტორიას, რასთანაც აგენტი მუშაობს,“ განმარტავს სინგვი.
Databricks-მა GPT‑5.5‑ისგან ყველაზე დიდი გაუმჯობესება სწორედ ამ დამუშავებაზე ორიენტირებულ სამუშაო ნაკადებში ნახა. „ადრინდელი მოდელები, როგორიცაა 5.4, ყველა ციფრს სწორად ვერ ამუშავებდნენ, მაგრამ ჩანს, რომ 5.5-ს ძველი დოკუმენტებისა და დასკანერებული PDF-ების დამუშავებაში საფეხურებრივი გაუმჯობესება აქვს,“ ამბობს სინგვი.
გუნდმა ასევე ნახა გაუმჯობესება მრავალსაფეხურიანი ამოცანების ორკესტრაციაში. „ერთი რამ, რაც 5.4-ში ვნახეთ, იყო ის, რომ ზოგჯერ ის ამ არასაჭირო საძიებო გადახვევებს მიჰყვებოდა, და ეს ძალიან არაეფექტიან ტრაექტორიებს იწვევდა,“ ამბობს სინგვი.
ადრინდელ მოდელებთან შედარებით, GPT‑5.5 უფრო საიმედო იყო შესაბამისი კონტექსტის მოძიებასა და რთული სამუშაო ნაკადების დამატებითი ზედამხედველობის გარეშე დასრულებაში.
Databricks ახლა GPT‑5.5‑ს AI Unity Gateway-ის მეშვეობით ხელმისაწვდომს ხდის, სადაც მომხმარებლები მოდელს AgentBricks-ითა და Agent Supervisor API-ით შექმნილ სამუშაო ნაკადებში იყენებენ. ამ სისტემებში GPT‑5.5 სპეციალიზებულ აგენტებს შორის გარჩევას, მოძიებას და შესრულებას უწევს ორკესტრირებას.
„ვიხილავთ ბევრ მომხმარებელს, რომლებიც AgentBricks-სა და Agent Supervisor API-ს მორგებული აგენტის სამუშაო ნაკადებისთვის გამოიყენებენ,“ ამბობს სინგვი. „ძალიან ამაღელვებელია, რომ GPT‑5.5 ამ სამუშაო ნაკადებს ზედამხედველობს.“
„GPT-5.5 შესანიშნავი იყო ცოდნის ზრდის მხრივ. ჩვენთვის ცოდნაზე დაფუძნებული სამუშაოს შესრულებაში ეს საფეხურებრივი ცვლილებაა.“


