15 tháng 5, 2026

Databricks đưa GPT‑5.5 vào quy trình tác nhân cấp doanh nghiệp

GPT‑5.5 đã thiết lập tiêu chuẩn tiên tiến nhất mới trên OfficeQA Pro, chính là bộ đo chuẩn của Databricks cho các tác vụ tác nhân cấp doanh nghiệp phức tạp.

Liên hệ bộ phận kinh doanh

Hình ảnh chính cho câu chuyện khách hàng Databricks.

Quy mô công ty: Doanh nghiệp

Khu vực: Bắc Mỹ

Ngành: Công nghệ

Sản phẩm: Codex

50%

Độ chính xác của bộ đo chuẩn OfficeQA Pro (tiên tiến nhất)

46%

Giảm số lỗi trên bộ đo chuẩn OfficeQA Pro so với GPT-5.4

Đang tải…

Databricks đang cung cấp GPT‑5.5 cho các quy trình tác nhân của khách hàng sau khi mô hình này thiết lập mức tiên tiến nhất mới trên OfficeQA Pro, chính là bộ đo chuẩn của công ty cho các tác vụ tài liệu doanh nghiệp phức tạp.

OfficeQA Pro đánh giá cách các mô hình xử lý phân tích cú pháp, truy xuất và suy luận có căn cứ trong các quy trình liên quan đến PDF được quét, tệp cũ và tài liệu ngữ cảnh dài, vốn là những tác vụ thường làm gãy các hệ thống tác nhân đang vận hành.

Trong thiết lập hệ thống điều khiển tác nhân, GPT‑5.5 đã giảm lỗi 46% so với GPT‑5.4 và trở thành mô hình đầu tiên vượt mốc 50% về độ chính xác trên OfficeQA Pro.

“Codex với 5.5 hiện là mô hình tiên tiến nhất trong số tất cả tác nhân và mô hình hiện có.”

–Arnav Singhvi, Kỹ sư nghiên cứu

Hiệu năng SOTA trên OfficeQA Pro

OfficeQA Pro có số lượng lớn tài liệu doanh nghiệp được quét hoặc đã cũ, nơi những lỗi trích xuất nhỏ trong quá trình phân tích cú pháp có thể gây hiệu ứng lan truyền xuống các bước tiếp theo của toàn bộ quy trình. “Khi bạn không thể trích xuất một chữ số hay con số nhất định, điều đó sẽ thay đổi toàn bộ quỹ đạo của những gì tác nhân xử lý,” Singhvi giải thích.

Databricks ghi nhận mức cải thiện lớn nhất từ GPT‑5.5 trong các quy trình nặng về phân tích cú pháp này. “Các mô hình trước như 5.4 không thể phân tích đúng tất cả chữ số, nhưng có vẻ như 5.5 đã tạo ra bước nhảy vọt trong việc phân tích tài liệu cũ và PDF được quét,” theo lời Singhvi.

Nhóm cũng ghi nhận các cải thiện trong điều phối trên các tác vụ nhiều bước. “Một điều chúng tôi thấy ở 5.4 là đôi khi mô hình sa vào đường vòng tìm kiếm vòng vo không cần thiết, dẫn đến các quỹ đạo rất kém hiệu quả,” Singhvi cho biết.

So với các mô hình trước đó, GPT‑5.5 đáng tin cậy hơn trong việc truy xuất ngữ cảnh liên quan và hoàn thành các quy trình phức tạp mà không cần giám sát thêm.

Đưa GPT‑5.5 vào các quy trình vận hành thực tế

Databricks hiện cung cấp GPT‑5.5 thông qua AI Unity Gateway, nơi khách hàng sử dụng mô hình này trong các quy trình được xây dựng bằng AgentBricks và API Agent Supervisor. Trong các hệ thống này, GPT‑5.5 điều phối việc phân tích cú pháp, truy xuất và thực thi trên các tác nhân chuyên biệt.

“Chúng tôi sẽ thấy rất nhiều khách hàng sử dụng AgentBricks và API Agent Supervisor cho các quy trình tác nhân tùy chỉnh,” Singhvi nói. “Việc để GPT‑5.5 giám sát các quy trình này thực sự rất thú vị.”

“GPT-5.5 là cách tuyệt vời để nâng cao tri thức. Đó là một bước ngoặt đáng kể trong công việc tri thức đối với chúng tôi.”

—Arnav Singhvi, Kỹ sư nghiên cứu

Tham gia kỷ nguyên làm việc mới

Hơn 1 triệu doanh nghiệp trên toàn thế giới đang đạt được kết quả có ý nghĩa với OpenAI.

Liên hệ bộ phận bán hàng

Hãy tiếp tục xem

How agents are transforming work

Công ty25 thg 6, 2026

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI và Broadcom trình làng chip suy luận tối ưu hóa cho LLM

Công ty24 thg 6, 2026

Helping build shared standards for advanced AI - card image

Góp phần xây dựng tiêu chuẩn chung cho AI tiên tiến

Vấn đề toàn cầu23 thg 6, 2026