15 พฤษภาคม 2569

Databricks นำ GPT‑5.5 มาใช้ในเวิร์กโฟลว์เอเจนต์ระดับองค์กร

GPT‑5.5 สร้างสถิติในการทำคะแนนสูงสุดครั้งใหม่บน OfficeQA Pro ซึ่งเป็นเกณฑ์มาตรฐานของ Databricks สำหรับการทดสอบงานเอเจนต์ในองค์กรที่มีความซับซ้อน

ติดต่อฝ่ายขาย

ภาพหลักสำหรับเรื่องราวความสำเร็จของลูกค้า Databricks

ขนาดบริษัท: Enterprise

ภูมิภาค: อเมริกาเหนือ

อุตสาหกรรม: เทคโนโลยี

ผลิตภัณฑ์: Codex

50%

ความแม่นยำในเกณฑ์ทดสอบ OfficeQA Pro (ล้ำหน้าที่สุด)

46%

การลดข้อผิดพลาดในเกณฑ์ทดสอบ OfficeQA Pro เทียบกับ GPT-5.4

กำลังโหลด…

Databricks เปิดให้ลูกค้าใช้งาน GPT‑5.5 ในเวิร์กโฟลว์การทำงานของเอเจนต์แล้ว หลังจากที่โมเดลดังกล่าวสามารถสร้างมาตรฐานใหม่ขั้นสูงสุดในการทดสอบ OfficeQA Pro ซึ่งเป็นเกณฑ์มาตรฐานของบริษัทในการประเมินงานเอกสารระดับองค์กรที่มีความซับซ้อน

OfficeQA Pro ทำหน้าที่ประเมินความสามารถของโมเดลในการจำแนกโครงสร้างข้อมูล การค้นคืนข้อมูล และการใช้เหตุผลเชิงอ้างอิงจากฐานข้อมูลจริง ผ่านกระบวนการทำงานที่เกี่ยวข้องกับเอกสาร PDF ที่เกิดจากการสแกน ไฟล์ระบบเก่า และเอกสารที่มีบริบทยาวมาก ซึ่งงานเหล่านี้มักเป็นสาเหตุที่ทำให้ระบบเอเจนต์ในสภาพแวดล้อมใช้งานจริงเกิดความล้มเหลว

เมื่อทดสอบในสภาพแวดล้อมแบบ Agent-harness พบว่า GPT‑5.5 สามารถลดข้อผิดพลาดลงได้ถึง 46% เมื่อเทียบกับ GPT‑5.4 และกลายเป็นโมเดลแรกที่ทำความแม่นยำทะลุ 50% บนเกณฑ์มาตรฐาน OfficeQA Pro

“ในปัจจุบัน Codex เวอร์ชัน 5.5 ก้าวขึ้นมาเป็นเทคโนโลยีระดับแนวหน้าเหนือบรรดาเอเจนต์และโมเดลทั้งหมดที่มีอยู่ในตลาดแล้ว”

–Arnav Singhvi วิศวกรวิจัย

ประสิทธิภาพระดับชั้นนำบน OfficeQA Pro

OfficeQA Pro รวบรวมเอกสารขององค์กรที่เป็นไฟล์ระบบเก่าหรือไฟล์สแกนไว้เป็นจำนวนมาก ซึ่งข้อผิดพลาดเล็กๆ น้อยๆ ในการดึงข้อมูลระหว่างการจำแนกโครงสร้างข้อมูล สามารถส่งผลกระทบต่อเนื่องเป็นลูกโซ่ไปยังขั้นตอนอื่นๆ ที่เหลือทั้งหมดในเวิร์กโฟลว์ได้ “เมื่อระบบไม่สามารถดึงข้อมูลตัวเลขหรือหลักที่ถูกต้องออกมาได้ ความผิดพลาดนั้นจะเปลี่ยนทิศทางการทำงานทั้งหมดของเอเจนต์ในขั้นตอนต่อๆ ไปทันที” Singhvi อธิบาย

Databricks พบว่าประสิทธิภาพเพิ่มขึ้นสูงสุดจาก GPT‑5.5 ในกระบวนการทำงานที่ต้องอาศัยการแปลงและจัดโครงสร้างข้อมูลปริมาณมากเช่นนี้ “โมเดลรุ่นก่อนหน้านี้อย่าง 5.4 ไม่สามารถจำแนกโครงสร้างข้อมูลตัวเลขทั้งหมดได้อย่างถูกต้อง แต่ดูเหมือนว่าโมเดล 5.5 จะช่วยยกระดับความสามารถในการแปลงข้อมูลเอกสารรุ่นเก่าและไฟล์ PDF ที่มาจากการสแกนขึ้นอย่างก้าวกระโดด” Singhvi กล่าว

ทีมยังเห็นการปรับปรุงด้านการประสานงานในงานหลายขั้นตอนด้วย “สิ่งหนึ่งที่เราเห็นกับ 5.4 คือบางครั้งมันจะออกนอกเส้นทางไปค้นหาสิ่งที่ไม่จำเป็น และนั่นทำให้เส้นทางการทำงานไม่มีประสิทธิภาพมาก” Singhvi กล่าว

เมื่อเทียบกับโมเดลก่อนหน้า GPT‑5.5 เชื่อถือได้มากกว่าในการดึงบริบทที่เกี่ยวข้องและทำเวิร์กโฟลว์ที่ซับซ้อนให้เสร็จโดยไม่ต้องมีการกำกับดูแลเพิ่มเติม

นำ GPT‑5.5 เข้าสู่เวิร์กโฟลว์โปรดักชัน

ในปัจจุบัน Databricks เปิดให้ใช้งาน GPT‑5.5 ผ่าน AI Unity Gateway แล้ว ซึ่งลูกค้าสามารถนำโมเดลนี้ไปใช้ในเวิร์กโฟลว์การทำงานที่สร้างขึ้นด้วย AgentBricks และ Agent Supervisor API ในระบบเหล่านี้ GPT‑5.5 จะประสานการแยกวิเคราะห์ การดึงข้อมูล และการดำเนินการข้ามเอเจนต์เฉพาะทาง

“เรากำลังจะได้เห็นลูกค้าจำนวนมากใช้ AgentBricks และ Agent Supervisor API สำหรับเวิร์กโฟลว์เอเจนต์แบบกำหนดเอง” Singhvi กล่าว “การมี GPT‑5.5 มาดูแลเวิร์กโฟลว์เหล่านี้เป็นเรื่องน่าตื่นเต้นมาก”

“GPT-5.5 ทำผลงานได้ดีมาก โดยเฉพาะในเรื่องการอัปเกรดฐานความรู้ที่แน่นขึ้น มันคือการเปลี่ยนแปลงแบบก้าวกระโดดสำหรับงานความรู้ของเรา”

—Arnav Singhvi วิศวกรวิจัย

ก้าวสู่ยุคใหม่ของการทำงาน

ธุรกิจกว่า 1 ล้านแห่งทั่วโลกต่างเห็นผลลัพธ์จริงจากการใช้ OpenAI

ติดต่อฝ่ายขาย

อ่านต่อ

How agents are transforming work

บริษัท25 มิ.ย. 2569

OpenAI and Broadcom Jalapeño inference chip card image

OpenAI and Broadcom unveil LLM-optimized inference chip

บริษัท24 มิ.ย. 2569

Helping build shared standards for advanced AI - card image

ร่วมกันสร้างมาตรฐานร่วมสำหรับ AI ขั้นสูง

กิจการระหว่างประเทศ23 มิ.ย. 2569