วันนี้เราเปิดตัว AgentKit ชุดเครื่องมือครบวงจรสำหรับนักพัฒนาและองค์กรสำหรับการสร้าง ติดตั้ง และปรับปรุงเอเจนต์ได้อย่างเต็มประสิทธิภาพ ที่ผ่านมาการสร้างเอเจนต์เป็นเรื่องซับซ้อนเนื่องจากต้องใช้เครื่องมือแยกหลายชิ้น ไม่มีระบบที่ใช้กำหนดเวอร์ชัน ต้องทำคอนเน็กเตอร์เอง ต้องประเมินผลด้วยตัวเอง ต้องปรับแต่งคำสั่งเอง และใช้เวลาหลายสัปดาห์ในการพัฒนาส่วนหน้าก่อนเปิดใช้งาน ด้วย AgentKit นักพัฒนาสามารถสร้างเวิร์กโฟลว์แบบภาพและฝัง UI ของเอเจนต์ได้ไวขึ้น ด้วยบล็อกใหม่ๆ เช่น:
- Agent Builder: พื้นที่ทำงานแบบภาพที่ช่วยให้คุณสร้างและจัดการเวอร์ชันเวิร์กโฟลว์หลายเอเจนต์ได้ง่ายๆ
- Connector Registry: ศูนย์กลางสำหรับผู้ดูแลระบบในการจัดการการเชื่อมต่อของข้อมูลและเครื่องมือระหว่างผลิตภัณฑ์ของ OpenAI
- ChatKit: เครื่องมือช่วยให้คุณใส่เอเจนต์สำหรับแชตแบบปรับแต่งเองลงในแอปหรือเว็บไซต์ได้ง่ายๆ
นอกจากนี้เรายังขยายขีดความสามารถในการประเมินผลด้วยฟีเจอร์ใหม่ๆ เช่น ชุดข้อมูล การให้คะแนนแบบติดตาม การเพิ่มประสิทธิภาพของคำสั่งโดยอัตโนมัติ และการรองรับโมเดลจากภายนอกเพื่อช่วยวัดและพัฒนาเอเจนต์ให้ทำงานได้ดีขึ้น
นับตั้งแต่เปิดตัว Responses API และ Agents SDK ในเดือนมีนาคม เราได้เห็นนักพัฒนาและองค์กรใช้เครื่องมือนี้ในการสร้างเวิร์กโฟลว์เอเจนต์แบบครบวงจรเพื่อทำงานวิจัยเชิงลึก สนับสนุนลูกค้า และด้านอื่นๆ อีกมากมาย Klarna สร้างเอเจนต์ช่วยเหลือ ที่สามารถจัดการรายการขอความช่วยเหลือได้ถึงสองในสาม ในขณะที่ Clay แสดงให้เห็นถึงการเติบโตเพิ่มขึ้น 10 เท่า ด้วยการใช้เอเจนต์ส่งเสริมการขาย AgentKit พัฒนาต่อยอดจาก Responses API เพื่อช่วยให้นักพัฒนาสร้างเอเจนต์ได้อย่างมีประสิทธิภาพและเชื่อถือได้มากขึ้น
นักพัฒนาจำเป็นต้องมีมุมมองที่ชัดเจนขึ้นเกี่ยวกับการทำงานของเอเจนต์เมื่อเวิร์กโฟลว์ของเอเจนต์มีความซับซ้อนมากขึ้น Agent Builder(เปิดในหน้าต่างใหม่) มีแคนวาสแบบภาพให้ผู้ใช้สามารถสร้างตรรกะด้วยการลากและวางโหนด เชื่อมเครื่องมือต่างๆ พร้อมตั้งค่าเกราะป้องกันแบบกำหนดเองได้ เครื่องมือนี้รองรับการรันตัวอย่าง การกำหนดค่าการประเมินผลแบบอินไลน์ และการกำหนดเวอร์ชันแบบสมบูรณ์ ซึ่งเหมาะอย่างยิ่งสำหรับการปรับแก้และการทำซ้ำอย่างรวดเร็ว

ผู้สร้างสามารถเริ่มต้นด้วยแคนวาสเปล่าหรือเทมเพลตที่สร้างไว้ล่วงหน้า
ทีมงานของ Ramp สามารถสร้างเอเจนต์สำหรับผู้ซื้อจากแคนวาสเปล่าๆ ได้ภายในเวลาเพียงไม่กี่ชั่วโมง
Agent Builder ได้เปลี่ยนงานที่เคยใช้เวลาหลายเดือน ทั้งการจัดการที่ซับซ้อน การเขียนโค้ดเฉพาะ และการปรับแต่งด้วยมือ ให้เหลือเพียงไม่กี่ชั่วโมงเท่านั้น แคนวาสแบบภาพช่วยให้ทีมผลิตภัณฑ์ ทีมกฎหมาย และทีมวิศวกรรมมีความเข้าใจตรงกันมากขึ้น ลดรอบการปรับปรุงลง 70% และทำให้เอเจนต์ใช้งานได้ในสองสปรินต์แทนที่จะใช้เวลาสองไตรมาส
ในทำนองเดียวกัน LY Corporation บริษัทเทคโนโลยีและบริการอินเทอร์เน็ตชั้นนำของญี่ปุ่นได้สร้างเอเจนต์ผู้ช่วยงานด้วย Agent Builder ภายในเวลาไม่ถึงสองชั่วโมง
"Agent Builder ทำให้เราจัดการเอเจนต์แบบใหม่ได้ง่ายขึ้น และทำให้วิศวกรกับผู้เชี่ยวชาญสามารถทำงานร่วมกันโดยใช้อินเทอร์เฟซเดียวกันได้ เราได้สร้างเวิร์กโฟลว์แบบหลายเอเจนต์ครั้งแรกและสามารถรันเสร็จภายในสองชั่วโมง ซึ่งช่วยเร่งเวลาในการสร้างและติดตั้งใช้งานเอเจนต์ได้อย่างมาก"
เรากำลังเปิดตัว Connector Registry (ตัวเก็บข้อมูลตัวเชื่อมต่อ) เพื่อให้องค์กรต่างๆ สามารถควบคุมและดูแลจัดการข้อมูลข้ามพื้นที่ทำงานและองค์กรหลายแห่งได้ Connector Registry(เปิดในหน้าต่างใหม่) ทำหน้าที่รวมแหล่งข้อมูลทั้งหมดไว้ในแผงควบคุมเดียว โดยใช้งานได้ทั้ง ChatGPT และ API รีจิสทรีมาพร้อมกับตัวเชื่อมต่อที่เตรียมไว้แล้ว เช่น Dropbox, Google Drive, SharePoint และ Microsoft Teams พร้อมทั้งรองรับ MCPs จากผู้ให้บริการภายนอก
นักพัฒนายังสามารถเปิดการใช้งาน Guardrails(เปิดในหน้าต่างใหม่) ใน Agent Builder ได้ ซึ่งเป็นเลเยอร์ความปลอดภัยแบบโอเพนซอร์สที่ปรับแต่งได้ ช่วยป้องกันเอเจนต์จากการทำงานผิดพลาดหรือการใช้งานที่ไม่ปลอดภัย Guardrails ช่วยปกปิดหรือแจ้งเตือนข้อมูลส่วนบุคคล ตรวจจับการเจลเบรก (Jailbreaks) และเพิ่มมาตรการป้องกันอื่นๆ เพื่อให้นักพัฒนาสร้างและปรับใช้เอเจนต์ที่ปลอดภัยและเชื่อถือได้ง่ายขึ้น Guardrails สามารถใช้งานได้ทั้งแบบเดี่ยวหรือผ่านไลบรารีสำหรับ Python(เปิดในหน้าต่างใหม่) และ JavaScript(เปิดในหน้าต่างใหม่)
การปรับใช้ UI ของแชตสำหรับเอเจนต์อาจซับซ้อนกว่าที่คิด เพราะต้องจัดการกับการตอบกลับแบบสตรีม การจัดการเธรด การแสดงกระบวนการคิดของโมเดล และการออกแบบประสบการณ์การสนทนาให้น่าสนใจ ChatKit(เปิดในหน้าต่างใหม่) ทำให้การฝังเอเจนต์สำหรับแชตเป็นเรื่องง่าย และให้ความรู้สึกเหมือนเป็นส่วนหนึ่งของผลิตภัณฑ์ สามารถฝังลงในแอปหรือเว็บไซต์และปรับแต่งให้ตรงกับธีมหรือแบรนด์ของคุณได้
"ChatKit ช่วยให้เราประหยัดเวลามากกว่าสองสัปดาห์ในการสร้างเอเจนต์สนับสนุนสำหรับชุมชนนักพัฒนา Canva และเราสามารถเชื่อมการใช้งานได้ในเวลาไม่ถึงหนึ่งชั่วโมง เอเจนต์สนับสนุนนี้จะเปลี่ยนวิธีที่นักพัฒนาใช้งานเอกสารของเราให้กลายเป็นการสนทนาแทน ทำให้การสร้างแอปและการเชื่อมต่อบน Canva ง่ายขึ้น"
ChatKit รองรับการใช้งานหลากหลาย ไม่ว่าจะเป็นการใช้ในฐานะผู้ช่วยด้านความรู้ภายในองค์กร คู่มือปฐมนิเทศพนักงงาน ไปจนถึงการเป็นเอเจนต์สนับสนุนลูกค้าและงานวิจัย เอเจนต์ฝ่ายสนับสนุนลูกค้าของ HubSpot(เปิดในหน้าต่างใหม่)เป็นอีกตัวอย่างหนึ่งของการใช้งาน

การสร้างเอเจนต์ที่เชื่อถือได้และมีความพร้อมสำหรับการใช้งานเป็นต้องมีการประเมินประสิทธิภาพอย่างเข้มงวด เมื่อปีที่แล้วเราได้เปิดตัว Evals(เปิดในหน้าต่างใหม่) เพื่อช่วยให้นักพัฒนาทดสอบคำสั่งและวัดพฤติกรรมของโมเดลได้ ขณะนี้เรากำลังเพิ่มความสามารถใหม่สี่ประการที่ทำให้การสร้างการประเมินง่ายยิ่งขึ้น:
- ชุดข้อมูล สร้างการประเมินเอเจนต์ได้อย่างรวดเร็วตั้งแต่เริ่มต้น และขยายชุดประเมินได้ต่อเนื่องด้วยตัวให้คะแนนอัตโนมัติและการอธิบายข้อมูลจากมนุษย์
- การให้คะแนนแบบติดตาม ใช้ประเมินการทำงานของเอเจนต์ตั้งแต่ต้นจนจบ พร้อมระบบให้คะแนนอัตโนมัติ เพื่อค้นหาส่วนที่ต้องปรับปรุง
- การเพิ่มประสิทธิภาพคำสั่งโดยอัตโนมัติ ปรับปรุงคำสั่งให้ฉลาดขึ้น โดยอ้างอิงจากคำอธิบายของมนุษย์และผลการตรวจจากตัวประเมิน
- การรองรับโมเดลจากภายนอก ช่วยให้สามารถประเมินโมเดลจากผู้ให้บริการภายนอกได้ในแพลตฟอร์ม OpenAI Evals ได้
ลูกค้าที่ใช้ Evals ต่างเห็นผลลัพธ์ด้านประสิทธิภาพที่ดีขึ้นมาก
"แพลตฟอร์มการประเมินช่วยลดเวลาในการพัฒนาระบบตรวจสอบที่ใช้หลายเอเจนต์ร่วมกันได้มากกว่า 50% และเพิ่มความแม่นยำของเอเจนต์ขึ้น 30%"

การปรับแต่งแบบเสริมแรง(เปิดในหน้าต่างใหม่) (RFT) ช่วยให้นักพัฒนาสามารถปรับแต่งโมเดลการใช้เหตุผลของเราได้ มีให้ใช้งานบน OpenAI o4-mini และในรุ่นเบตาส่วนตัวสำหรับ GPT‑5 พวกเรากำลังทำงานอย่างใกล้ชิดกับลูกค้าหลายสิบรายเพื่อปรับปรุง RFT สำหรับ GPT‑5 ก่อนที่จะเผยแพร่ในวงกว้าง
วันนี้เรากำลังเปิดตัวสองฟีเจอร์ใหม่ใน RFT เวอร์ชันเบต้า ที่ออกแบบมาเพื่อยกระดับประสิทธิภาพของเอเจนต์ให้ดียิ่งขึ้น:
- การเรียกใช้เครื่องมือแบบกำหนดเอง ช่วยฝึกโมเดลให้เลือกใช้เครื่องมือที่เหมาะสมในเวลาที่ใช่เพื่อการให้เหตุผลที่ดียิ่งขึ้น
- เครื่องมือให้คะแนนแบบกำหนดเอง ตั้งเกณฑ์การประเมินที่ปรับแต่งได้เพื่อเน้นสิ่งที่มีความสำคัญต่อการใช้งานของคุณ
เริ่มตั้งแต่วันนี้ ChatKit และความสามารถใหม่ของ Evals พร้อมให้บริการสำหรับนักพัฒนาทุกคนแล้ว Agent Builder เปิดให้ใช้งานในเวอร์ชันเบต้าแล้ว และ Connector Registry กำลังทยอยเปิดตัวเวอร์ชันเบต้าให้กับลูกค้า API, ChatGPT Enterprise และ Edu บางส่วน โดยมี Global Admin Console(เปิดในหน้าต่างใหม่) (ซึ่งผู้ดูแลระบบส่วนกลางสามารถจัดการโดเมน, SSO, และ API สำหรับองค์กรจำนวนมากได้) จำเป็นต้องมี Global Admin Console ก่อนจึงจะสามารถเปิดใช้งาน Connector Registry ได้ เครื่องมือทั้งหมดนี้รวมอยู่ในราคามาตรฐานของโมเดล API
เราจะเพิ่ม Workflows API แบบแยกต่างหาก และจะเพิ่มตัวเลือกการปรับใช้เอเจนต์ลงใน ChatGPT เร็วๆ นี้
เราตั้งตารอที่จะชื่นชมสิ่งที่คุณสร้างสรรค์


