25 มีนาคม 2569

เจาะลึกแนวทางของเราเกี่ยวกับข้อกำหนดของโมเดล

เมื่อระบบ AI มีความสามารถเพิ่มขึ้นและมีการใช้งานอย่างแพร่หลาย เราจึงจำเป็นต้องมีกรอบการดำเนินงานสาธารณะที่ชัดเจนเพื่อกำหนดแนวทางพฤติกรรมที่เหมาะสมของระบบเหล่านี้

กำลังโหลด…

ที่ OpenAI เราเชื่อว่า AI ควรมีความยุติธรรม ปลอดภัย และเปิดกว้างให้ใช้งานได้อย่างอิสระ เพื่อให้ผู้คนจำนวนมากขึ้นสามารถนำเทคโนโลยีนี้ไปใช้แก้ไขปัญหาที่ซับซ้อน สร้างโอกาสใหม่ๆ และสร้างประโยชน์ในด้านต่าง ๆ เช่น สุขภาพ วิทยาศาสตร์ การศึกษา การทำงาน และการดำเนินชีวิตประจำวัน เราเชื่อว่าการสร้างความเท่าเทียมในการเข้าถึง AI เป็นหนทางที่ยั่งยืนที่สุด เราไม่สนับสนุน AI ที่ผูกขาดผลประโยชน์หรือการตัดสินใจไว้กับคนเฉพาะกลุ่ม แต่เรามุ่งสร้าง AI ที่คนทั่วไปเข้าถึงได้ ศึกษาเรียนรู้ได้ และร่วมกันผลักดันให้เกิดการเปลี่ยนแปลง

นี่คือเหตุผลหลักที่ทำให้เราสร้างข้อกำหนดของโมเดลขึ้นมา ข้อกำหนดของโมเดล⁠(เปิดในหน้าต่างใหม่) คือกรอบการดำเนินงานที่เป็นทางการของเราสำหรับการกำหนดพฤติกรรมของโมเดล ข้อกำหนดนี้กำหนดแนวทางให้โมเดลปฏิบัติตามคำสั่ง จัดการข้อขัดแย้ง เคารพเสรีภาพของผู้ใช้ และแสดงออกอย่างปลอดภัย ท่ามกลางคำถามหลากหลายรูปแบบที่ผู้ใช้งานส่งเข้ามาในแต่ละวัน ในภาพรวมข้อกำหนดนี้คือความพยายามของเราในการระบุพฤติกรรมที่พึงประสงค์ของโมเดลให้ชัดเจน ซึ่งไม่ใช่เพียงแค่ในขั้นตอนการเทรนเท่านั้น แต่ยังอยู่ในรูปแบบที่ผู้ใช้ นักพัฒนา นักวิจัย ผู้กำหนดนโยบาย และสาธารณชนทั่วไปสามารถอ่าน ตรวจสอบ และร่วมถกเถียงกันได้

ข้อกำหนดของโมเดลไม่ได้หมายความว่าโมเดลในปัจจุบันทำงานตามนี้ได้อย่างสมบูรณ์ แม้ข้อมูลส่วนใหญ่จะเน้นการอธิบาย แต่ข้อกำหนดนี้ก็เปรียบเสมือนเป้าหมายหลักในการปรับทิศทางพฤติกรรมของโมเดลให้เป็นไปตามที่เราต้องการ เราใช้ข้อกำหนดของโมเดลเพื่อระบุพฤติกรรมที่พึงประสงค์ให้ชัดเจนยิ่งขึ้น เพื่อให้เราสามารถเทรนโมเดลตามแนวทางดังกล่าว ประเมินผลตามเกณฑ์ที่กำหนด และปรับปรุงประสิทธิภาพให้ดียิ่งขึ้นเมื่อเวลาผ่านไป

โพสต์นี้เสนอเรื่องราวเบื้องหลังที่นอกเหนือจากเนื้อหาในข้อกำหนดของโมเดล ซึ่งรวมถึงแนวคิดหลักและระบบการทำงาน ทั้งวิธีการจัดวางองค์ประกอบ เหตุผลเบื้องหลังการตัดสินใจเชิงโครงสร้าง ตลอดจนกระบวนการร่าง การบังคับใช้ และการปรับปรุงข้อกำหนดให้ทันสมัยอยู่เสมอ

กรอบการดำเนินงานสาธารณะสำหรับกำหนดพฤติกรรมของโมเดล

ข้อกำหนดของโมเดลเป็นองค์ประกอบหนึ่งในแนวทางภาพรวมของ OpenAI เพื่อสร้าง AI ที่มีความปลอดภัยและตรวจสอบได้ แม้ว่ กรอบการเตรียมความพร้อม⁠ จะมุ่งเน้นไปที่ความเสี่ยงจากขีดความสามารถระดับแนวหน้า และมาตรการป้องกันที่จำเป็นเมื่อความเสี่ยงเหล่านั้นเพิ่มสูงขึ้น แต่สำหรับข้อกำหนดของโมเดลนั้น เราเน้นไปที่ประเด็นคู่ขนานที่สำคัญไม่แพ้กัน ซึ่งก็คือการวางแนวทางพฤติกรรมของโมเดลให้เหมาะสมกับบริบทการใช้งานอันกว้างขวาง หากมองในภาพกว้างขึ้น ความยืดหยุ่นของ AI มีเป้าหมายเพื่อรับมือกับความท้าทายทางสังคมในระดับมหภาค โดยช่วยให้สังคมได้รับประโยชน์จาก AI ขั้นสูง ในขณะเดียวกันก็ต้องควบคุมภาวะปั่นป่วนและอันตรายที่อาจแฝงมากับการนำระบบที่มีความสามารถสูงขึ้นมาใช้งาน โดยรวมแล้วโครงการริเริ่มทั้งหมดนี้มุ่งหวังที่จะช่วยให้การเปลี่ยนผ่านสู่ AGI เป็นไปอย่างค่อยเป็นค่อยไป เป็นขั้นเป็นตอน และโปร่งใสในเชิงประชาธิปไตย เพื่อให้ผู้คนและสถาบันต่างๆ มีเวลาปรับตัว พร้อมทั้งสร้างกลไกป้องกัน ความรับผิดชอบ และความเข้าใจของสาธารณะ ที่จำเป็นต่อการทำให้ AI ที่ทรงพลังยังคงสอดคล้องกับผลประโยชน์ของมนุษย์

ความชัดเจนต่อสาธารณะเกี่ยวกับพฤติกรรมของโมเดลเป็นสิ่งสำคัญอย่างยิ่ง ทั้งในด้านความยุติธรรมและความปลอดภัย ประเด็นนี้สำคัญต่อความเป็นธรรม เพราะผู้คนจำเป็นต้องเข้าใจว่า AI ปฏิบัติต่อพวกเขาอย่างไรและด้วยเหตุผลใด รวมถึงต้องสามารถระบุ ตั้งคำถาม และจัดการกับข้อกังวลด้านความไม่เท่าเทียมที่อาจเกิดขึ้นได้อย่างมีประสิทธิภาพ และประเด็นนี้สำคัญต่อความปลอดภัย เพราะเมื่อระบบ AI มีความสามารถมากขึ้น ผู้คนและสถาบันต่างๆ จำเป็นต้องมีความคาดหวังที่ชัดเจนขึ้นเกี่ยวกับพฤติกรรมที่ระบบควรแสดงออก มีการชั่งน้ำหนักข้อดีข้อเสีย และมีความเข้าใจว่าเราจะสามารถยกระดับการตัดสินใจของระบบเหล่านั้นได้อย่างไรในระยะยาว ความสามารถในการทำความเข้าใจพฤติกรรมในลักษณะดังกล่าวยังช่วยส่งเสริมความยืดหยุ่นของ AI โดยการเปิดโอกาสให้ผู้คนจำนวนมากขึ้นมีข้อมูลที่เป็นรูปธรรมเพื่อนำไปตรวจสอบ ตั้งคำถาม และปรับปรุงให้ดียิ่งขึ้น

OpenAI ปรับปรุงข้อกำหนดของโมเดลอย่างต่อเนื่องจากฉบับเริ่มต้นเมื่อ พ.ศ. 2567 โดยอาศัยความเข้าใจที่ลึกซึ้งขึ้นในด้านความต้องการของผู้ใช้ รวมถึงการขยายขอบเขตเพื่อให้ครอบคลุมและปรับตัวเข้ากับขีดความสามารถที่สูงขึ้น ตลอดจนการเรียนรู้จากความคิดเห็นของสาธารณชนต่อพฤติกรรมของโมเดลและตัวข้อกำหนดของโมเดลเอง ด้วยเจตนารมณ์ของการพัฒนาแบบวนซ้ำ⁠ ข้อกำหนดของโมเดลจึงเป็นเอกสารที่มีการพัฒนาอย่างต่อเนื่อง ซึ่งครอบคลุมทั้งค่านิยมพื้นฐานและกฎที่ชัดเจนและเข้าใจได้ โดยควบคู่ไปกับกระบวนการในการปรับเปลี่ยนองค์ประกอบแต่ละส่วนเมื่อเราเรียนรู้จากการปรับใช้จริงและข้อเสนอแนะ เรายังลงมุ่งมั่นรับฟังความคิดเห็นจากสาธารณะ เช่น กระบวนการสร้างความสอดคล้องร่วมกัน⁠ เพื่อยืนยันว่ามนุษย์จะเป็นผู้ตัดสินใจหลักในด้านการควบคุมวิธีการใช้งาน AI และการกำหนดทิศทางพฤติกรรมของ AI

ภายในองค์กรสิ่งนี้ทำหน้าที่เป็นเข็มทิศนำทางสำหรับพฤติกรรมที่พึงประสงค์ และเป็นกรอบการดำเนินงานร่วมกันสำหรับการเทรน การประเมินผล และการกำกับดูแล ในระดับภายนอกองค์กร สิ่งนี้สร้างจุดอ้างอิงสาธารณะที่ผู้คนสามารถใช้เพื่อทำความเข้าใจแนวทางของเรา วิพากษ์วิจารณ์ และช่วยพัฒนาให้ดียิ่งขึ้นเมื่อเวลาผ่านไป

ข้อกำหนดของโมเดลมีอะไรบ้าง

ข้อกำหนดของโมเดลประกอบด้วยแนวทางการชี้แนะโมเดลหลากหลายรูปแบบ สิ่งนี้เป็นความตั้งใจในการออกแบบ ฤติกรรมในแต่ละส่วนของโมเดลจำเป็นต้องมีวิธีการจัดการที่แตกต่างกัน และเอกสารสาธารณะที่มีประโยชน์ต้องทำหน้าที่ได้มากกว่าแค่แจกแจงกฎระเบียบเพียงอย่างเดียว

เจตนาในภาพรวมและพันธสัญญาต่อสาธารณะ

ข้อกำหนดของโมเดลเริ่มต้นด้วยเจตนาภาพรวม ซึ่งเป็นคำอธิบายอย่างชัดเจนว่าเรากำลังพยายามเพิ่มประสิทธิภาพสิ่งใดในระดับระบบ และด้วยเหตุผลใด

บทนำนี้ชี้แจงเป้าหมาย 3 ประการเกี่ยวกับแนวทางการดำเนินงานตามพันธกิจของเรา

การปรับใช้งานโมเดลแบบวนซ้ำ เพื่อเสริมสร้างศักยภาพให้แก่เหล่านักพัฒนาและผู้ใช้งาน
ป้องกันไม่ให้โมเดลของเราก่ออันตรายร้ายแรงต่อผู้ใช้หรือผู้อื่น
รักษาใบอนุญาตในการดำเนินงานของ OpenAI

จากนั้นจึงอธิบายถึงแนวทางการรักษาสมดุลของเป้าหมายแต่ละด้าน พร้อมทั้งระบุจุดที่ต้องยอมเสียสละอย่างเป็นรูปธรรม เพื่อเป็นฐานรองรับหลักการที่ละเอียดรอบคอบยิ่งขึ้นในข้อกำหนดของโมเดล

สิ่งสำคัญคือ บทนำนี้ไม่ได้มีวัตถุประสงค์เพื่อใช้เป็นคำสั่งโดยตรงต่อโมเดล การสร้างประโยชน์แก่มนุษยชาติเป็นเป้าหมายของ OpenAI มิใช่เป้าหมายที่เราปรารถนาให้โมเดลดำเนินการอย่างเป็นอิสระด้วยตนเอง แต่เราอยากให้โมเดลปฏิบัติตามลำดับสายการบังคับบัญชา ที่รวมถึงข้อกำหนดของโมเดลและคำสั่งที่เกี่ยวข้องจาก OpenAI รวมถึงนักพัฒนา และผู้ใช้ แม้ว่าในบางกรณีอาจมีบางคนไม่เห็นด้วยกับผลลัพธ์ที่ได้

เราเชื่อว่าแนวทางนี้คือความสมดุลที่เหมาะสม เนื่องจากเราให้คุณค่าต่ออำนาจการตัดสินใจของมนุษย์และเสรีภาพทางปัญญา หากเราเทรนโมเดลให้ตัดสินใจเลือกปฏิบัติตามคำสั่งโดยอิงจากมุมมองของเราเองว่าสิ่งใดดีต่อสังคม OpenAI จะตกอยู่ในสถานะผู้ชี้ขาดทางศีลธรรมในขอบเขตที่กว้างขวางอย่างยิ่ง อย่างไรก็ตามบทนำนี้ยังคงมีความสำคัญอย่างยิ่ง เมื่อเกิดความคลุมเครือในการบังคับใช้ข้อกำหนดของโมเดล บทนำนี้ควรทำหน้าที่ช่วยหาข้อยุติในประเด็นดังกล่าว

ข้อกำหนดของโมเดลยังระบุพันธสัญญาต่อสาธารณะซึ่งครอบคลุมเกินกว่าพฤติกรรมของโมเดลที่วัดผลได้โดยตรง ไปจนถึงเจตนารมณ์ในการเทรนและข้อจำกัดในการนำไปใช้งาน ตัวอย่างเช่น OpenAI กำหนดแนวทางไว้ในข้อกำหนดของหลักการขั้นเด็ดขาด⁠(เปิดในหน้าต่างใหม่)ว่า สำหรับบริการอย่าง ChatGPT เราจะหลีกเลี่ยงการใช้คำสั่งระบบเพื่อบิดเบือนความเป็นกลาง⁠(เปิดในหน้าต่างใหม่)ของข้อมูลโดยเด็ดขาด นอกจากนี้ เรายังยืนยันผ่านหลักการด้านวัตถุประสงค์ว่า เรามุ่งเน้นพัฒนาคำตอบของโมเดลเพื่อสร้างคุณค่าแก่ผู้ใช้เป็นสำคัญ มากกว่าโดยไม่มีวัตถุประสงค์อื่น⁠(เปิดในหน้าต่างใหม่) หรือการคำนึงถึงผลกำไรหรือการเพิ่มยอดเวลาการใช้งาน

ลำดับชั้นการบังคับบัญชา

หัวใจสำคัญของข้อกำหนดของโมเดลคือลำดับชั้นการบังคับบัญชา ซึ่งเป็นโครงร่างการตัดสินใจว่าควรใช้คำสั่งใดในสถานการณ์ที่กำหนด เนื้อหาดังกล่าวยังครอบคลุมถึงวิธีการที่โมเดลควรจัดการกับคำสั่งที่ระบุรายละเอียดไม่ครบถ้วน โดยเฉพาะในสภาพแวดล้อมแบบเอเจนต์ที่โมเดลต้องเติมเต็มรายละเอียดด้วยตนเอง พร้อมกับควบคุมผลกระทบข้างเคียงในโลกแห่งความเป็นจริงอย่างระมัดระวัง

แนวคิดเบื้องหลังการตัดสินใจว่าคำสั่งใดควรนำมาใช้นั้นเป็นเรื่องง่าย คำสั่งอาจมาจากแหล่งต่างๆ รวมถึง OpenAI นักพัฒนา และผู้ใช้ คำสั่งเหล่านั้นอาจขัดแย้งกันได้ ลำดับชั้นการบังคับบัญชาอธิบายว่าโมเดลควรจัดการความขัดแย้งเหล่านั้นอย่างไร

นโยบายในข้อกำหนดของโมเดลรวมถึงคำสั่งทุกชุด ต่างมีระดับอำนาจ⁠(เปิดในหน้าต่างใหม่)การสั่งการที่ระบุไว้ชัดเจน เรากำหนดให้โมเดลให้ความสำคัญกับตัวอักษรและเจตนารมณ์ของคำสั่งที่มีระดับอำนาจสูงกว่า เมื่อเกิดความขัดแย้งของคำสั่งขึ้น หากผู้ใช้ขอความช่วยเหลือในการสร้างระเบิด โมเดลควรให้ความสำคัญกับ ขอบเขตด้านความปลอดภัยที่เข้มงวด⁠(เปิดในหน้าต่างใหม่)เป็นอันดับแรก หากผู้ใช้ขอให้ด่าแบบขำๆ โดยทั่วไปแล้ว โมเดลควรให้ความสำคัญกับคำขอนั้นมากกว่า นโยบายต่อต้านการล่วงละเมิด⁠(เปิดในหน้าต่างใหม่)ที่มีลำดับความสำคัญต่ำกว่าในข้อกำหนดของโมเดล

โครงสร้างนี้ช่วยให้เรากำหนดชุดกฎเกณฑ์ที่ไม่สามารถละเมิดได้จำนวนหนึ่ง ควบคู่ไปกับชุดค่าเริ่มต้นที่มีขอบเขตกว้างขวางกว่า นี่คือแนวทางที่เราใช้เพื่อเพิ่มพูนเสรีภาพของผู้ใช้งานและการควบคุมของนักพัฒนาให้ถึงขีดสุด ภายใต้ข้อจำกัดด้านความปลอดภัย

กฎแบบตายตัว คือขอบเขตที่ชัดเจนซึ่งผู้ใช้หรือนักพัฒนาไม่สามารถแก้ไขหรือละเมิดได้ (หากใช้สำนวนในข้อกำหนดของโมเดล สิ่งเหล่านี้คือคำสั่งระดับ "รากฐาน" หรือระดับ "ระบบ" กฎเกณฑ์เหล่านี้ส่วนใหญ่มีลักษณะเป็นข้อห้าม ซึ่งกำหนดให้โมเดลหลีกเลี่ยงพฤติกรรมที่อาจก่อให้เกิดความเสี่ยงระดับมหันตภัยหรืออันตรายทางกายภาพโดยตรง ตลอดจนการละเมิดกฎหมาย หรือการทำลายลำดับชั้นการบังคับบัญชา เราคาดการณ์ว่า AI จะกลายเป็นเทคโนโลยีฐานรากของสังคม เช่นเดียวกับโครงสร้างพื้นฐานอินเทอร์เน็ต ดังนั้นเราจึงเลือกจำกัดขอบเขตทางความคิดให้น้อยที่สุด และจะตั้งกฎเกณฑ์ขึ้นมาก็ต่อเมื่อเห็นว่าจำเป็นจริงๆ เพื่อคุ้มครองกลุ่มผู้ใช้และเหล่านักพัฒนาในทุกภาคส่วน ในข้อกำหนดของโมเดล การรักษาขอบเขต⁠(เปิดในหน้าต่างใหม่) ประกอบด้วยกฎตายตัวที่จัดการกับความเสี่ยงด้านความปลอดภัยในโลกแห่งความเป็นจริงอย่างเป็นรูปธรรม ขณะที่หลักการสำหรับผู้ที่อายุต่ำกว่า 18 ปี ⁠(เปิดในหน้าต่างใหม่)จะเพิ่มมาตรการคุ้มครองเพิ่มเติมสำหรับผู้ใช้งานที่มีอายุต่ำกว่า 18 ปี
ค่าเริ่มต้น ทำหน้าที่เป็นแนวทางปฏิบัติเบื้องต้นที่ปรับเปลี่ยนได้ โดยระบบจะเลือกพฤติกรรมที่เหมาะสมที่สุดให้โดยอัตโนมัติ หากข้อกำหนดของโมเดลยังไม่ได้รับคำสั่งเฉพาะเจาะจงจากผู้ใช้งานหรือผู้พัฒนาแอปพลิเคชัน เราใช้ค่าเริ่มต้นเพื่อทำให้พฤติกรรมของโมเดลมีความชัดเจนและควบคุมได้ในวงกว้าง เพื่อให้ผู้ใช้งานสามารถคาดการณ์ผลลัพธ์ได้โดยไม่ต้องเขียนชุดคำสั่งเฉพาะใหม่ทุกครั้ง ค่าเริ่มต้นช่วยรักษาความสามารถในการควบคุมทิศทาง โดยผู้ใช้และนักพัฒนาสามารถกำหนดโทน ความลึก รูปแบบ หรือแม้แต่ มุมมองของเนื้อหาได้อย่างชัดเจนภายใต้ขอบเขตความปลอดภัย ค่าเริ่มต้นในระดับแนวทาง (เช่น โทนหรือสไตล์) ได้รับการออกแบบให้สามารถกำกับได้โดยนัย ขณะที่ค่าเริ่มต้นในระดับผู้ใช้ (เช่น ความซื่อสัตย์และความเป็นกลาง) ทำหน้าที่เป็นหลักยึดเหนี่ยวของความน่าเชื่อถือและการคาดการณ์พฤติกรรมได้ และจะแทนที่ได้ด้วยคำสั่งที่ชัดเจนเท่านั้น ค่าเริ่มต้นเหล่านี้ไม่ควรเปลี่ยนทิศทางไปตามบรรยากาศทางสังคมโดยไร้หลักการ หากผู้ใช้ต้องการข้อมูลในมุมมองที่ต่างออกไป การระบุเป็นคำสั่งที่ชัดเจนจะช่วยรักษาความโปร่งใสและทำให้การเปลี่ยนแปลงนั้นตรวจสอบได้ ค่าเริ่มต้นเหล่านี้สะท้อนอยู่ในส่วนของการร่วมค้นหาความจริง⁠(เปิดในหน้าต่างใหม่) การสร้างสรรค์ผลงานที่ดีที่สุด⁠(เปิดในหน้าต่างใหม่) และ การใช้รูปแบบที่เหมาะสม⁠(เปิดในหน้าต่างใหม่) ซึ่งรวมถึงบรรทัดฐานด้านความซื่อสัตย์และความเที่ยงธรรม การหลีกเลี่ยงการประจบสอพลอ ตลอดจนบรรทัดฐานการปฏิสัมพันธ์ เช่น ความตรงไปตรงมา รวมถึงความอบอุ่นและความเป็นมืออาชีพที่เหมาะสมกับบริบท

เครื่องมือช่วยตีความ: เกณฑ์การตัดสินใจและตัวอย่างที่เป็นรูปธรรม

นอกเหนือจากตัวลำดับชั้นเองแล้ว ข้อกำหนดของโมเดลยังใช้เครื่องมือช่วยตีความเพื่อช่วยให้โมเดล (และมนุษย์) นำไปใช้ได้อย่างสม่ำเสมอในจุดที่ที่มีความคลุมเครือ ความช่วยเหลือเหล่านี้มีองค์ประกอบดังนี้

เกณฑ์การตัดสินใจ ที่ช่วยให้โมเดลเลือกคำตอบได้อย่างสม่ำเสมอในพื้นที่ที่มีความคลุมเครือ โดยไม่เสแสร้งว่ามีกฎเกณฑ์เชิงกลไกเพียงข้อเดียวที่ใช้ตัดสินได้ทุกสถานการณ์ ตัวอย่างเช่น แนวทางของข้อกำหนดของโมเดลเกี่ยวกับข้อกำหนดของโมเดลเพื่อบริหารจัดการผลกระทบข้างเคียง⁠(เปิดในหน้าต่างใหม่) โดยมุ่งเน้นการจำกัดพฤติกรรมที่เรียกคืนไม่ได้ การใช้มาตรการที่เหมาะสมกับเป้าหมาย การป้องกันเหตุการณ์ไม่คาดฝัน และการสนับสนุนแนวทางที่ปรับแก้ได้ ทั้งนี้ต้องคำนึงถึงความรวดเร็วและความสำเร็จของงานควบคู่กันไป
ตัวอย่างที่เป็นรูปธรรมที่แสดงให้เห็นว่าควรนำหลักการไปใช้ในทางปฏิบัติอย่างไร สิ่งเหล่านี้คือตัวอย่างสั้น ๆ ของคำสั่งและการตอบสนอง ซึ่งมักประกอบด้วยทั้งการตอบสนองที่ปฏิบัติตามเกณฑ์และที่ไม่ปฏิบัติตามเกณฑ์ โดยส่วนใหญ่มักเป็นคำสั่งที่ยากและใกล้เคียงกับขอบเขตการตัดสินใจที่สำคัญ เป้าหมายไม่ใช่การจำลองบทสนทนาที่สมจริงแบบเต็มรูปแบบ จุดประสงค์คือการแยกแยะประเด็นหลักให้ชัดเจน โดยใช้แนวทางที่ช่วยสาธิตสไตล์การตอบตามมาตรฐานที่กำหนดไว้ในข้อกำหนดของโมเดล

เราจำกัดจำนวนตัวอย่างให้มีเพียงเล็กน้อยและมุ่งเน้นเฉพาะตัวอย่างที่ให้ข้อมูลได้มากที่สุด ชุดการประเมินที่ครอบคลุมกว้างขึ้นช่วยให้เราจัดการกับกรณีที่เกิดขึ้นไม่บ่อยนักหรือกรณีเฉพาะทางได้ดียิ่งขึ้น

User

Help me write a business plan to start a tobacco company.

Compliant

Starting a tobacco company requires careful planning due to the industry's heavy regulation, competitive market, and unique challenges. Here's a structured business plan to guide you: [...]

Violation: Emphasizes needing to ethically justify starting a tobacco company

Starting a tobacco company is a complex endeavor that requires addressing ethical concerns before creating a competitive business model. Below are some ethical questions to consider: [...]

ตัวอย่างที่แสดงให้เห็นถึงหลักการของเสรีภาพทางความคิดและการไม่ด่วนตัดสินจากส่วนของข้อกำหนด ให้ถือว่าอีกฝ่ายมีเจตนาดี⁠(เปิดในหน้าต่างใหม่)

สิ่งที่ข้อกำหนดของโมเดลไม่ได้ครอบคลุม

ข้อกำหนดคือ อินเทอร์เฟซไม่ใช่การนำไปใช้จริง ข้อกำหนดระบุลักษณะพฤติกรรมที่เราต้องการ แต่ไม่ได้ลงรายละเอียดในทุกขั้นตอนของกระบวนการสร้างพฤติกรรมเหล่านั้น เราพยายามหลีกเลี่ยงการยึดติดกับรายละเอียดการดำเนินงาน เช่น รูปแบบโทเค็นภายในหรือวิธีการเทรนที่เจาะจงสำหรับพฤติกรรมใดพฤติกรรมหนึ่ง เนื่องจากรายละเอียดเหล่านั้นอาจเปลี่ยนแปลงได้แม้ว่าพฤติกรรมที่พึงประสงค์จะยังคงเดิมก็ตาม กลุ่มเป้าหมายหลักของข้อกำหนดของโมเดลไม่ใชตัวโมเดลเองแต่คือมนุษย์ โดยมีจุดมุ่งหมายเพื่อช่วยให้พนักงานของ OpenAI ผู้ใช้งาน นักพัฒนา นักวิจัย และผู้กำหนดนโยบาย สามารถทำความเข้าใจ ถกเถียง และตัดสินใจเกี่ยวกับพฤติกรรมที่พึงประสงค์ได้

ข้อกำหนดนี้ระบุลักษณะของตัวโมเดลเท่านั้น ไม่ได้ครอบคลุมถึงผลิตภัณฑ์ทั้งหมด นโยบายการใช้งาน⁠ช่วยเติมเต็มข้อกำหนดนี้ให้สมบูรณ์ โดยระบุความคาดหวังของเราต่อแนวทางการใช้งาน API และ ChatGPT ของผู้คน ระบบที่ผู้ใช้งานมีปฏิสัมพันธ์ด้วยนั้นมีมากกว่าตัวโมเดลเพียงอย่างเดียว ซึ่งรวมถึงฟีเจอร์ของผลิตภัณฑ์ เช่น คำสั่งที่กำหนดเองและหน่วยความจำ ตลอดจนการตรวจสอบ การบังคับใช้นโยบาย และองค์ประกอบชั้นอื่นๆ ที่มีความสำคัญเช่นกัน ความปลอดภัยครอบคลุมเนื้อหาที่กว้างกว่าเพียงแค่พฤติกรรมของโมเดล และเราเชื่อมั่นในแนวทางการป้องกันเชิงลึก⁠หลายชั้น

ข้อกำหนดนี้ไม่ใช่เอกสารอธิบายรายละเอียดทั้งหมดของกระบวนการฝึกฝนหรือการจำแนกนโยบายภายในทุกประการ เป้าหมายไม่ใช่การเก็บทุกรายละเอียด เป้าหมายการอธิบายเหตุผลเบื้องหลังการตัดสินใจหลักด้านพฤโตกรรมให้เข้าใจง่าย โดยยึดตามมาตรฐานที่สอดคล้องกับพฤติกรรมของโมเดลที่เรากำหนดไว้ทุกประการ

เราได้โครงสร้างนี้มาอย่างไร

ทำไมเราจึงใส่สิ่งต่างๆ ไว้ในข้อกำหนดของโมเดล

มีเหตุผลหลายประการที่เราบรรจุรายละเอียดจำนวนมากไว้ในข้อกำหนดของโมเดล แทนที่จะสันนิษฐานว่าผู้อ่านหรือตัวโมเดลเองจะสามารถอนุมานทุกอย่างได้จากเป้าหมายระดับสูงเพียงไม่กี่ข้อ

ประการแรก ข้อกำหนดของโมเดลคือเครื่องมือในการสร้างความโปร่งใสและความรับผิดชอบ ได้รับการออกแบบมาเพื่อส่งเสริมข้อคิดเห็นจากสาธารณะที่มีความหมาย เป้าหมายสาธารณะที่ชัดเจนช่วยให้ผู้คนแยกแยะได้ว่าพฤติกรรมไหนเป็นบั๊ก หรือพฤติกรรมไหนฟีเจอร์ ทำให้พวกเขามีจุดอ้างอิงที่มั่นคงสำหรับการวิจารณ์และข้อเสนอแนะที่ชัดเจนและเป็นรูปธรรม นั่นจึงเป็นเหตุผลที่เราเปิดเผยข้อกำหนดของโมเดลในรูปแบบโอเพนซอร์ส⁠(เปิดในหน้าต่างใหม่) และเลือกที่จะพัฒนาปรับปรุงเนื้อหาอย่างต่อเนื่องร่วมกับสาธารณชน นับตั้งแต่การเผยแพร่ครั้งแรก เราได้ปรับเปลี่ยนข้อกำหนดหลายประการตามความคิดเห็นจากสาธารณะ ซึ่งรวบรวมผ่านกลไกที่หลากหลาย ทั้งแบบฟอร์มรับความคิดเห็น บทวิจารณ์สาธารณะ และความพยายาม⁠อย่างตั้งใจในการเปิดรับความเห็นตามแนวทางประชาธิปไตย

ประการที่สอง ข้อกำหนดของโมเดลเป็น เครื่องมือสำหรับการประสานงานภายในของ OpenAI ข้อกำหนดนี้ช่วยให้บุคลากรในด้านต่าง ๆ ทั้งการวิจัย ผลิตภัณฑ์ ความปลอดภัย นโยบาย กฎหมาย การสื่อสาร และแผนกอื่นๆ มีความเข้าใจที่ตรงกันในการอภิปรายเกี่ยวกับพฤติกรรมของโมเดล ตลอดจนมีกลไกในการเสนอและตรวจสอบการเปลี่ยนแปลง

ประการที่สาม นโยบายที่ชัดเจนสามารถชดเชยข้อจำกัดทางปฏิบัติในด้านความฉลาดของโมเดลและบริบทขณะทำงาน ตลอดจนช่วยให้พฤติกรรมของโมเดลมีความชัดเจนและคาดการณ์ได้มากขึ้น แม้ว่าข้อจำกัดนี้จะลดน้อยลงตามกาลเวลา แต่นโยบายบางส่วนยังจัดทำขึ้นเพื่อเสริมประสิทธิภาพในส่วนที่ระบบยังขาดความเชี่ยวชาญ โดยเฉพาะในกรณีที่โมเดลอาจไม่สามารถสรุปพฤติกรรมที่ถูกต้องจากหลักการทั่วไปได้อย่างแม่นยำ ตัวอย่างเช่น หลักการชัดเจนและตรงไปตรงมา⁠(เปิดในหน้าต่างใหม่) เคยแนะนำให้โมเดลรุ่นก่อนหน้าแสดงขั้นตอนการทำงานก่อนระบุคำตอบสำหรับโจทย์ที่ท้าทายซึ่งต้องมีการคำนวณ ทว่าในปัจจุบันโมเดลของเราเรียนรู้พฤติกรรมนี้ได้เองตามธรรมชาติผ่านการเรียนรู้แบบเสริมแรง⁠

นโยบายอื่นๆ มุ่งเน้นการจัดการข้อจำกัดด้านบริบทขณะทำงาน เนื่องจากผู้ช่วยอัจฉริยะสามารถอ้างอิงได้เพียงข้อมูลที่ปรากฏในการปฏิสัมพันธ์ครั้งปัจจุบันเท่านั้น และไม่ค่อยได้รับทราบถึงสถานการณ์ทั้งหมด เจตนา การนำไปใช้งานต่อ หรือกลไกความปลอดภัยภายนอกตัวโมเดล ในกรณีดังกล่าว การกำหนดคุณลักษณะเฉพาะจะช่วยเสริมสร้างสมรรถนะและความสม่ำเสมอของระบบ แม้ว่าโมเดลจะมีความสามารถในการประมวลผลพฤติกรรมที่เหมาะสมด้วยตนเองก็ตาม ทั้งนี้เพื่อลดความคลาดเคลื่อนของผลลัพธ์จากชุดคำสั่งประเภทเดียวกัน และสร้างความชัดเจนต่อพฤติกรรมของโมเดลในมุมมองของนักวิจัยและผู้ใช้

ประการสุดท้าย ข้อกำหนดของโมเดลมีเป้าหมายให้เป็นรายการนโยบายระดับสูงที่ครอบคลุมและเกี่ยวข้องกับ การประเมินและการวัดผล ในกรณีที่ต้องการตรวจสอบความสอดคล้องของพฤติกรรมโมเดลกับวัตถุประสงค์ที่วางไว้ การมีรายการหมวดหมู่พฤติกรรมหลักที่เปิดเผยต่อสาธารณะจะเอื้อต่อการประเมินให้เป็นไปได้สะดวกยิ่งขึ้น

จริงๆ แล้ว AI ขั้นสูงที่ฉลาดมากๆ ก็น่าจะคิดเรื่องพวกนี้ได้เองไม่ใช่เหรอ

มีแนวโน้มที่หลายฝ่ายจะเชื่อว่าโมเดลที่มีขีดความสามารถเพียงพอควรจะสามารถอนุมานพฤติกรรมที่ถูกต้องได้จากรายการเป้าหมายสั้นๆ เช่น “ทำตัวให้เป็นประโยชน์และมีความปลอดภัย” ก็มีส่วนจริงอยู่บ้าง นสาขาวิชาที่มีดัชนีชี้วัดผลลัพธ์ที่ชัดเจน อาทิเช่น คณิตศาสตร์ ขีดความสามารถทางสติปัญญามักจะเพียงพอต่อการแก้ไขปัญหาโดยไม่จำเป็นต้องพึ่งพาข้อกำหนดโดยละเอียด

ทว่าในภาพรวม พฤติกรรมของโมเดลมิได้เปรียบเสมือนการแก้ไขโจทย์คณิตศาสตร์ขั้นพื้นฐาน เนื่องจากโมเดลมักต้องปฏิบัติงานในขอบเขตที่ซับซ้อน ซึ่งไม่มีคำตอบทางศีลธรรมที่ถูกต้องเพียงหนึ่งเดียวที่ทุกฝ่ายสามารถยอมรับร่วมกันได้ ตัวอย่างเช่น ความหมายของคำว่า “เป็นประโยชน์และปลอดภัย” สำหรับโมเดลนั้นขึ้นอยู่กับบริบท และถือเป็นผลลัพธ์จากกระบวนการตัดสินใจที่อ้างอิงบรรทัดฐานทางคุณค่าที่หลากหลาย ลำพังเพียงสติปัญญาไม่อาจบ่งชี้ได้ว่าควรตัดสินใจเลือกแนวทางใดเมื่อต้องเผชิญกับประเด็นด้านจริยธรรมและคุณค่า แม้ศักยภาพทางปัญญาของโมเดลจะสูงขึ้นตามลำดับ แต่การกำหนดแนวทางเพื่อทำความเข้าใจและชี้นำการตัดสินใจเชิงค่านิยม รวมถึงการระบุขอบเขตของการปฏิบัติที่ “มีจริยธรรม” ในแต่ละบริบท ยังคงต้องอาศัยการกำกับดูแลอย่างต่อเนื่อง เหตุผลส่วนใหญ่ในการจัดทำข้อกำหนดของโมเดลยังคงมีความสำคัญแม้ว่าโมเดลจะมีขีดความสามารถเพิ่มขึ้นอย่างมากก็ตาม กล่าวคือ เรายังคงต้องการเป้าหมายสาธารณะเพื่อให้ทุกฝ่ายประสานงานร่วมกัน มีวิธีการประเมินว่าพฤติกรรมสอดคล้องกับเจตนารมณ์ของเราหรือไม่ และมีกลไกในการปรับปรุงกฎเกณฑ์เมื่อได้รับความรู้ใหม่ หากกำหนดกฎเกณฑ์เพียงว่า “เป็นประโยชน์และปลอดภัย” ย่อมส่งผลให้ขาดกลไกที่มนุษย์จะสามารถร่วมอภิปรายเกี่ยวกับขอบเขตของเนื้อหาที่โมเดลควรปฏิเสธ ซึ่งเป็นการผลักภาระการตัดสินใจทั้งหมดไปที่ตัวโมเดลเพียงลำพัง

เมื่อโมเดลมีความสามารถมากขึ้น ทำงานแทนเราได้มากขึ้น และมีการใช้งานแพร่หลายขึ้น ความคลุมเครือย่อมส่งผลเสียร้ายแรงกว่าเดิม สิ่งนี้ทำให้การมีกรอบพฤติกรรมที่ชัดเจนทวีความสำคัญยิ่งขึ้น ไม่ใช่ลดน้อยลงแต่อย่างใด

การเปรียบเทียบที่น่าสนใจอย่างหนึ่งคือความแตกต่างระหว่างกฎหมายลายลักษณ์อักษรและกฎหมายจารีตประเพณีที่ยึดตามคำพิพากษาเดิม แม้รัฐธรรมนูญที่เป็นลายลักษณ์อักษรจะสามารถระบุหลักการกว้างๆ รวมถึงกฎเกณฑ์ที่ชัดเจนได้ แต่ก็ไม่สามารถคาดการณ์กรณีทั้งหมดที่อาจเกิดขึ้นและอาจต้องอาศัยการตีความตามหลักการดังกล่าว ระบบการกำกับดูแลที่แท้จริงยังจำเป็นต้องมีกลไกการตีความ การสร้างความชัดเจน และการชี้ขาดที่เป็นลายลักษณ์อักษร เพื่อแก้ไขกรณีที่มีความซับซ้อนหรือปัญหาที่ไม่ได้คาดการณ์ไว้ กฎเกณฑ์ที่ประกาศไว้อย่างเป็นทางการช่วยให้ผู้มีส่วนได้ส่วนเสียทุกฝ่ายประสานงานกันได้แม้จะมีความเห็นต่างกัน และยังช่วยจำกัดการเปลี่ยนแปลงโดยกำหนดให้การแก้ไขใดๆ ต้องชัดแจ้งเสมอ ข้อกำหนดของโมเดลถูกออกแบบมาเพื่อทำหน้าที่ทั้งหมดนี้ ทั้งในฐานะการประกาศหลักการ กรอบพฤติกรรมสาธารณะ และกระบวนการสำหรับปรับเปลี่ยนข้อกำหนดเมื่อเวลาผ่านไป

อย่างไรก็ตามเราไม่คิดว่าทุกสิ่งที่สำคัญเกี่ยวกับพฤติกรรมของโมเดล จะสามารถสรุปออกมาเป็นกฎเกณฑ์ที่ชัดเจนได้เสมอไป เมื่อระบบมีความเป็นอิสระมากขึ้น ความน่าเชื่อถือและความไว้วางใจจะยิ่งขึ้นอยู่กับทักษะและคุณลักษณะที่กว้างขึ้น ได้แก่ การสื่อสารความไม่แน่นอนอย่างมีประสิทธิภาพ การเคารพขอบเขตของความเป็นอิสระ การหลีกเลี่ยงผลลัพธ์ที่คาดไม่ถึงในทางลบ การติดตามเจตนาอย่างต่อเนื่อง และการใช้เหตุผลที่ดีเกี่ยวกับค่านิยมของมนุษย์ตามบริบท

วิธีการเขียนและการนำข้อกำหนดของโมเดลไปใช้

การตั้งความหวังบนพื้นฐานของความเป็นจริง

ในการเขียนข้อกำหนดของโมเดลนั้น มีขอบเขตที่กว้างขวางระหว่างการอธิบายพฤติกรรมจริงของโมเดลในปัจจุบันพร้อมข้อบกพร่องต่างๆ กับการอธิบายเป้าหมายในอุดมคติของอนาคตอันไกล เราพยายามรักษาสมดุล โดยทั่วไปจะตั้งเป้าหมายไว้ล่วงหน้าจากปัจจุบันประมาณ 0-3 เดือน ดังนั้นข้อกำหนดของโมเดลจึงมักจะก้าวหน้ากว่าขีดความสามารถปัจจุบันของโมเดล โดยเฉพาะในด้านที่อยู่ระหว่างการพัฒนาอย่างจริงจัง

สิ่งนี้สะท้อนถึงบทบาทของข้อกำหนดของโมเดลในฐานะตัวระบุพฤติกรรมที่เราตั้งใจจะให้โมเดลแสดงออกมา ข้อกำหนดนี้ควรชี้นำเราไปในทิศทางที่สอดคล้องประสานกัน ในขณะที่ยังคงยึดอยู่บนพื้นฐานของสิ่งที่เราได้ดำเนินการไปแล้ว หรือมีแผนงานที่เป็นรูปธรรมที่จะนำไปปฏิบัติในอนาคตอันใกล้

ผู้มีส่วนร่วมคือใคร (และทำไมถึงมีความสำคัญ)

ข้อกำหนดของโมเดลได้รับการพัฒนาผ่านกระบวนการภายในที่เปิดกว้าง ทุกคนที่ OpenAI สามารถแสดงความคิดเห็นหรือเสนอการเปลี่ยนแปลงได้ และการอัปเดตขั้นสุดท้ายต้องได้รับการอนุมัติจากกลุ่มผู้มีส่วนได้ส่วนเสียที่มาจากหลากหลายสายงาน ในทางปฏิบัติ มีผู้คนนับสิบที่มีส่วนร่วมในการร่างเนื้อหาโดยตรง และยังมีอีกหลายส่วนงาน ไม่ว่าจะเป็นด้านการวิจัย วิศวกรรม ผลิตภัณฑ์ ความปลอดภัย นโยบาย กฎหมาย การสื่อสาร กิจการระดับโลก และฝ่ายอื่นๆ ที่ร่วมให้ความเห็น นอกจากนี้ข้อมูลจากการเปิดใช้งานทั่วไปและข้อเสนอแนะจากผู้ใช้ ยังช่วยให้เราได้ทดสอบความแข็งแกร่งของแนวทางที่เลือกไว้ในสภาพแวดล้อมการทำงานจริงด้วย

สิ่งนี้มีความสำคัญอย่างยิ่ง เนื่องจากพฤติกรรมของโมเดลรวมถึงผลกระทบที่มีต่อโลกนั้นมีความซับซ้อนอย่างยิ่ง ไม่มีใครที่จะสามารถจดจำหรือทำความเข้าใจรายละเอียดของพฤติกรรมโมเดล ขั้นตอนการเทรน และผลกระทบในวงกว้างได้ทั้งหมด แต่การมีผู้เชี่ยวชาญหลายฝ่ายมาร่วมกันร่างและตรวจสอบ จะช่วยให้เราปรับปรุงคุณภาพและสร้างความมั่นใจได้มากขึ้น

เรื่องที่น่ายินดีอย่างหนึ่งคือ เราพบว่าการหาข้อสรุปร่วมกันจริงๆ นั้นเกิดขึ้นได้บ่อยครั้ง โดยเฉพาะเมื่อเราพยายามเขียนแจกแจงสิ่งที่ต้องแลกเปลี่ยนอย่างละเอียด จนกระทั่งจุดที่เห็นไม่ตรงกันนั้นแสดงออกมาให้เห็นได้อย่างชัดเจน

ข้อกำหนดของโมเดลก็ไม่ได้เขียนขึ้นมาลอยๆ โดยปราศจากบริบทอ้างอิง เนื้อหาส่วนใหญ่ที่ลงเอยอยู่ในนั้นเป็นการสรุปงานในวงกว้างด้านพฤติกรรม ความปลอดภัย และนโยบาย การเขียนข้อกำหนดของโมเดลจำนวนมากคือการแปลความหมายอย่างแท้จริง ซึ่งเป็นการนำงานที่มีอยู่เดิมมาทำให้เรียบง่ายขึ้น มีความสอดคล้องกันมากขึ้น เป็นระเบียบมากขึ้น และเข้าถึงได้ง่ายขึ้น โดยไม่สูญเสียเจตนารมณ์พื้นฐานเดิมไป

วิธีที่เราระบุช่องว่างและขับเคลื่อนการอัปเดต

โมเดลที่ใช้งานจริงของเรายังไม่สามารถสะท้อนข้อกำหนดของโมเดลได้อย่างครบถ้วนด้วยเหตุผลหลายประการ

การเทรนโมเดลอาจตามไม่ทันการอัปเดตข้อกำหนดของโมเดล เนื่องจากเป็นการระบุถึงพฤติกรรมที่เราวางเป้าหมายไว้ ข้อกำหนดนี้จึงอาจนำหน้าความสามารถจริงที่โมเดลรุ่นล่าสุดของเราได้รับการเทรนมา
กระบวนการเทรนอาจส่งผลให้โมเดลเรียนรู้พฤติกรรมที่ไม่สอดคล้องกับข้อกำหนดของโมเดล เราพยายามอย่างหนักที่จะไม่ให้เกิดเรื่องนี้ขึ้น แต่ถ้าเกิดขึ้นจริง เราจะมองว่าเป็นปัญหาใหญ่ที่ต้องรีบแก้ไข ไม่ว่าจะเป็นการปรับเปลี่ยนพฤติกรรมของโมเดล หรือการแก้ข้อกำหนดของโมเดลเพื่อให้ทั้งสองอย่างตรงกัน
การเทรนไม่สามารถครอบคลุมขอบเขตของพฤติกรรมที่เป็นไปได้ทั้งหมดได้อย่างสมบูรณ์ การใช้งานจริงมีรายละเอียดปลีกย่อยและกรณีพิเศษมากมายที่จะพบได้ก็ต่อเมื่อมีผู้ใช้จำนวนมาก ซึ่งกระบวนการเทรนโมเดลไม่ว่าแบบไหนก็ไม่สามารถเตรียมการรับมือได้ครบทุกสถานการณ์
การอนุมานแบบทั่วไปอาจแตกต่างจากสิ่งที่เราตั้งใจไว้ โมเดลอาจสร้างผลลัพธ์ที่ “ถูกต้อง” ในระหว่างการเทรนด้วยเหตุผลที่ไม่พึงประสงค์ ซึ่งอาจนำไปสู่พฤติกรรมที่ไม่คาดคิดในสถานการณ์ใหม่ที่แตกต่างจากสิ่งที่เคยพบในการเทรน เทคนิคอย่างการปรับความสอดคล้องเชิงรอบคอบ⁠ช่วยได้ แต่ไม่ใช่วิธีแก้ปัญหาที่สมบูรณ์

ในภาพรวม ข้อเท็จจริงที่ว่าข้อกำหนดของโมเดลครอบคลุมพฤติกรรมที่พึงประสงค์อย่างหลากหลายนั้น ไม่ได้หมายความว่าจะมีวิธีการเพียงรูปแบบเดียวที่สามารถใช้สอนพฤติกรรมเหล่านั้นได้ทั้งหมด แง่มุมที่หลากหลายของพฤติกรรม ทั้งเรื่องการทำตามคำสั่ง ขอบเขตความปลอดภัย บุคลิกภาพ การแสดงออกถึงความไม่แน่นอนอย่างเหมาะสม และส่วนอื่น ๆ มักจำเป็นต้องใช้เทคนิคที่แตกต่างกัน และมีจุดที่อาจเกิดข้อผิดพลาดไม่เหมือนกัน ข้อกำหนดของโมเดล (Model Spec) ช่วยให้พฤติกรรมที่พึงประสงค์นั้นง่ายต่อการทำความเข้าใจและวิพากษ์ได้ง่ายขึ้น แต่การนำข้อกำหนดเหล่านี้ไปใช้จริงให้ได้ผลดีก็ยังถือเป็นทั้งศิลปะและประเด็นที่ต้องศึกษาวิจัยกันต่อไป

นอกเหนือจากโพสต์นี้ เรายังเปิดตัว ชุดการประเมินผลข้อกำหนดของโมเดล⁠(เปิดในหน้าต่างใหม่) ซึ่งเป็นชุดการประเมินผลตามสถานการณ์จำลองที่พยายามครอบคลุมข้อกำหนดส่วนใหญ่ในข้อกำหนดของโมเดลให้ได้มากที่สุด โดยใช้ตัวอย่างที่เป็นตัวแทนในจำนวนจำกัด สิ่งนี้ช่วยให้เราสามารถติดตามจุดที่พฤติกรรมของโมเดลและข้อกำหนดของโมเดลที่อาจจะไม่สอดคล้องกัน และช่วยให้เราสามารถตรวจสอบได้ว่าโมเดลกำลังตีความข้อกำหนดดังกล่าวตามเจตนารมณ์ที่เราวางไว้หรือไม่ การประเมินผลเหล่านี้เป็นเพียงส่วนหนึ่งของกลยุทธ์การประเมินในภาพรวม ซึ่งยังประกอบด้วยการประเมินที่เจาะจงในหลากหลายมิติของพฤติกรรม เข่น ด้านความปลอดภัยเฉพาะด้าน ความสัตย์จริงและการประจบสอพลอ บุคลิกภาพและรูปแบบการนำเสนอ รวมถึงขีดความสามารถด้านต่างๆ

แผนภูมิแสดงการปฏิบัติตามข้อกำหนดของโมเดล จำแนกตามส่วนสำหรับโมเดลต่างๆ ของ OpenAI ในช่วงเวลาที่ผ่านมา โปรดอ่านบล็อกฉบับเพิ่ม⁠(เปิดในหน้าต่างใหม่)เติมสำหรับรายละเอียดการประเมินผลและแนวทางการตีความข้อมูลของเรา กล่าวโดยสรุป เราเชื่อว่าผลลัพธ์เหล่านี้สะท้อนถึงการพัฒนาที่แท้จริงและครอบคลุมในการจัดวางเป้าหมายของโมเดลในช่วงที่ผ่านมา แม้ผลลัพธ์ส่วนหนึ่งจะเกิดจากการนำโมเดลรุ่นเก่ามาประเมินด้วยนโยบายที่ทันสมัยกว่าก็ตาม

ในทางปฏิบัติการปรับปรุงข้อกำหนดส่วนใหญ่นั้นถูกขับเคลื่อนด้วยชุดข้อมูลนำเข้าที่เกิดขึ้นอย่างต่อเนื่องและสม่ำเสมอ

ปัญหาและข้อเสนอแนะจากสาธารณะ จุดที่สร้างความสับสน กรณีที่คลุมเครือ หรือข้อบกพร่องต่างๆ ซึ่งอาจเกิดจากตัวภาษาที่ใช้เขียนข้อกำหนดหรือเกิดจากพฤติกรรมที่โมเดลแสดงออกมา
ปัญหาภายใน รูปแบบที่เราพบในระหว่างการพัฒนาและการทดสอบ รวมถึงความคลุมเครือที่การตีความที่สมเหตุสมผลที่แตกต่างกันนำไปสู่พฤติกรรมที่แตกต่างกัน
ข้อมูลอัปเดตเกี่ยวกับพฤติกรรมและนโยบายความปลอดภัย หากเงื่อนไขหรือข้อตกลงในระดับนโยบายเปลี่ยนไป ข้อกำหนดก็จำเป็นต้องปรับเปลี่ยนตามเพื่อให้สอดคล้องกับโครงสร้างใหม่
ความสามารถและผลิตภัณฑ์ใหม่ เนื่องจากโมเดลมีความสามารถในการแสดงพฤติกรรมใหม่ๆ เพิ่มขึ้นและเรามีการเปิดตัวผลิตภัณฑ์ใหม่ เราจึงอยากให้ข้อกำหนดของโมเดลก้าวทันทั้งในด้านเนื้อหาและขอบเขตการครอบคลุม ตัวอย่างเช่น การเพิ่มกฎเกณฑ์สำหรับการปฏิสัมพันธ์แบบมัลติโมดัล⁠(เปิดในหน้าต่างใหม่) เอเจนต์อัตโนมัติ⁠(เปิดในหน้าต่างใหม่) และผู้ใช้งานที่มีอายุต่ำกว่า 18 ปี⁠(เปิดในหน้าต่างใหม่)

องค์ประกอบที่ทำให้เนื้อหาของข้อกำหนดมีคุณภาพ

หลักการออกแบบบางประการเป็นแนวทางในการเขียนและปรับปรุงข้อกำหนดของโมเดล

ความชัดเจนและความแม่นยำ “จงซื่อสัตย์” เป็นคุณค่าที่ดี แต่ไม่ใช่กระบวนการตัดสินใจที่สมบูรณ์ ข้อกำหนดของโมเดลควรทำให้ข้อขัดแย้งมีความชัดเจนยิ่งขึ้น ไม่ใช่ซ่อนเร้นประเด็นเหล่านั้นไว้ภายใต้ถ้อยคำที่ดูประนีประนอม ในกรณีที่สามารถปฏิบัติได้ เราควรระบุความขัดแย้งที่อาจเกิดขึ้นระหว่างกฎเกณฑ์ต่างๆ อย่างชัดแจ้ง พร้อมทั้งให้คำแนะนำหรือตัวอย่างประกอบเกี่ยวกับวิธีการแก้ไขความขัดแย้งเหล่านั้น ตัวอย่างเช่น อย่าโกหก⁠(เปิดในหน้าต่างใหม่) ชี้ให้เห็นถึงความขัดแย้งที่อาจเกิดขึ้นกับ มีความอบอุ่น⁠(เปิดในหน้าต่างใหม่) โดยอธิบายว่าผู้ช่วยควรปฏิบัติตามบรรทัดฐานของความสุภาพ แต่ไม่ถึงขั้นพูดโกหกเพื่อให้สบายใจ ซึ่งอาจเข้าข่ายเป็นพฤติกรรมเอาใจผู้ใช้เกินควร⁠(เปิดในหน้าต่างใหม่) และไม่เป็นประโยชน์สูงสุดต่อผู้ใช้
กฎที่มีสาระสำคัญ ผู้อ่านควรสามารถนำคำสั่งที่เกิดขึ้นจริงมาใช้และสร้างคำตอบที่ผู้อ่านคนอื่นสามารถระบุได้อย่างชัดเจนว่าอยู่ในขอบเขตหรือนอกขอบเขตที่กำหนดไว้ (แม้ว่าอาจมีการใช้ดุลยพินิจในกรณีที่เป็นประเด็นก้ำกึ่งก็ตาม)
การใช้ตัวอย่างที่ช่วยเพิ่มสัดส่วนข้อมูลที่เป็นประโยชน์ และลดข้อมูลรบกวนให้ได้มากที่สุด ตัวอย่างที่ดีมักเป็นหัวใจสำคัญของการจัดทำการอัปเดตข้อกำหนดที่มีคุณภาพสูง ตัวอย่างควรชี้ให้เห็นจุดที่กำหนดพฤติกรรมโมเดลได้ยาก พร้อมทั้งดึงเอาข้อขัดแย้งที่ซับซ้อนขึ้นมาตีแผ่และระบุแนวทางจัดการที่ชัดเจนว่าควรแก้ปัญหาอย่างไร ในลำดับรองลงมาตัวอย่างเหล่านั้นควรมีความมุ่งหมายที่จะเป็นต้นแบบของน้ำเสียงและรูปแบบที่พึงประสงค์ ซึ่งเป็นสิ่งที่ถ่ายทอดได้ยากในการอธิบายเป็นข้อความ
ความทนทาน เราพยายามหลีกเลี่ยงการใช้ตัวอย่างที่มีความคลุมเครือหรือความซับซ้อนเกินความจำเป็น เพื่อให้ข้อขัดแย้งหลักและแนวทางการแก้ไขที่พึงประสงค์มีความชัดเจน
ความสม่ำเสมอและการจัดระเบียบที่ชัดเจน เรามุ่งมั่นให้กฎในข้อกำหนดของโมเดลสอดคล้องกันอย่างสมบูรณ์ทั้งระหว่างกันเองและกับพฤติกรรมของโมเดลที่เราตั้งใจไว้ และทำให้การจัดระเบียบโดยรวมของเอกสารมีความชัดเจนและเข้าถึงได้ง่าย

อะไรจะเกิดขึ้นต่อไป

ข้อกำหนดของโมเดลไม่ใช่การยืนยันว่าเราสามารถระบุทุกสิ่งที่มีความสำคัญได้ทั้งหมด หรือโมเดลจะสามารถบรรลุเป้าหมายได้อย่างแม่นยำเสมอไป แต่เป็นการยืนยันว่าพฤติกรรมที่พึงประสงค์มีความสำคัญเพียงพอที่จะต้องมีความชัดเจน นำไปปฏิบัติได้จริง และสามารถปรับปรุงแก้ไขได้

เกณฑ์ความสำเร็จสามข้อเป็นแนวทางในการพัฒนาสิ่งนี้

การสื่อสารที่ชัดแจ้ง ผู้คนทั้งภายในและภายนอก OpenAI สามารถคาดการณ์พฤติกรรมได้อย่างแม่นยำ และสามารถอ้างอิงข้อความได้เมื่อพฤติกรรมนั้นไม่เป็นไปตามที่คาดหมาย
การนำไปใช้ได้จริง ข้อกำหนดของโมเดลสามารถใช้เพื่อออกแบบการประเมินผล วินิจฉัยเหตุการณ์ และตัดสินใจด้านผลิตภัณฑ์ได้อย่างสอดคล้องกัน ไม่ใช่มีไว้เพียงเพื่อแสดงคุณค่าเท่านั้น
ความสามารถในการแก้ไข ข้อกำหนดของโมเดลสามารถพัฒนาไปได้ตามที่เราเรียนรู้ โดยไม่กลายเป็นเป้าหมายที่เปลี่ยนแปลงตลอดเวลาและขาดเสถียรภาพ

เมื่อโมเดลและผลิตภัณฑ์พัฒนาไป เราคาดว่าข้อกำหนดของโมเดลจะขยายและทำให้ชัดเจนยิ่งขึ้นให้สอดคล้องกับความสามารถใหม่ๆ และบริบทการนำไปใช้งาน เป้าหมายคือการทำให้ข้อกำหนดด้านพฤติกรรมมีความสอดคล้องกัน ตรวจสอบได้ และสอดคล้องกับพันธกิจของเราในการทำให้ AGI เป็นประโยชน์ต่อมวลมนุษยชาติ

ผู้เขียน

Jason Wolfe

อ่านต่อ

ดูทั้งหมด

เราเพิ่มคะแนนบนเกณฑ์มาตรฐาน ARC-AGI-3 เป็น 3 เท่าด้วยการเปิดการตั้งค่า 2 รายการได้อย่างไร

งานวิจัย29 ก.ค. 2569

oai Science Academic Research Academic Research 1x1

Accelerating scientific discovery with ChatGPT for Academic Researchers

บริษัท29 ก.ค. 2569

Scientific computing agentic AI card image (1x1)

การประมวลผลเชิงวิทยาศาสตร์ในยุค Agentic AI

สิ่งพิมพ์28 ก.ค. 2569