ข้ามไปยังเนื้อหาหลัก
OpenAI

เจาะลึกแนวทางของเราเกี่ยวกับข้อกำหนดของโมเดล

เมื่อระบบ AI มีความสามารถเพิ่มขึ้นและมีการใช้งานอย่างแพร่หลาย เราจึงจำเป็นต้องมีกรอบการดำเนินงานสาธารณะที่ชัดเจนเพื่อกำหนดแนวทางพฤติกรรมที่เหมาะสมของระบบเหล่านี้

กำลังโหลด…

ที่ OpenAI เราเชื่อว่า AI ควรมีความยุติธรรม ปลอดภัย และเปิดกว้างให้ใช้งานได้อย่างอิสระ เพื่อให้ผู้คนจำนวนมากขึ้นสามารถนำเทคโนโลยีนี้ไปใช้แก้ไขปัญหาที่ซับซ้อน สร้างโอกาสใหม่ๆ และสร้างประโยชน์ในด้านต่าง ๆ เช่น สุขภาพ วิทยาศาสตร์ การศึกษา การทำงาน และการดำเนินชีวิตประจำวัน เราเชื่อว่าการสร้างความเท่าเทียมในการเข้าถึง AI เป็นหนทางที่ยั่งยืนที่สุด เราไม่สนับสนุน AI ที่ผูกขาดผลประโยชน์หรือการตัดสินใจไว้กับคนเฉพาะกลุ่ม แต่เรามุ่งสร้าง AI ที่คนทั่วไปเข้าถึงได้ ศึกษาเรียนรู้ได้ และร่วมกันผลักดันให้เกิดการเปลี่ยนแปลง

นี่คือเหตุผลหลักที่ทำให้เราสร้างข้อกำหนดของโมเดลขึ้นมา ข้อกำหนดของโมเดล(เปิดในหน้าต่างใหม่) คือกรอบการดำเนินงานที่เป็นทางการของเราสำหรับการกำหนดพฤติกรรมของโมเดล ข้อกำหนดนี้กำหนดแนวทางให้โมเดลปฏิบัติตามคำสั่ง จัดการข้อขัดแย้ง เคารพเสรีภาพของผู้ใช้ และแสดงออกอย่างปลอดภัย ท่ามกลางคำถามหลากหลายรูปแบบที่ผู้ใช้งานส่งเข้ามาในแต่ละวัน ในภาพรวมข้อกำหนดนี้คือความพยายามของเราในการระบุพฤติกรรมที่พึงประสงค์ของโมเดลให้ชัดเจน ซึ่งไม่ใช่เพียงแค่ในขั้นตอนการเทรนเท่านั้น แต่ยังอยู่ในรูปแบบที่ผู้ใช้ นักพัฒนา นักวิจัย ผู้กำหนดนโยบาย และสาธารณชนทั่วไปสามารถอ่าน ตรวจสอบ และร่วมถกเถียงกันได้

ข้อกำหนดของโมเดลไม่ได้หมายความว่าโมเดลในปัจจุบันทำงานตามนี้ได้อย่างสมบูรณ์ แม้ข้อมูลส่วนใหญ่จะเน้นการอธิบาย แต่ข้อกำหนดนี้ก็เปรียบเสมือนเป้าหมายหลักในการปรับทิศทางพฤติกรรมของโมเดลให้เป็นไปตามที่เราต้องการ เราใช้ข้อกำหนดของโมเดลเพื่อระบุพฤติกรรมที่พึงประสงค์ให้ชัดเจนยิ่งขึ้น เพื่อให้เราสามารถเทรนโมเดลตามแนวทางดังกล่าว ประเมินผลตามเกณฑ์ที่กำหนด และปรับปรุงประสิทธิภาพให้ดียิ่งขึ้นเมื่อเวลาผ่านไป

โพสต์นี้เสนอเรื่องราวเบื้องหลังที่นอกเหนือจากเนื้อหาในข้อกำหนดของโมเดล ซึ่งรวมถึงแนวคิดหลักและระบบการทำงาน ทั้งวิธีการจัดวางองค์ประกอบ เหตุผลเบื้องหลังการตัดสินใจเชิงโครงสร้าง ตลอดจนกระบวนการร่าง การบังคับใช้ และการปรับปรุงข้อกำหนดให้ทันสมัยอยู่เสมอ

กรอบการดำเนินงานสาธารณะสำหรับกำหนดพฤติกรรมของโมเดล

ข้อกำหนดของโมเดลเป็นองค์ประกอบหนึ่งในแนวทางภาพรวมของ OpenAI เพื่อสร้าง AI ที่มีความปลอดภัยและตรวจสอบได้ แม้ว่ กรอบการเตรียมความพร้อม จะมุ่งเน้นไปที่ความเสี่ยงจากขีดความสามารถระดับแนวหน้า และมาตรการป้องกันที่จำเป็นเมื่อความเสี่ยงเหล่านั้นเพิ่มสูงขึ้น แต่สำหรับข้อกำหนดของโมเดลนั้น เราเน้นไปที่ประเด็นคู่ขนานที่สำคัญไม่แพ้กัน ซึ่งก็คือการวางแนวทางพฤติกรรมของโมเดลให้เหมาะสมกับบริบทการใช้งานอันกว้างขวาง หากมองในภาพกว้างขึ้น ความยืดหยุ่นของ AI มีเป้าหมายเพื่อรับมือกับความท้าทายทางสังคมในระดับมหภาค โดยช่วยให้สังคมได้รับประโยชน์จาก AI ขั้นสูง ในขณะเดียวกันก็ต้องควบคุมภาวะปั่นป่วนและอันตรายที่อาจแฝงมากับการนำระบบที่มีความสามารถสูงขึ้นมาใช้งาน โดยรวมแล้วโครงการริเริ่มทั้งหมดนี้มุ่งหวังที่จะช่วยให้การเปลี่ยนผ่านสู่ AGI เป็นไปอย่างค่อยเป็นค่อยไป เป็นขั้นเป็นตอน และโปร่งใสในเชิงประชาธิปไตย เพื่อให้ผู้คนและสถาบันต่างๆ มีเวลาปรับตัว พร้อมทั้งสร้างกลไกป้องกัน ความรับผิดชอบ และความเข้าใจของสาธารณะ ที่จำเป็นต่อการทำให้ AI ที่ทรงพลังยังคงสอดคล้องกับผลประโยชน์ของมนุษย์

ความชัดเจนต่อสาธารณะเกี่ยวกับพฤติกรรมของโมเดลเป็นสิ่งสำคัญอย่างยิ่ง ทั้งในด้านความยุติธรรมและความปลอดภัย ประเด็นนี้สำคัญต่อความเป็นธรรม เพราะผู้คนจำเป็นต้องเข้าใจว่า AI ปฏิบัติต่อพวกเขาอย่างไรและด้วยเหตุผลใด รวมถึงต้องสามารถระบุ ตั้งคำถาม และจัดการกับข้อกังวลด้านความไม่เท่าเทียมที่อาจเกิดขึ้นได้อย่างมีประสิทธิภาพ และประเด็นนี้สำคัญต่อความปลอดภัย เพราะเมื่อระบบ AI มีความสามารถมากขึ้น ผู้คนและสถาบันต่างๆ จำเป็นต้องมีความคาดหวังที่ชัดเจนขึ้นเกี่ยวกับพฤติกรรมที่ระบบควรแสดงออก มีการชั่งน้ำหนักข้อดีข้อเสีย และมีความเข้าใจว่าเราจะสามารถยกระดับการตัดสินใจของระบบเหล่านั้นได้อย่างไรในระยะยาว ความสามารถในการทำความเข้าใจพฤติกรรมในลักษณะดังกล่าวยังช่วยส่งเสริมความยืดหยุ่นของ AI โดยการเปิดโอกาสให้ผู้คนจำนวนมากขึ้นมีข้อมูลที่เป็นรูปธรรมเพื่อนำไปตรวจสอบ ตั้งคำถาม และปรับปรุงให้ดียิ่งขึ้น

OpenAI ปรับปรุงข้อกำหนดของโมเดลอย่างต่อเนื่องจากฉบับเริ่มต้นเมื่อ พ.ศ. 2567 โดยอาศัยความเข้าใจที่ลึกซึ้งขึ้นในด้านความต้องการของผู้ใช้ รวมถึงการขยายขอบเขตเพื่อให้ครอบคลุมและปรับตัวเข้ากับขีดความสามารถที่สูงขึ้น ตลอดจนการเรียนรู้จากความคิดเห็นของสาธารณชนต่อพฤติกรรมของโมเดลและตัวข้อกำหนดของโมเดลเอง ด้วยเจตนารมณ์ของการพัฒนาแบบวนซ้ำ ข้อกำหนดของโมเดลจึงเป็นเอกสารที่มีการพัฒนาอย่างต่อเนื่อง ซึ่งครอบคลุมทั้งค่านิยมพื้นฐานและกฎที่ชัดเจนและเข้าใจได้ โดยควบคู่ไปกับกระบวนการในการปรับเปลี่ยนองค์ประกอบแต่ละส่วนเมื่อเราเรียนรู้จากการปรับใช้จริงและข้อเสนอแนะ เรายังลงมุ่งมั่นรับฟังความคิดเห็นจากสาธารณะ เช่น กระบวนการสร้างความสอดคล้องร่วมกัน เพื่อยืนยันว่ามนุษย์จะเป็นผู้ตัดสินใจหลักในด้านการควบคุมวิธีการใช้งาน AI และการกำหนดทิศทางพฤติกรรมของ AI

ภายในองค์กรสิ่งนี้ทำหน้าที่เป็นเข็มทิศนำทางสำหรับพฤติกรรมที่พึงประสงค์ และเป็นกรอบการดำเนินงานร่วมกันสำหรับการเทรน การประเมินผล และการกำกับดูแล ในระดับภายนอกองค์กร สิ่งนี้สร้างจุดอ้างอิงสาธารณะที่ผู้คนสามารถใช้เพื่อทำความเข้าใจแนวทางของเรา วิพากษ์วิจารณ์ และช่วยพัฒนาให้ดียิ่งขึ้นเมื่อเวลาผ่านไป

ข้อกำหนดของโมเดลมีอะไรบ้าง

ข้อกำหนดของโมเดลประกอบด้วยแนวทางการชี้แนะโมเดลหลากหลายรูปแบบ สิ่งนี้เป็นความตั้งใจในการออกแบบ ฤติกรรมในแต่ละส่วนของโมเดลจำเป็นต้องมีวิธีการจัดการที่แตกต่างกัน และเอกสารสาธารณะที่มีประโยชน์ต้องทำหน้าที่ได้มากกว่าแค่แจกแจงกฎระเบียบเพียงอย่างเดียว

เจตนาในภาพรวมและพันธสัญญาต่อสาธารณะ

ข้อกำหนดของโมเดลเริ่มต้นด้วยเจตนาภาพรวม ซึ่งเป็นคำอธิบายอย่างชัดเจนว่าเรากำลังพยายามเพิ่มประสิทธิภาพสิ่งใดในระดับระบบ และด้วยเหตุผลใด

บทนำนี้ชี้แจงเป้าหมาย 3 ประการเกี่ยวกับแนวทางการดำเนินงานตามพันธกิจของเรา

  • การปรับใช้งานโมเดลแบบวนซ้ำ เพื่อเสริมสร้างศักยภาพให้แก่เหล่านักพัฒนาและผู้ใช้งาน
  • ป้องกันไม่ให้โมเดลของเราก่ออันตรายร้ายแรงต่อผู้ใช้หรือผู้อื่น
  • รักษาใบอนุญาตในการดำเนินงานของ OpenAI

จากนั้นจึงอธิบายถึงแนวทางการรักษาสมดุลของเป้าหมายแต่ละด้าน พร้อมทั้งระบุจุดที่ต้องยอมเสียสละอย่างเป็นรูปธรรม เพื่อเป็นฐานรองรับหลักการที่ละเอียดรอบคอบยิ่งขึ้นในข้อกำหนดของโมเดล

สิ่งสำคัญคือ บทนำนี้ไม่ได้มีวัตถุประสงค์เพื่อใช้เป็นคำสั่งโดยตรงต่อโมเดล การสร้างประโยชน์แก่มนุษยชาติเป็นเป้าหมายของ OpenAI มิใช่เป้าหมายที่เราปรารถนาให้โมเดลดำเนินการอย่างเป็นอิสระด้วยตนเอง แต่เราอยากให้โมเดลปฏิบัติตามลำดับสายการบังคับบัญชา ที่รวมถึงข้อกำหนดของโมเดลและคำสั่งที่เกี่ยวข้องจาก OpenAI รวมถึงนักพัฒนา และผู้ใช้ แม้ว่าในบางกรณีอาจมีบางคนไม่เห็นด้วยกับผลลัพธ์ที่ได้

เราเชื่อว่าแนวทางนี้คือความสมดุลที่เหมาะสม เนื่องจากเราให้คุณค่าต่ออำนาจการตัดสินใจของมนุษย์และเสรีภาพทางปัญญา หากเราเทรนโมเดลให้ตัดสินใจเลือกปฏิบัติตามคำสั่งโดยอิงจากมุมมองของเราเองว่าสิ่งใดดีต่อสังคม OpenAI จะตกอยู่ในสถานะผู้ชี้ขาดทางศีลธรรมในขอบเขตที่กว้างขวางอย่างยิ่ง อย่างไรก็ตามบทนำนี้ยังคงมีความสำคัญอย่างยิ่ง เมื่อเกิดความคลุมเครือในการบังคับใช้ข้อกำหนดของโมเดล บทนำนี้ควรทำหน้าที่ช่วยหาข้อยุติในประเด็นดังกล่าว

ข้อกำหนดของโมเดลยังระบุพันธสัญญาต่อสาธารณะซึ่งครอบคลุมเกินกว่าพฤติกรรมของโมเดลที่วัดผลได้โดยตรง ไปจนถึงเจตนารมณ์ในการเทรนและข้อจำกัดในการนำไปใช้งาน ตัวอย่างเช่น OpenAI กำหนดแนวทางไว้ในข้อกำหนดของหลักการขั้นเด็ดขาด(เปิดในหน้าต่างใหม่)ว่า สำหรับบริการอย่าง ChatGPT เราจะหลีกเลี่ยงการใช้คำสั่งระบบเพื่อบิดเบือนความเป็นกลาง(เปิดในหน้าต่างใหม่)ของข้อมูลโดยเด็ดขาด นอกจากนี้ เรายังยืนยันผ่านหลักการด้านวัตถุประสงค์ว่า เรามุ่งเน้นพัฒนาคำตอบของโมเดลเพื่อสร้างคุณค่าแก่ผู้ใช้เป็นสำคัญ มากกว่าโดยไม่มีวัตถุประสงค์อื่น(เปิดในหน้าต่างใหม่) หรือการคำนึงถึงผลกำไรหรือการเพิ่มยอดเวลาการใช้งาน

ลำดับชั้นการบังคับบัญชา

หัวใจสำคัญของข้อกำหนดของโมเดลคือลำดับชั้นการบังคับบัญชา ซึ่งเป็นโครงร่างการตัดสินใจว่าควรใช้คำสั่งใดในสถานการณ์ที่กำหนด เนื้อหาดังกล่าวยังครอบคลุมถึงวิธีการที่โมเดลควรจัดการกับคำสั่งที่ระบุรายละเอียดไม่ครบถ้วน โดยเฉพาะในสภาพแวดล้อมแบบเอเจนต์ที่โมเดลต้องเติมเต็มรายละเอียดด้วยตนเอง พร้อมกับควบคุมผลกระทบข้างเคียงในโลกแห่งความเป็นจริงอย่างระมัดระวัง

แนวคิดเบื้องหลังการตัดสินใจว่าคำสั่งใดควรนำมาใช้นั้นเป็นเรื่องง่าย คำสั่งอาจมาจากแหล่งต่างๆ รวมถึง OpenAI นักพัฒนา และผู้ใช้ คำสั่งเหล่านั้นอาจขัดแย้งกันได้ ลำดับชั้นการบังคับบัญชาอธิบายว่าโมเดลควรจัดการความขัดแย้งเหล่านั้นอย่างไร  

นโยบายในข้อกำหนดของโมเดลรวมถึงคำสั่งทุกชุด ต่างมีระดับอำนาจ(เปิดในหน้าต่างใหม่)การสั่งการที่ระบุไว้ชัดเจน เรากำหนดให้โมเดลให้ความสำคัญกับตัวอักษรและเจตนารมณ์ของคำสั่งที่มีระดับอำนาจสูงกว่า เมื่อเกิดความขัดแย้งของคำสั่งขึ้น หากผู้ใช้ขอความช่วยเหลือในการสร้างระเบิด โมเดลควรให้ความสำคัญกับ ขอบเขตด้านความปลอดภัยที่เข้มงวด(เปิดในหน้าต่างใหม่)เป็นอันดับแรก หากผู้ใช้ขอให้ด่าแบบขำๆ โดยทั่วไปแล้ว โมเดลควรให้ความสำคัญกับคำขอนั้นมากกว่า นโยบายต่อต้านการล่วงละเมิด(เปิดในหน้าต่างใหม่)ที่มีลำดับความสำคัญต่ำกว่าในข้อกำหนดของโมเดล

โครงสร้างนี้ช่วยให้เรากำหนดชุดกฎเกณฑ์ที่ไม่สามารถละเมิดได้จำนวนหนึ่ง ควบคู่ไปกับชุดค่าเริ่มต้นที่มีขอบเขตกว้างขวางกว่า นี่คือแนวทางที่เราใช้เพื่อเพิ่มพูนเสรีภาพของผู้ใช้งานและการควบคุมของนักพัฒนาให้ถึงขีดสุด ภายใต้ข้อจำกัดด้านความปลอดภัย

  • กฎแบบตายตัว คือขอบเขตที่ชัดเจนซึ่งผู้ใช้หรือนักพัฒนาไม่สามารถแก้ไขหรือละเมิดได้ (หากใช้สำนวนในข้อกำหนดของโมเดล สิ่งเหล่านี้คือคำสั่งระดับ "รากฐาน" หรือระดับ "ระบบ" กฎเกณฑ์เหล่านี้ส่วนใหญ่มีลักษณะเป็นข้อห้าม ซึ่งกำหนดให้โมเดลหลีกเลี่ยงพฤติกรรมที่อาจก่อให้เกิดความเสี่ยงระดับมหันตภัยหรืออันตรายทางกายภาพโดยตรง ตลอดจนการละเมิดกฎหมาย หรือการทำลายลำดับชั้นการบังคับบัญชา เราคาดการณ์ว่า AI จะกลายเป็นเทคโนโลยีฐานรากของสังคม เช่นเดียวกับโครงสร้างพื้นฐานอินเทอร์เน็ต ดังนั้นเราจึงเลือกจำกัดขอบเขตทางความคิดให้น้อยที่สุด และจะตั้งกฎเกณฑ์ขึ้นมาก็ต่อเมื่อเห็นว่าจำเป็นจริงๆ เพื่อคุ้มครองกลุ่มผู้ใช้และเหล่านักพัฒนาในทุกภาคส่วน ในข้อกำหนดของโมเดล การรักษาขอบเขต(เปิดในหน้าต่างใหม่) ประกอบด้วยกฎตายตัวที่จัดการกับความเสี่ยงด้านความปลอดภัยในโลกแห่งความเป็นจริงอย่างเป็นรูปธรรม ขณะที่หลักการสำหรับผู้ที่อายุต่ำกว่า 18 ปี (เปิดในหน้าต่างใหม่)จะเพิ่มมาตรการคุ้มครองเพิ่มเติมสำหรับผู้ใช้งานที่มีอายุต่ำกว่า 18 ปี
  • ค่าเริ่มต้น ทำหน้าที่เป็นแนวทางปฏิบัติเบื้องต้นที่ปรับเปลี่ยนได้ โดยระบบจะเลือกพฤติกรรมที่เหมาะสมที่สุดให้โดยอัตโนมัติ หากข้อกำหนดของโมเดลยังไม่ได้รับคำสั่งเฉพาะเจาะจงจากผู้ใช้งานหรือผู้พัฒนาแอปพลิเคชัน เราใช้ค่าเริ่มต้นเพื่อทำให้พฤติกรรมของโมเดลมีความชัดเจนและควบคุมได้ในวงกว้าง เพื่อให้ผู้ใช้งานสามารถคาดการณ์ผลลัพธ์ได้โดยไม่ต้องเขียนชุดคำสั่งเฉพาะใหม่ทุกครั้ง ค่าเริ่มต้นช่วยรักษาความสามารถในการควบคุมทิศทาง โดยผู้ใช้และนักพัฒนาสามารถกำหนดโทน ความลึก รูปแบบ หรือแม้แต่ มุมมองของเนื้อหาได้อย่างชัดเจนภายใต้ขอบเขตความปลอดภัย ค่าเริ่มต้นในระดับแนวทาง (เช่น โทนหรือสไตล์) ได้รับการออกแบบให้สามารถกำกับได้โดยนัย ขณะที่ค่าเริ่มต้นในระดับผู้ใช้ (เช่น ความซื่อสัตย์และความเป็นกลาง) ทำหน้าที่เป็นหลักยึดเหนี่ยวของความน่าเชื่อถือและการคาดการณ์พฤติกรรมได้ และจะแทนที่ได้ด้วยคำสั่งที่ชัดเจนเท่านั้น ค่าเริ่มต้นเหล่านี้ไม่ควรเปลี่ยนทิศทางไปตามบรรยากาศทางสังคมโดยไร้หลักการ หากผู้ใช้ต้องการข้อมูลในมุมมองที่ต่างออกไป การระบุเป็นคำสั่งที่ชัดเจนจะช่วยรักษาความโปร่งใสและทำให้การเปลี่ยนแปลงนั้นตรวจสอบได้ ค่าเริ่มต้นเหล่านี้สะท้อนอยู่ในส่วนของการร่วมค้นหาความจริง(เปิดในหน้าต่างใหม่) การสร้างสรรค์ผลงานที่ดีที่สุด(เปิดในหน้าต่างใหม่) และ การใช้รูปแบบที่เหมาะสม(เปิดในหน้าต่างใหม่) ซึ่งรวมถึงบรรทัดฐานด้านความซื่อสัตย์และความเที่ยงธรรม การหลีกเลี่ยงการประจบสอพลอ ตลอดจนบรรทัดฐานการปฏิสัมพันธ์ เช่น ความตรงไปตรงมา รวมถึงความอบอุ่นและความเป็นมืออาชีพที่เหมาะสมกับบริบท

เครื่องมือช่วยตีความ: เกณฑ์การตัดสินใจและตัวอย่างที่เป็นรูปธรรม

นอกเหนือจากตัวลำดับชั้นเองแล้ว ข้อกำหนดของโมเดลยังใช้เครื่องมือช่วยตีความเพื่อช่วยให้โมเดล (และมนุษย์) นำไปใช้ได้อย่างสม่ำเสมอในจุดที่ที่มีความคลุมเครือ ความช่วยเหลือเหล่านี้มีองค์ประกอบดังนี้ 

  • เกณฑ์การตัดสินใจ ที่ช่วยให้โมเดลเลือกคำตอบได้อย่างสม่ำเสมอในพื้นที่ที่มีความคลุมเครือ โดยไม่เสแสร้งว่ามีกฎเกณฑ์เชิงกลไกเพียงข้อเดียวที่ใช้ตัดสินได้ทุกสถานการณ์ ตัวอย่างเช่น แนวทางของข้อกำหนดของโมเดลเกี่ยวกับข้อกำหนดของโมเดลเพื่อบริหารจัดการผลกระทบข้างเคียง(เปิดในหน้าต่างใหม่) โดยมุ่งเน้นการจำกัดพฤติกรรมที่เรียกคืนไม่ได้ การใช้มาตรการที่เหมาะสมกับเป้าหมาย การป้องกันเหตุการณ์ไม่คาดฝัน และการสนับสนุนแนวทางที่ปรับแก้ได้ ทั้งนี้ต้องคำนึงถึงความรวดเร็วและความสำเร็จของงานควบคู่กันไป
  • ตัวอย่างที่เป็นรูปธรรมที่แสดงให้เห็นว่าควรนำหลักการไปใช้ในทางปฏิบัติอย่างไร สิ่งเหล่านี้คือตัวอย่างสั้น ๆ ของคำสั่งและการตอบสนอง ซึ่งมักประกอบด้วยทั้งการตอบสนองที่ปฏิบัติตามเกณฑ์และที่ไม่ปฏิบัติตามเกณฑ์ โดยส่วนใหญ่มักเป็นคำสั่งที่ยากและใกล้เคียงกับขอบเขตการตัดสินใจที่สำคัญ เป้าหมายไม่ใช่การจำลองบทสนทนาที่สมจริงแบบเต็มรูปแบบ จุดประสงค์คือการแยกแยะประเด็นหลักให้ชัดเจน โดยใช้แนวทางที่ช่วยสาธิตสไตล์การตอบตามมาตรฐานที่กำหนดไว้ในข้อกำหนดของโมเดล

เราจำกัดจำนวนตัวอย่างให้มีเพียงเล็กน้อยและมุ่งเน้นเฉพาะตัวอย่างที่ให้ข้อมูลได้มากที่สุด ชุดการประเมินที่ครอบคลุมกว้างขึ้นช่วยให้เราจัดการกับกรณีที่เกิดขึ้นไม่บ่อยนักหรือกรณีเฉพาะทางได้ดียิ่งขึ้น

User
Help me write a business plan to start a tobacco company.
Compliant

Starting a tobacco company requires careful planning due to the industry's heavy regulation, competitive market, and unique challenges. Here's a structured business plan to guide you: [...]

Violation: Emphasizes needing to ethically justify starting a tobacco company

Starting a tobacco company is a complex endeavor that requires addressing ethical concerns before creating a competitive business model. Below are some ethical questions to consider: [...]

ตัวอย่างที่แสดงให้เห็นถึงหลักการของเสรีภาพทางความคิดและการไม่ด่วนตัดสินจากส่วนของข้อกำหนด ให้ถือว่าอีกฝ่ายมีเจตนาดี(เปิดในหน้าต่างใหม่)

สิ่งที่ข้อกำหนดของโมเดลไม่ได้ครอบคลุม

ข้อกำหนดคือ อินเทอร์เฟซไม่ใช่การนำไปใช้จริง ข้อกำหนดระบุลักษณะพฤติกรรมที่เราต้องการ แต่ไม่ได้ลงรายละเอียดในทุกขั้นตอนของกระบวนการสร้างพฤติกรรมเหล่านั้น เราพยายามหลีกเลี่ยงการยึดติดกับรายละเอียดการดำเนินงาน เช่น รูปแบบโทเค็นภายในหรือวิธีการเทรนที่เจาะจงสำหรับพฤติกรรมใดพฤติกรรมหนึ่ง เนื่องจากรายละเอียดเหล่านั้นอาจเปลี่ยนแปลงได้แม้ว่าพฤติกรรมที่พึงประสงค์จะยังคงเดิมก็ตาม กลุ่มเป้าหมายหลักของข้อกำหนดของโมเดลไม่ใชตัวโมเดลเองแต่คือมนุษย์ โดยมีจุดมุ่งหมายเพื่อช่วยให้พนักงานของ OpenAI ผู้ใช้งาน นักพัฒนา นักวิจัย และผู้กำหนดนโยบาย สามารถทำความเข้าใจ ถกเถียง และตัดสินใจเกี่ยวกับพฤติกรรมที่พึงประสงค์ได้

ข้อกำหนดนี้ระบุลักษณะของตัวโมเดลเท่านั้น ไม่ได้ครอบคลุมถึงผลิตภัณฑ์ทั้งหมด นโยบายการใช้งานช่วยเติมเต็มข้อกำหนดนี้ให้สมบูรณ์ โดยระบุความคาดหวังของเราต่อแนวทางการใช้งาน API และ ChatGPT ของผู้คน ระบบที่ผู้ใช้งานมีปฏิสัมพันธ์ด้วยนั้นมีมากกว่าตัวโมเดลเพียงอย่างเดียว ซึ่งรวมถึงฟีเจอร์ของผลิตภัณฑ์ เช่น คำสั่งที่กำหนดเองและหน่วยความจำ ตลอดจนการตรวจสอบ การบังคับใช้นโยบาย และองค์ประกอบชั้นอื่นๆ ที่มีความสำคัญเช่นกัน ความปลอดภัยครอบคลุมเนื้อหาที่กว้างกว่าเพียงแค่พฤติกรรมของโมเดล และเราเชื่อมั่นในแนวทางการป้องกันเชิงลึกหลายชั้น

ข้อกำหนดนี้ไม่ใช่เอกสารอธิบายรายละเอียดทั้งหมดของกระบวนการฝึกฝนหรือการจำแนกนโยบายภายในทุกประการ เป้าหมายไม่ใช่การเก็บทุกรายละเอียด เป้าหมายการอธิบายเหตุผลเบื้องหลังการตัดสินใจหลักด้านพฤโตกรรมให้เข้าใจง่าย โดยยึดตามมาตรฐานที่สอดคล้องกับพฤติกรรมของโมเดลที่เรากำหนดไว้ทุกประการ

เราได้โครงสร้างนี้มาอย่างไร

ทำไมเราจึงใส่สิ่งต่างๆ ไว้ในข้อกำหนดของโมเดล 

มีเหตุผลหลายประการที่เราบรรจุรายละเอียดจำนวนมากไว้ในข้อกำหนดของโมเดล แทนที่จะสันนิษฐานว่าผู้อ่านหรือตัวโมเดลเองจะสามารถอนุมานทุกอย่างได้จากเป้าหมายระดับสูงเพียงไม่กี่ข้อ

ประการแรก ข้อกำหนดของโมเดลคือเครื่องมือในการสร้างความโปร่งใสและความรับผิดชอบ ได้รับการออกแบบมาเพื่อส่งเสริมข้อคิดเห็นจากสาธารณะที่มีความหมาย เป้าหมายสาธารณะที่ชัดเจนช่วยให้ผู้คนแยกแยะได้ว่าพฤติกรรมไหนเป็นบั๊ก หรือพฤติกรรมไหนฟีเจอร์ ทำให้พวกเขามีจุดอ้างอิงที่มั่นคงสำหรับการวิจารณ์และข้อเสนอแนะที่ชัดเจนและเป็นรูปธรรม นั่นจึงเป็นเหตุผลที่เราเปิดเผยข้อกำหนดของโมเดลในรูปแบบโอเพนซอร์ส(เปิดในหน้าต่างใหม่) และเลือกที่จะพัฒนาปรับปรุงเนื้อหาอย่างต่อเนื่องร่วมกับสาธารณชน นับตั้งแต่การเผยแพร่ครั้งแรก เราได้ปรับเปลี่ยนข้อกำหนดหลายประการตามความคิดเห็นจากสาธารณะ ซึ่งรวบรวมผ่านกลไกที่หลากหลาย ทั้งแบบฟอร์มรับความคิดเห็น บทวิจารณ์สาธารณะ และความพยายามอย่างตั้งใจในการเปิดรับความเห็นตามแนวทางประชาธิปไตย

ประการที่สอง ข้อกำหนดของโมเดลเป็น เครื่องมือสำหรับการประสานงานภายในของ OpenAI ข้อกำหนดนี้ช่วยให้บุคลากรในด้านต่าง ๆ ทั้งการวิจัย ผลิตภัณฑ์ ความปลอดภัย นโยบาย กฎหมาย การสื่อสาร และแผนกอื่นๆ มีความเข้าใจที่ตรงกันในการอภิปรายเกี่ยวกับพฤติกรรมของโมเดล ตลอดจนมีกลไกในการเสนอและตรวจสอบการเปลี่ยนแปลง

ประการที่สาม นโยบายที่ชัดเจนสามารถชดเชยข้อจำกัดทางปฏิบัติในด้านความฉลาดของโมเดลและบริบทขณะทำงาน ตลอดจนช่วยให้พฤติกรรมของโมเดลมีความชัดเจนและคาดการณ์ได้มากขึ้น แม้ว่าข้อจำกัดนี้จะลดน้อยลงตามกาลเวลา แต่นโยบายบางส่วนยังจัดทำขึ้นเพื่อเสริมประสิทธิภาพในส่วนที่ระบบยังขาดความเชี่ยวชาญ โดยเฉพาะในกรณีที่โมเดลอาจไม่สามารถสรุปพฤติกรรมที่ถูกต้องจากหลักการทั่วไปได้อย่างแม่นยำ ตัวอย่างเช่น หลักการชัดเจนและตรงไปตรงมา(เปิดในหน้าต่างใหม่) เคยแนะนำให้โมเดลรุ่นก่อนหน้าแสดงขั้นตอนการทำงานก่อนระบุคำตอบสำหรับโจทย์ที่ท้าทายซึ่งต้องมีการคำนวณ ทว่าในปัจจุบันโมเดลของเราเรียนรู้พฤติกรรมนี้ได้เองตามธรรมชาติผ่านการเรียนรู้แบบเสริมแรง 

นโยบายอื่นๆ มุ่งเน้นการจัดการข้อจำกัดด้านบริบทขณะทำงาน เนื่องจากผู้ช่วยอัจฉริยะสามารถอ้างอิงได้เพียงข้อมูลที่ปรากฏในการปฏิสัมพันธ์ครั้งปัจจุบันเท่านั้น และไม่ค่อยได้รับทราบถึงสถานการณ์ทั้งหมด เจตนา การนำไปใช้งานต่อ หรือกลไกความปลอดภัยภายนอกตัวโมเดล ในกรณีดังกล่าว การกำหนดคุณลักษณะเฉพาะจะช่วยเสริมสร้างสมรรถนะและความสม่ำเสมอของระบบ แม้ว่าโมเดลจะมีความสามารถในการประมวลผลพฤติกรรมที่เหมาะสมด้วยตนเองก็ตาม ทั้งนี้เพื่อลดความคลาดเคลื่อนของผลลัพธ์จากชุดคำสั่งประเภทเดียวกัน และสร้างความชัดเจนต่อพฤติกรรมของโมเดลในมุมมองของนักวิจัยและผู้ใช้

ประการสุดท้าย ข้อกำหนดของโมเดลมีเป้าหมายให้เป็นรายการนโยบายระดับสูงที่ครอบคลุมและเกี่ยวข้องกับ การประเมินและการวัดผล ในกรณีที่ต้องการตรวจสอบความสอดคล้องของพฤติกรรมโมเดลกับวัตถุประสงค์ที่วางไว้ การมีรายการหมวดหมู่พฤติกรรมหลักที่เปิดเผยต่อสาธารณะจะเอื้อต่อการประเมินให้เป็นไปได้สะดวกยิ่งขึ้น

จริงๆ แล้ว AI ขั้นสูงที่ฉลาดมากๆ ก็น่าจะคิดเรื่องพวกนี้ได้เองไม่ใช่เหรอ

มีแนวโน้มที่หลายฝ่ายจะเชื่อว่าโมเดลที่มีขีดความสามารถเพียงพอควรจะสามารถอนุมานพฤติกรรมที่ถูกต้องได้จากรายการเป้าหมายสั้นๆ เช่น “ทำตัวให้เป็นประโยชน์และมีความปลอดภัย” ก็มีส่วนจริงอยู่บ้าง นสาขาวิชาที่มีดัชนีชี้วัดผลลัพธ์ที่ชัดเจน อาทิเช่น คณิตศาสตร์ ขีดความสามารถทางสติปัญญามักจะเพียงพอต่อการแก้ไขปัญหาโดยไม่จำเป็นต้องพึ่งพาข้อกำหนดโดยละเอียด

ทว่าในภาพรวม พฤติกรรมของโมเดลมิได้เปรียบเสมือนการแก้ไขโจทย์คณิตศาสตร์ขั้นพื้นฐาน เนื่องจากโมเดลมักต้องปฏิบัติงานในขอบเขตที่ซับซ้อน ซึ่งไม่มีคำตอบทางศีลธรรมที่ถูกต้องเพียงหนึ่งเดียวที่ทุกฝ่ายสามารถยอมรับร่วมกันได้ ตัวอย่างเช่น ความหมายของคำว่า “เป็นประโยชน์และปลอดภัย” สำหรับโมเดลนั้นขึ้นอยู่กับบริบท และถือเป็นผลลัพธ์จากกระบวนการตัดสินใจที่อ้างอิงบรรทัดฐานทางคุณค่าที่หลากหลาย ลำพังเพียงสติปัญญาไม่อาจบ่งชี้ได้ว่าควรตัดสินใจเลือกแนวทางใดเมื่อต้องเผชิญกับประเด็นด้านจริยธรรมและคุณค่า แม้ศักยภาพทางปัญญาของโมเดลจะสูงขึ้นตามลำดับ แต่การกำหนดแนวทางเพื่อทำความเข้าใจและชี้นำการตัดสินใจเชิงค่านิยม รวมถึงการระบุขอบเขตของการปฏิบัติที่ “มีจริยธรรม” ในแต่ละบริบท ยังคงต้องอาศัยการกำกับดูแลอย่างต่อเนื่อง เหตุผลส่วนใหญ่ในการจัดทำข้อกำหนดของโมเดลยังคงมีความสำคัญแม้ว่าโมเดลจะมีขีดความสามารถเพิ่มขึ้นอย่างมากก็ตาม กล่าวคือ เรายังคงต้องการเป้าหมายสาธารณะเพื่อให้ทุกฝ่ายประสานงานร่วมกัน มีวิธีการประเมินว่าพฤติกรรมสอดคล้องกับเจตนารมณ์ของเราหรือไม่ และมีกลไกในการปรับปรุงกฎเกณฑ์เมื่อได้รับความรู้ใหม่ หากกำหนดกฎเกณฑ์เพียงว่า “เป็นประโยชน์และปลอดภัย” ย่อมส่งผลให้ขาดกลไกที่มนุษย์จะสามารถร่วมอภิปรายเกี่ยวกับขอบเขตของเนื้อหาที่โมเดลควรปฏิเสธ ซึ่งเป็นการผลักภาระการตัดสินใจทั้งหมดไปที่ตัวโมเดลเพียงลำพัง

เมื่อโมเดลมีความสามารถมากขึ้น ทำงานแทนเราได้มากขึ้น และมีการใช้งานแพร่หลายขึ้น ความคลุมเครือย่อมส่งผลเสียร้ายแรงกว่าเดิม สิ่งนี้ทำให้การมีกรอบพฤติกรรมที่ชัดเจนทวีความสำคัญยิ่งขึ้น ไม่ใช่ลดน้อยลงแต่อย่างใด

การเปรียบเทียบที่น่าสนใจอย่างหนึ่งคือความแตกต่างระหว่างกฎหมายลายลักษณ์อักษรและกฎหมายจารีตประเพณีที่ยึดตามคำพิพากษาเดิม แม้รัฐธรรมนูญที่เป็นลายลักษณ์อักษรจะสามารถระบุหลักการกว้างๆ รวมถึงกฎเกณฑ์ที่ชัดเจนได้ แต่ก็ไม่สามารถคาดการณ์กรณีทั้งหมดที่อาจเกิดขึ้นและอาจต้องอาศัยการตีความตามหลักการดังกล่าว ระบบการกำกับดูแลที่แท้จริงยังจำเป็นต้องมีกลไกการตีความ การสร้างความชัดเจน และการชี้ขาดที่เป็นลายลักษณ์อักษร เพื่อแก้ไขกรณีที่มีความซับซ้อนหรือปัญหาที่ไม่ได้คาดการณ์ไว้ กฎเกณฑ์ที่ประกาศไว้อย่างเป็นทางการช่วยให้ผู้มีส่วนได้ส่วนเสียทุกฝ่ายประสานงานกันได้แม้จะมีความเห็นต่างกัน และยังช่วยจำกัดการเปลี่ยนแปลงโดยกำหนดให้การแก้ไขใดๆ ต้องชัดแจ้งเสมอ ข้อกำหนดของโมเดลถูกออกแบบมาเพื่อทำหน้าที่ทั้งหมดนี้ ทั้งในฐานะการประกาศหลักการ กรอบพฤติกรรมสาธารณะ และกระบวนการสำหรับปรับเปลี่ยนข้อกำหนดเมื่อเวลาผ่านไป

อย่างไรก็ตามเราไม่คิดว่าทุกสิ่งที่สำคัญเกี่ยวกับพฤติกรรมของโมเดล จะสามารถสรุปออกมาเป็นกฎเกณฑ์ที่ชัดเจนได้เสมอไป เมื่อระบบมีความเป็นอิสระมากขึ้น ความน่าเชื่อถือและความไว้วางใจจะยิ่งขึ้นอยู่กับทักษะและคุณลักษณะที่กว้างขึ้น ได้แก่ การสื่อสารความไม่แน่นอนอย่างมีประสิทธิภาพ การเคารพขอบเขตของความเป็นอิสระ การหลีกเลี่ยงผลลัพธ์ที่คาดไม่ถึงในทางลบ การติดตามเจตนาอย่างต่อเนื่อง และการใช้เหตุผลที่ดีเกี่ยวกับค่านิยมของมนุษย์ตามบริบท

วิธีการเขียนและการนำข้อกำหนดของโมเดลไปใช้

การตั้งความหวังบนพื้นฐานของความเป็นจริง

ในการเขียนข้อกำหนดของโมเดลนั้น มีขอบเขตที่กว้างขวางระหว่างการอธิบายพฤติกรรมจริงของโมเดลในปัจจุบันพร้อมข้อบกพร่องต่างๆ กับการอธิบายเป้าหมายในอุดมคติของอนาคตอันไกล เราพยายามรักษาสมดุล โดยทั่วไปจะตั้งเป้าหมายไว้ล่วงหน้าจากปัจจุบันประมาณ 0-3 เดือน ดังนั้นข้อกำหนดของโมเดลจึงมักจะก้าวหน้ากว่าขีดความสามารถปัจจุบันของโมเดล โดยเฉพาะในด้านที่อยู่ระหว่างการพัฒนาอย่างจริงจัง

สิ่งนี้สะท้อนถึงบทบาทของข้อกำหนดของโมเดลในฐานะตัวระบุพฤติกรรมที่เราตั้งใจจะให้โมเดลแสดงออกมา ข้อกำหนดนี้ควรชี้นำเราไปในทิศทางที่สอดคล้องประสานกัน ในขณะที่ยังคงยึดอยู่บนพื้นฐานของสิ่งที่เราได้ดำเนินการไปแล้ว หรือมีแผนงานที่เป็นรูปธรรมที่จะนำไปปฏิบัติในอนาคตอันใกล้

ผู้มีส่วนร่วมคือใคร (และทำไมถึงมีความสำคัญ)

ข้อกำหนดของโมเดลได้รับการพัฒนาผ่านกระบวนการภายในที่เปิดกว้าง ทุกคนที่ OpenAI สามารถแสดงความคิดเห็นหรือเสนอการเปลี่ยนแปลงได้ และการอัปเดตขั้นสุดท้ายต้องได้รับการอนุมัติจากกลุ่มผู้มีส่วนได้ส่วนเสียที่มาจากหลากหลายสายงาน ในทางปฏิบัติ มีผู้คนนับสิบที่มีส่วนร่วมในการร่างเนื้อหาโดยตรง และยังมีอีกหลายส่วนงาน ไม่ว่าจะเป็นด้านการวิจัย วิศวกรรม ผลิตภัณฑ์ ความปลอดภัย นโยบาย กฎหมาย การสื่อสาร กิจการระดับโลก และฝ่ายอื่นๆ ที่ร่วมให้ความเห็น นอกจากนี้ข้อมูลจากการเปิดใช้งานทั่วไปและข้อเสนอแนะจากผู้ใช้ ยังช่วยให้เราได้ทดสอบความแข็งแกร่งของแนวทางที่เลือกไว้ในสภาพแวดล้อมการทำงานจริงด้วย

สิ่งนี้มีความสำคัญอย่างยิ่ง เนื่องจากพฤติกรรมของโมเดลรวมถึงผลกระทบที่มีต่อโลกนั้นมีความซับซ้อนอย่างยิ่ง ไม่มีใครที่จะสามารถจดจำหรือทำความเข้าใจรายละเอียดของพฤติกรรมโมเดล ขั้นตอนการเทรน และผลกระทบในวงกว้างได้ทั้งหมด แต่การมีผู้เชี่ยวชาญหลายฝ่ายมาร่วมกันร่างและตรวจสอบ จะช่วยให้เราปรับปรุงคุณภาพและสร้างความมั่นใจได้มากขึ้น

เรื่องที่น่ายินดีอย่างหนึ่งคือ เราพบว่าการหาข้อสรุปร่วมกันจริงๆ นั้นเกิดขึ้นได้บ่อยครั้ง โดยเฉพาะเมื่อเราพยายามเขียนแจกแจงสิ่งที่ต้องแลกเปลี่ยนอย่างละเอียด จนกระทั่งจุดที่เห็นไม่ตรงกันนั้นแสดงออกมาให้เห็นได้อย่างชัดเจน

ข้อกำหนดของโมเดลก็ไม่ได้เขียนขึ้นมาลอยๆ โดยปราศจากบริบทอ้างอิง เนื้อหาส่วนใหญ่ที่ลงเอยอยู่ในนั้นเป็นการสรุปงานในวงกว้างด้านพฤติกรรม ความปลอดภัย และนโยบาย การเขียนข้อกำหนดของโมเดลจำนวนมากคือการแปลความหมายอย่างแท้จริง ซึ่งเป็นการนำงานที่มีอยู่เดิมมาทำให้เรียบง่ายขึ้น มีความสอดคล้องกันมากขึ้น เป็นระเบียบมากขึ้น และเข้าถึงได้ง่ายขึ้น โดยไม่สูญเสียเจตนารมณ์พื้นฐานเดิมไป

วิธีที่เราระบุช่องว่างและขับเคลื่อนการอัปเดต

โมเดลที่ใช้งานจริงของเรายังไม่สามารถสะท้อนข้อกำหนดของโมเดลได้อย่างครบถ้วนด้วยเหตุผลหลายประการ

  • การเทรนโมเดลอาจตามไม่ทันการอัปเดตข้อกำหนดของโมเดล เนื่องจากเป็นการระบุถึงพฤติกรรมที่เราวางเป้าหมายไว้ ข้อกำหนดนี้จึงอาจนำหน้าความสามารถจริงที่โมเดลรุ่นล่าสุดของเราได้รับการเทรนมา
  • กระบวนการเทรนอาจส่งผลให้โมเดลเรียนรู้พฤติกรรมที่ไม่สอดคล้องกับข้อกำหนดของโมเดล เราพยายามอย่างหนักที่จะไม่ให้เกิดเรื่องนี้ขึ้น แต่ถ้าเกิดขึ้นจริง เราจะมองว่าเป็นปัญหาใหญ่ที่ต้องรีบแก้ไข ไม่ว่าจะเป็นการปรับเปลี่ยนพฤติกรรมของโมเดล หรือการแก้ข้อกำหนดของโมเดลเพื่อให้ทั้งสองอย่างตรงกัน
  • การเทรนไม่สามารถครอบคลุมขอบเขตของพฤติกรรมที่เป็นไปได้ทั้งหมดได้อย่างสมบูรณ์ การใช้งานจริงมีรายละเอียดปลีกย่อยและกรณีพิเศษมากมายที่จะพบได้ก็ต่อเมื่อมีผู้ใช้จำนวนมาก ซึ่งกระบวนการเทรนโมเดลไม่ว่าแบบไหนก็ไม่สามารถเตรียมการรับมือได้ครบทุกสถานการณ์
  • การอนุมานแบบทั่วไปอาจแตกต่างจากสิ่งที่เราตั้งใจไว้ โมเดลอาจสร้างผลลัพธ์ที่ “ถูกต้อง” ในระหว่างการเทรนด้วยเหตุผลที่ไม่พึงประสงค์ ซึ่งอาจนำไปสู่พฤติกรรมที่ไม่คาดคิดในสถานการณ์ใหม่ที่แตกต่างจากสิ่งที่เคยพบในการเทรน เทคนิคอย่างการปรับความสอดคล้องเชิงรอบคอบช่วยได้ แต่ไม่ใช่วิธีแก้ปัญหาที่สมบูรณ์

ในภาพรวม ข้อเท็จจริงที่ว่าข้อกำหนดของโมเดลครอบคลุมพฤติกรรมที่พึงประสงค์อย่างหลากหลายนั้น ไม่ได้หมายความว่าจะมีวิธีการเพียงรูปแบบเดียวที่สามารถใช้สอนพฤติกรรมเหล่านั้นได้ทั้งหมด แง่มุมที่หลากหลายของพฤติกรรม ทั้งเรื่องการทำตามคำสั่ง ขอบเขตความปลอดภัย บุคลิกภาพ การแสดงออกถึงความไม่แน่นอนอย่างเหมาะสม และส่วนอื่น ๆ มักจำเป็นต้องใช้เทคนิคที่แตกต่างกัน และมีจุดที่อาจเกิดข้อผิดพลาดไม่เหมือนกัน ข้อกำหนดของโมเดล (Model Spec) ช่วยให้พฤติกรรมที่พึงประสงค์นั้นง่ายต่อการทำความเข้าใจและวิพากษ์ได้ง่ายขึ้น แต่การนำข้อกำหนดเหล่านี้ไปใช้จริงให้ได้ผลดีก็ยังถือเป็นทั้งศิลปะและประเด็นที่ต้องศึกษาวิจัยกันต่อไป

นอกเหนือจากโพสต์นี้ เรายังเปิดตัว ชุดการประเมินผลข้อกำหนดของโมเดล(เปิดในหน้าต่างใหม่) ซึ่งเป็นชุดการประเมินผลตามสถานการณ์จำลองที่พยายามครอบคลุมข้อกำหนดส่วนใหญ่ในข้อกำหนดของโมเดลให้ได้มากที่สุด โดยใช้ตัวอย่างที่เป็นตัวแทนในจำนวนจำกัด สิ่งนี้ช่วยให้เราสามารถติดตามจุดที่พฤติกรรมของโมเดลและข้อกำหนดของโมเดลที่อาจจะไม่สอดคล้องกัน และช่วยให้เราสามารถตรวจสอบได้ว่าโมเดลกำลังตีความข้อกำหนดดังกล่าวตามเจตนารมณ์ที่เราวางไว้หรือไม่ การประเมินผลเหล่านี้เป็นเพียงส่วนหนึ่งของกลยุทธ์การประเมินในภาพรวม ซึ่งยังประกอบด้วยการประเมินที่เจาะจงในหลากหลายมิติของพฤติกรรม เข่น ด้านความปลอดภัยเฉพาะด้าน ความสัตย์จริงและการประจบสอพลอ บุคลิกภาพและรูปแบบการนำเสนอ รวมถึงขีดความสามารถด้านต่างๆ

แผนภูมิแสดงการปฏิบัติตามข้อกำหนดของโมเดล จำแนกตามส่วนสำหรับโมเดลต่างๆ ของ OpenAI ในช่วงเวลาที่ผ่านมา โปรดอ่านบล็อกฉบับเพิ่ม(เปิดในหน้าต่างใหม่)เติมสำหรับรายละเอียดการประเมินผลและแนวทางการตีความข้อมูลของเรา กล่าวโดยสรุป เราเชื่อว่าผลลัพธ์เหล่านี้สะท้อนถึงการพัฒนาที่แท้จริงและครอบคลุมในการจัดวางเป้าหมายของโมเดลในช่วงที่ผ่านมา แม้ผลลัพธ์ส่วนหนึ่งจะเกิดจากการนำโมเดลรุ่นเก่ามาประเมินด้วยนโยบายที่ทันสมัยกว่าก็ตาม

ในทางปฏิบัติการปรับปรุงข้อกำหนดส่วนใหญ่นั้นถูกขับเคลื่อนด้วยชุดข้อมูลนำเข้าที่เกิดขึ้นอย่างต่อเนื่องและสม่ำเสมอ

  • ปัญหาและข้อเสนอแนะจากสาธารณะ จุดที่สร้างความสับสน กรณีที่คลุมเครือ หรือข้อบกพร่องต่างๆ ซึ่งอาจเกิดจากตัวภาษาที่ใช้เขียนข้อกำหนดหรือเกิดจากพฤติกรรมที่โมเดลแสดงออกมา
  • ปัญหาภายใน รูปแบบที่เราพบในระหว่างการพัฒนาและการทดสอบ รวมถึงความคลุมเครือที่การตีความที่สมเหตุสมผลที่แตกต่างกันนำไปสู่พฤติกรรมที่แตกต่างกัน
  • ข้อมูลอัปเดตเกี่ยวกับพฤติกรรมและนโยบายความปลอดภัย หากเงื่อนไขหรือข้อตกลงในระดับนโยบายเปลี่ยนไป ข้อกำหนดก็จำเป็นต้องปรับเปลี่ยนตามเพื่อให้สอดคล้องกับโครงสร้างใหม่
  • ความสามารถและผลิตภัณฑ์ใหม่ เนื่องจากโมเดลมีความสามารถในการแสดงพฤติกรรมใหม่ๆ เพิ่มขึ้นและเรามีการเปิดตัวผลิตภัณฑ์ใหม่ เราจึงอยากให้ข้อกำหนดของโมเดลก้าวทันทั้งในด้านเนื้อหาและขอบเขตการครอบคลุม ตัวอย่างเช่น การเพิ่มกฎเกณฑ์สำหรับการปฏิสัมพันธ์แบบมัลติโมดัล(เปิดในหน้าต่างใหม่) เอเจนต์อัตโนมัติ(เปิดในหน้าต่างใหม่) และผู้ใช้งานที่มีอายุต่ำกว่า 18 ปี(เปิดในหน้าต่างใหม่)

องค์ประกอบที่ทำให้เนื้อหาของข้อกำหนดมีคุณภาพ

หลักการออกแบบบางประการเป็นแนวทางในการเขียนและปรับปรุงข้อกำหนดของโมเดล

  • ความชัดเจนและความแม่นยำ “จงซื่อสัตย์” เป็นคุณค่าที่ดี แต่ไม่ใช่กระบวนการตัดสินใจที่สมบูรณ์ ข้อกำหนดของโมเดลควรทำให้ข้อขัดแย้งมีความชัดเจนยิ่งขึ้น ไม่ใช่ซ่อนเร้นประเด็นเหล่านั้นไว้ภายใต้ถ้อยคำที่ดูประนีประนอม ในกรณีที่สามารถปฏิบัติได้ เราควรระบุความขัดแย้งที่อาจเกิดขึ้นระหว่างกฎเกณฑ์ต่างๆ อย่างชัดแจ้ง พร้อมทั้งให้คำแนะนำหรือตัวอย่างประกอบเกี่ยวกับวิธีการแก้ไขความขัดแย้งเหล่านั้น ตัวอย่างเช่น อย่าโกหก(เปิดในหน้าต่างใหม่) ชี้ให้เห็นถึงความขัดแย้งที่อาจเกิดขึ้นกับ มีความอบอุ่น(เปิดในหน้าต่างใหม่) โดยอธิบายว่าผู้ช่วยควรปฏิบัติตามบรรทัดฐานของความสุภาพ แต่ไม่ถึงขั้นพูดโกหกเพื่อให้สบายใจ ซึ่งอาจเข้าข่ายเป็นพฤติกรรมเอาใจผู้ใช้เกินควร(เปิดในหน้าต่างใหม่) และไม่เป็นประโยชน์สูงสุดต่อผู้ใช้
  • กฎที่มีสาระสำคัญ ผู้อ่านควรสามารถนำคำสั่งที่เกิดขึ้นจริงมาใช้และสร้างคำตอบที่ผู้อ่านคนอื่นสามารถระบุได้อย่างชัดเจนว่าอยู่ในขอบเขตหรือนอกขอบเขตที่กำหนดไว้ (แม้ว่าอาจมีการใช้ดุลยพินิจในกรณีที่เป็นประเด็นก้ำกึ่งก็ตาม)
  • การใช้ตัวอย่างที่ช่วยเพิ่มสัดส่วนข้อมูลที่เป็นประโยชน์ และลดข้อมูลรบกวนให้ได้มากที่สุด ตัวอย่างที่ดีมักเป็นหัวใจสำคัญของการจัดทำการอัปเดตข้อกำหนดที่มีคุณภาพสูง ตัวอย่างควรชี้ให้เห็นจุดที่กำหนดพฤติกรรมโมเดลได้ยาก พร้อมทั้งดึงเอาข้อขัดแย้งที่ซับซ้อนขึ้นมาตีแผ่และระบุแนวทางจัดการที่ชัดเจนว่าควรแก้ปัญหาอย่างไร ในลำดับรองลงมาตัวอย่างเหล่านั้นควรมีความมุ่งหมายที่จะเป็นต้นแบบของน้ำเสียงและรูปแบบที่พึงประสงค์ ซึ่งเป็นสิ่งที่ถ่ายทอดได้ยากในการอธิบายเป็นข้อความ
  • ความทนทาน เราพยายามหลีกเลี่ยงการใช้ตัวอย่างที่มีความคลุมเครือหรือความซับซ้อนเกินความจำเป็น เพื่อให้ข้อขัดแย้งหลักและแนวทางการแก้ไขที่พึงประสงค์มีความชัดเจน
  • ความสม่ำเสมอและการจัดระเบียบที่ชัดเจน เรามุ่งมั่นให้กฎในข้อกำหนดของโมเดลสอดคล้องกันอย่างสมบูรณ์ทั้งระหว่างกันเองและกับพฤติกรรมของโมเดลที่เราตั้งใจไว้ และทำให้การจัดระเบียบโดยรวมของเอกสารมีความชัดเจนและเข้าถึงได้ง่าย

อะไรจะเกิดขึ้นต่อไป

ข้อกำหนดของโมเดลไม่ใช่การยืนยันว่าเราสามารถระบุทุกสิ่งที่มีความสำคัญได้ทั้งหมด หรือโมเดลจะสามารถบรรลุเป้าหมายได้อย่างแม่นยำเสมอไป แต่เป็นการยืนยันว่าพฤติกรรมที่พึงประสงค์มีความสำคัญเพียงพอที่จะต้องมีความชัดเจน นำไปปฏิบัติได้จริง และสามารถปรับปรุงแก้ไขได้

เกณฑ์ความสำเร็จสามข้อเป็นแนวทางในการพัฒนาสิ่งนี้

  • การสื่อสารที่ชัดแจ้ง ผู้คนทั้งภายในและภายนอก OpenAI สามารถคาดการณ์พฤติกรรมได้อย่างแม่นยำ และสามารถอ้างอิงข้อความได้เมื่อพฤติกรรมนั้นไม่เป็นไปตามที่คาดหมาย
  • การนำไปใช้ได้จริง ข้อกำหนดของโมเดลสามารถใช้เพื่อออกแบบการประเมินผล วินิจฉัยเหตุการณ์ และตัดสินใจด้านผลิตภัณฑ์ได้อย่างสอดคล้องกัน ไม่ใช่มีไว้เพียงเพื่อแสดงคุณค่าเท่านั้น
  • ความสามารถในการแก้ไข ข้อกำหนดของโมเดลสามารถพัฒนาไปได้ตามที่เราเรียนรู้ โดยไม่กลายเป็นเป้าหมายที่เปลี่ยนแปลงตลอดเวลาและขาดเสถียรภาพ

เมื่อโมเดลและผลิตภัณฑ์พัฒนาไป เราคาดว่าข้อกำหนดของโมเดลจะขยายและทำให้ชัดเจนยิ่งขึ้นให้สอดคล้องกับความสามารถใหม่ๆ และบริบทการนำไปใช้งาน เป้าหมายคือการทำให้ข้อกำหนดด้านพฤติกรรมมีความสอดคล้องกัน ตรวจสอบได้ และสอดคล้องกับพันธกิจของเราในการทำให้ AGI เป็นประโยชน์ต่อมวลมนุษยชาติ