ช่วยให้นักพัฒนาสร้างประสบการณ์ AI ที่ปลอดภัยยิ่งขึ้นสำหรับวัยรุ่น
ขอแนะนำชุดนโยบายความปลอดภัยสำหรับวัยรุ่น ซึ่งจัดทำในรูปแบบคำสั่งสำหรับระบบ gpt-oss-safeguard
วันนี้เราเปิดตัว นโยบายความปลอดภัยที่อิงตามคำสั่ง(เปิดในหน้าต่างใหม่) เพื่อช่วยให้นักพัฒนาสร้างมาตรการป้องกันที่เหมาะสมกับวัยสำหรับวัยรุ่น นโยบายเหล่านี้สร้างขึ้นเพื่อใช้งานร่วมกับ gpt-oss-safeguard(เปิดในหน้าต่างใหม่) ซึ่งเป็นโมเดลความปลอดภัยแบบเปิดของเรา โดยช่วยให้นักพัฒนาเปลี่ยนข้อกำหนดด้านความปลอดภัยเป็นตัวจำแนกประเภทที่ใช้งานได้จริงในระบบต่างๆ
เราปล่อยโมเดลแบบเปิดให้ใช้งานเพื่อเปิดโอกาสให้ทุกคนเข้าถึง AI ประสิทธิภาพสูงและส่งเสริมการสร้างนวัตกรรมใหม่ๆ ในขณะเดียวกันเราเชื่อว่าความปลอดภัยและนวัตกรรมเป็นสิ่งที่ต้องดำเนินควบคู่กันไป และนักพัฒนาควรเข้าถึงโมเดลที่มีประสิทธิภาพสูงได้ พร้อมกับมีเครื่องมือและนโยบายในการปรับใช้จริงอย่างปลอดภัยและมีความรับผิดชอบ เราพัฒนานโยบายเหล่านี้เพื่อช่วยให้นักพัฒนาสามารถปกป้องกลุ่มผู้ใช้ที่เป็นวัยรุ่นได้อย่างมีประสิทธิภาพ โดยได้รับคำแนะนำจากองค์กรภายนอกที่น่าเชื่อถืออย่าง Common Sense Media(เปิดในหน้าต่างใหม่) และ everyone.ai(เปิดในหน้าต่างใหม่)
เราตระหนักดีว่าวัยรุ่นและผู้ใหญ่มีความต้องการที่แตกต่างกัน และกลุ่มวัยรุ่นจำเป็นต้องได้รับความคุ้มครองเพิ่มเติม เราออกแบบนโยบายเหล่านี้เพื่อช่วยให้นักพัฒนาตระหนักถึงความแตกต่างดังกล่าว และสร้างประสบการณ์ที่ช่วยเสริมสร้างทักษะควบคู่ไปกับความเหมาะสมสำหรับผู้ใช้รุ่นเยาว์
ตลอดเวลาที่ผ่านมา เราตั้งใจสร้างระบบ AI ที่ส่งเสริมศักยภาพของเยาวชนและปกป้องพวกเขาให้ปลอดภัยไปพร้อมๆ กัน ในฐานะส่วนหนึ่งของการดำเนินงานนี้ เราได้ปรับปรุงข้อกำหนดของโมเดล(เปิดในหน้าต่างใหม่) ซึ่งเป็นแนวทางกำหนดพฤติกรรมที่พึงประสงค์ของโมเดลจาก OpenAI โดยเพิ่มหลักการสำหรับผู้ใช้ที่อายุต่ำกว่า 18 ปี(เปิดในหน้าต่างใหม่) พร้อมทั้งนำระบบป้องกันในระดับผลิตภัณฑ์มาใช้ เช่น การควบคุมโดยผู้ปกครองและการคาดการณ์อายุ เพื่อการปกป้องผู้ใช้รุ่นเยาว์ที่ดียิ่งขึ้น นอกจากนี้เรายังได้เรียกร้องให้มีมาตรการคุ้มครองในระดับทั้งอุตสาหกรรมผ่าน แผนแม่บทเสริมสร้างความปลอดภัยให้กับวัยรุ่น
การเปิดตัวในวันนี้เป็นการต่อยอดจากรากฐานที่วางไว้ เราเปิดให้นักพัฒนาเข้าถึงนโยบายความปลอดภัยเหล่านี้เพื่อสนับสนุนการวางระบบป้องกันสำหรับวัยรุ่น และช่วยกระจายโอกาสในการเข้าถึงมาตรฐานความปลอดภัยให้ทั่วถึงทั้งระบบนิเวศในกลุ่มโมเดลแบบเปิด
แม้ว่าตัวจัดประเภทความปลอดภัยอย่าง gpt-oss-safeguard จะสามารถตรวจจับเนื้อหาที่เป็นอันตรายได้ แต่ระบบก็ต้องพึ่งพาการกำหนดนิยามที่ชัดเจนว่าเนื้อหาประเภทใดบ้างที่เข้าข่ายอันตราย ความท้าทายหลักของนักพัฒนาอยู่ที่การนิยามนโยบายที่ครอบคลุมความเสี่ยงเฉพาะของวัยรุ่นได้อย่างถูกต้อง เพื่อให้ระบบต่างๆ สามารถนำไปใช้งานได้อย่างมีมาตรฐานเดียวกัน
แม้แต่ทีมงานที่มากประสบการณ์ก็ยังพบปัญหาในการแปลงนโยบายความปลอดภัยกว้างๆ ให้เป็นกฎที่ใช้งานได้จริง เนื่องจากงานนี้ต้องอาศัยทั้งความเชี่ยวชาญเฉพาะทางและความรู้เชิงลึกด้าน AI ซึ่งอาจนำไปสู่ช่องโหว่ในการดูแลความปลอดภัย ทำให้การตรวจสอบไม่มีมาตรฐาน และนำไปสู่การบล็อกเนื้อหาที่กว้างจนเกินความจำเป็น นโยบายที่ชัดเจนและมีขอบเขตที่เหมาะสมถือเป็นรากฐานสำคัญสำหรับระบบความปลอดภัยที่มีประสิทธิภาพ
เพื่อแก้ปัญหาความท้าทายนี้ เราออกนโยบายความปลอดภัย(เปิดในหน้าต่างใหม่)ชุดใหม่ที่ออกแบบมาเพื่อรับมือกับความเสี่ยงของวัยรุ่นโดยเฉพาะ ซึ่งกลั่นกรองมาจากงานวิจัยด้านพัฒนาการที่แตกต่างกันของเด็กและผู้ใหญ่ เราจัดโครงสร้างนโยบายเหล่านี้ในรูปแบบคำสั่งที่นักพัฒนาสามารถนำไปใช้กับ gpt-oss-safeguard(เปิดในหน้าต่างใหม่) และโมเดลการใช้เหตุผลอื่นๆ ได้โดยตรง เพื่อช่วยให้การบังคับใช้มาตรฐานความปลอดภัยในระบบต่างๆ เป็นไปอย่างสม่ำเสมอและง่ายดายยิ่งขึ้น
การเผยแพร่ในระยะเริ่มต้นนี้ประกอบด้วยนโยบายที่ครอบคลุมเนื้อหาดังต่อไปนี้
- เนื้อหาที่มีความรุนแรงอย่างชัดเจน
- เนื้อหารุนแรงทางเพศ
- ค่านิยมเกี่ยวกับรูปร่างและพฤติกรรมที่เป็นอันตราย
- กิจกรรมและความท้าทายที่เสี่ยงอันตราย
- การสวมบทบาทสมมติที่เกี่ยวข้องกับเรื่องรักใคร่หรือการใช้ความรุนแรง
- สินค้าและบริการที่จำกัดอายุ
นักพัฒนาสามารถใช้นโยบายเหล่านี้เพื่อคัดกรองเนื้อหาแบบเรียลไทม์ และใช้ในการวิเคราะห์เนื้อหาที่ผู้ใช้สร้างขึ้นในรูปแบบออฟไลน์ได้เช่นกัน
การจัดโครงสร้างนโยบายในรูปแบบของคำสั่งช่วยให้นักพัฒนาสามารถผสานนโยบายเหล่านี้เข้ากับขั้นตอนการทำงานเดิม ปรับเปลี่ยนให้เข้ากับรูปแบบการใช้งาน และพัฒนาระบบให้ดียิ่งขึ้นได้อย่างต่อเนื่อง

เราทำงานร่วมกับองค์กรภายนอก รวมถึง Common Sense Media(เปิดในหน้าต่างใหม่) และ everyone.ai(เปิดในหน้าต่างใหม่) เพื่อพัฒนานโยบายเหล่านี้ ความเชี่ยวชาญของพวกเขาช่วยกำหนดขอบเขตของเนื้อหาที่ต้องครอบคลุม ปรับปรุงโครงสร้างของคำสั่งให้มีประสิทธิภาพ และขัดเกลากรณีที่ตัดสินได้ยากให้ชัดเจนขึ้นเมื่อต้องทำการประเมินผล
งานชิ้นนี้สะท้อนถึงความมุ่งมั่นอย่างต่อเนื่องในการร่วมมือกับกลุ่มผู้เชี่ยวชาญและเครือข่ายพันธมิตรในวงกว้าง เพื่อยกระดับการทำงานของระบบ AI ในการสนับสนุนเยาวชนให้ดียิ่งขึ้น
“ช่องโหว่ที่สำคัญที่สุดประการหนึ่งในด้านความปลอดภัยของ AI สำหรับวัยรุ่นคือ การขาดนโยบายเชิงปฏิบัติที่ชัดเจนซึ่งนักพัฒนาสามารถนำไปใช้เป็นรากฐานในการสร้างระบบได้ บ่อยครั้งที่นักพัฒนาต้องเริ่มต้นจากศูนย์ นโยบายในรูปแบบคำสั่งหล่านี้ช่วยกำหนดมาตรฐานความปลอดภัยขั้นพื้นฐานที่มีประสิทธิภาพให้แก่ระบบนิเวศเทคโนโลยี อีกทั้งการเปิดเป็นโอเพนซอร์สยังเอื้อให้นักพัฒนาปรับแต่งและยกระดับมาตรฐานเหล่านี้ให้ทันสมัยอยู่เสมอ การเปิดโครงสร้างพื้นฐานให้ใช้งานได้อย่างทั่วถึงถือเป็นสัญญาณที่ดี เราคาดหวังว่าสิ่งนี้จะกลายเป็นจุดเริ่มต้นที่เชื่อมโยงมาตรฐานความปลอดภัยของเยาวชนเข้าด้วยกันในทุกภาคส่วนของอุตสาหกรรม”
—Robbie Torney หัวหน้าฝ่าย AI และการประเมินผลดิจิทัลของ Common Sense Media
“การทำให้นโยบายความปลอดภัยของเยาวชนใช้งานได้จริงถือเป็นเรื่องที่มีประโยชน์มาก เพราะช่วยเปลี่ยนความรู้จากผู้เชี่ยวชาญให้กลายเป็นแนวทางที่ใช้ในระบบจริงได้ การกำหนดนโยบายเนื้อหาเป็นจุดเริ่มต้นที่สำคัญซึ่งจะช่วยขยายผลไปสู่การศึกษาว่าพฤติกรรมของโมเดลส่งผลต่อความเสี่ยงของวัยรุ่นอย่างไรเมื่อเวลาผ่านไปในอนาคต everyone.ai (เปิดในหน้าต่างใหม่)ได้รับแรงบันดาลใจจากโครงการนี้รวมถึงงานวิจัยของเราเอง จึงจัดทำนโยบายพฤติกรรมชุดแรกที่เน้นรับมือความเสี่ยงด้านการกีดกันและการพึ่งพา AI จนเกินพอดี"
—Dr. Mathilde Cerioli ผู้บริหารฝ่ายวิทยาศาสตร์ที่ everyone.AI
เรากำหนดให้นโยบายเหล่านี้เป็นเพียงจุดเริ่มต้นเท่านั้น ไม่ใช่คำจำกัดความที่ครอบคลุมหรือข้อสรุปสุดท้าย และไม่ใช่การรับประกันความปลอดภัยของวัยรุ่นอย่างสมบูรณ์ เนื่องจากแอปพลิเคชันแต่ละตัวมีเงื่อนไขด้านความเสี่ยงและกลุ่มเป้าหมายเฉพาะตัว นักพัฒนาจึงมีหน้าที่สำคัญในการทำความเข้าใจความเสี่ยงที่อาจเกิดขึ้นจากผลิตภัณฑ์และการนำ AI มาใช้งานในระบบของตนเอง เราสนับสนุนให้นักพัฒนานำนโยบายเหล่านี้ไปปรับปรุงและต่อยอดตามความต้องการเฉพาะด้าน พร้อมทั้งใช้งานร่วมกับมาตรการป้องกันอื่นๆ เช่น การออกแบบผลิตภัณฑ์ การควบคุมโดยผู้ใช้ ความโปร่งใสที่เป็นมิตรต่อเยาวชน ระบบเฝ้าระวัง และการสื่อสารที่คำนึงถึงอายุของผู้ใช้เป็นสำคัญ
เราเชื่อว่าแนวทางการป้องกันเชิงลึกแบบหลายชั้นมีความสำคัญอย่างยิ่งต่อการสร้างระบบ AI ที่ปลอดภัยยิ่งขึ้น นโยบายเหล่านี้อ้างอิงจากประสบการณ์ภายในของเรา แต่ไม่ได้สะท้อนขอบเขตทั้งหมดของนโยบายหรือมาตรการป้องกันภายในของ OpenAI
เรากำลังเผยแพร่นโยบายเหล่านี้เป็นแบบโอเพนซอร์สผ่าน ROOST Model Community(เปิดในหน้าต่างใหม่) เพื่อส่งเสริมการทำงานร่วมกันและการปรับปรุงอย่างต่อเนื่อง หากต้องการมีส่วนร่วม ให้ข้อเสนอแนะ หรือแบ่งปันนโยบายความปลอดภัยสำหรับวัยรุ่นเพิ่มเติม โปรดเข้าไปที่ RMC GitHub Repository(เปิดในหน้าต่างใหม่)
นักพัฒนาและองค์กรสามารถปรับใช้นโยบายเหล่านี้ให้เข้ากับแอปพลิเคชันเฉพาะด้านของตนเอง แปลเป็นภาษาต่างๆ และขยายขอบเขตให้ครอบคลุมพื้นที่ความเสี่ยงเพิ่มเติมได้ เมื่อเวลาผ่านไป เราคาดหวังว่าสิ่งนี้จะกลายเป็นพื้นฐานสำคัญที่ทุกภาคส่วนใช้ร่วมกันเพื่อยกระดับการบังคับใช้นโยบายความปลอดภัยในระบบ AI ให้มีประสิทธิภาพยิ่งขึ้น
คุณสามารถเริ่มต้นใช้งาน gpt-oss-safeguard ได้โดยการดาวน์โหลดจาก Hugging Face(เปิดในหน้าต่างใหม่)


