24 มีนาคม 2569

ช่วยให้นักพัฒนาสร้างประสบการณ์ AI ที่ปลอดภัยยิ่งขึ้นสำหรับวัยรุ่น

ขอแนะนำชุดนโยบายความปลอดภัยสำหรับวัยรุ่น ซึ่งจัดทำในรูปแบบคำสั่งสำหรับระบบ gpt-oss-safeguard

กำลังโหลด…

วันนี้เราเปิดตัว นโยบายความปลอดภัยที่อิงตามคำสั่ง⁠(เปิดในหน้าต่างใหม่) เพื่อช่วยให้นักพัฒนาสร้างมาตรการป้องกันที่เหมาะสมกับวัยสำหรับวัยรุ่น นโยบายเหล่านี้สร้างขึ้นเพื่อใช้งานร่วมกับ gpt-oss-safeguard⁠(เปิดในหน้าต่างใหม่) ซึ่งเป็นโมเดลความปลอดภัยแบบเปิดของเรา โดยช่วยให้นักพัฒนาเปลี่ยนข้อกำหนดด้านความปลอดภัยเป็นตัวจำแนกประเภทที่ใช้งานได้จริงในระบบต่างๆ

เราปล่อยโมเดลแบบเปิดให้ใช้งานเพื่อเปิดโอกาสให้ทุกคนเข้าถึง AI ประสิทธิภาพสูงและส่งเสริมการสร้างนวัตกรรมใหม่ๆ ในขณะเดียวกันเราเชื่อว่าความปลอดภัยและนวัตกรรมเป็นสิ่งที่ต้องดำเนินควบคู่กันไป และนักพัฒนาควรเข้าถึงโมเดลที่มีประสิทธิภาพสูงได้ พร้อมกับมีเครื่องมือและนโยบายในการปรับใช้จริงอย่างปลอดภัยและมีความรับผิดชอบ เราพัฒนานโยบายเหล่านี้เพื่อช่วยให้นักพัฒนาสามารถปกป้องกลุ่มผู้ใช้ที่เป็นวัยรุ่นได้อย่างมีประสิทธิภาพ โดยได้รับคำแนะนำจากองค์กรภายนอกที่น่าเชื่อถืออย่าง Common Sense Media⁠(เปิดในหน้าต่างใหม่) และ everyone.ai⁠(เปิดในหน้าต่างใหม่)

เราตระหนักดีว่าวัยรุ่นและผู้ใหญ่มีความต้องการที่แตกต่างกัน และกลุ่มวัยรุ่นจำเป็นต้องได้รับความคุ้มครองเพิ่มเติม เราออกแบบนโยบายเหล่านี้เพื่อช่วยให้นักพัฒนาตระหนักถึงความแตกต่างดังกล่าว และสร้างประสบการณ์ที่ช่วยเสริมสร้างทักษะควบคู่ไปกับความเหมาะสมสำหรับผู้ใช้รุ่นเยาว์

การต่อยอดงานในวงกว้างของเราเพื่อปกป้องเยาวชน

ตลอดเวลาที่ผ่านมา เราตั้งใจสร้างระบบ AI ที่ส่งเสริมศักยภาพของเยาวชนและปกป้องพวกเขาให้ปลอดภัยไปพร้อมๆ กัน ในฐานะส่วนหนึ่งของการดำเนินงานนี้ เราได้ปรับปรุงข้อกำหนดของโมเดล⁠(เปิดในหน้าต่างใหม่) ซึ่งเป็นแนวทางกำหนดพฤติกรรมที่พึงประสงค์ของโมเดลจาก OpenAI โดยเพิ่มหลักการสำหรับผู้ใช้ที่อายุต่ำกว่า 18 ปี⁠(เปิดในหน้าต่างใหม่) พร้อมทั้งนำระบบป้องกันในระดับผลิตภัณฑ์มาใช้ เช่น การควบคุมโดยผู้ปกครอง⁠และการคาดการณ์อายุ⁠ เพื่อการปกป้องผู้ใช้รุ่นเยาว์ที่ดียิ่งขึ้น นอกจากนี้เรายังได้เรียกร้องให้มีมาตรการคุ้มครองในระดับทั้งอุตสาหกรรมผ่าน แผนแม่บทเสริมสร้างความปลอดภัยให้กับวัยรุ่น⁠

การเปิดตัวในวันนี้เป็นการต่อยอดจากรากฐานที่วางไว้ เราเปิดให้นักพัฒนาเข้าถึงนโยบายความปลอดภัยเหล่านี้เพื่อสนับสนุนการวางระบบป้องกันสำหรับวัยรุ่น และช่วยกระจายโอกาสในการเข้าถึงมาตรฐานความปลอดภัยให้ทั่วถึงทั้งระบบนิเวศในกลุ่มโมเดลแบบเปิด

การเปลี่ยนความปลอดภัยสำหรับวัยรุ่นให้เป็นแนวทางปฏิบัติที่ชัดเจนและใช้งานได้จริง

แม้ว่าตัวจัดประเภทความปลอดภัยอย่าง gpt-oss-safeguard จะสามารถตรวจจับเนื้อหาที่เป็นอันตรายได้ แต่ระบบก็ต้องพึ่งพาการกำหนดนิยามที่ชัดเจนว่าเนื้อหาประเภทใดบ้างที่เข้าข่ายอันตราย ความท้าทายหลักของนักพัฒนาอยู่ที่การนิยามนโยบายที่ครอบคลุมความเสี่ยงเฉพาะของวัยรุ่นได้อย่างถูกต้อง เพื่อให้ระบบต่างๆ สามารถนำไปใช้งานได้อย่างมีมาตรฐานเดียวกัน

แม้แต่ทีมงานที่มากประสบการณ์ก็ยังพบปัญหาในการแปลงนโยบายความปลอดภัยกว้างๆ ให้เป็นกฎที่ใช้งานได้จริง เนื่องจากงานนี้ต้องอาศัยทั้งความเชี่ยวชาญเฉพาะทางและความรู้เชิงลึกด้าน AI ซึ่งอาจนำไปสู่ช่องโหว่ในการดูแลความปลอดภัย ทำให้การตรวจสอบไม่มีมาตรฐาน และนำไปสู่การบล็อกเนื้อหาที่กว้างจนเกินความจำเป็น นโยบายที่ชัดเจนและมีขอบเขตที่เหมาะสมถือเป็นรากฐานสำคัญสำหรับระบบความปลอดภัยที่มีประสิทธิภาพ

ช่วยให้นักพัฒนาสามารถนำนโยบายความปลอดภัยสำหรับวัยรุ่นไปปรับใช้ได้จริง

เพื่อแก้ปัญหาความท้าทายนี้ เราออกนโยบายความปลอดภัย⁠(เปิดในหน้าต่างใหม่)ชุดใหม่ที่ออกแบบมาเพื่อรับมือกับความเสี่ยงของวัยรุ่นโดยเฉพาะ ซึ่งกลั่นกรองมาจากงานวิจัยด้านพัฒนาการที่แตกต่างกันของเด็กและผู้ใหญ่ เราจัดโครงสร้างนโยบายเหล่านี้ในรูปแบบคำสั่งที่นักพัฒนาสามารถนำไปใช้กับ gpt-oss-safeguard⁠(เปิดในหน้าต่างใหม่) และโมเดลการใช้เหตุผลอื่นๆ ได้โดยตรง เพื่อช่วยให้การบังคับใช้มาตรฐานความปลอดภัยในระบบต่างๆ เป็นไปอย่างสม่ำเสมอและง่ายดายยิ่งขึ้น

การเผยแพร่ในระยะเริ่มต้นนี้ประกอบด้วยนโยบายที่ครอบคลุมเนื้อหาดังต่อไปนี้

เนื้อหาที่มีความรุนแรงอย่างชัดเจน
เนื้อหารุนแรงทางเพศ
ค่านิยมเกี่ยวกับรูปร่างและพฤติกรรมที่เป็นอันตราย
กิจกรรมและความท้าทายที่เสี่ยงอันตราย
การสวมบทบาทสมมติที่เกี่ยวข้องกับเรื่องรักใคร่หรือการใช้ความรุนแรง
สินค้าและบริการที่จำกัดอายุ

นักพัฒนาสามารถใช้นโยบายเหล่านี้เพื่อคัดกรองเนื้อหาแบบเรียลไทม์ และใช้ในการวิเคราะห์เนื้อหาที่ผู้ใช้สร้างขึ้นในรูปแบบออฟไลน์ได้เช่นกัน

การจัดโครงสร้างนโยบายในรูปแบบของคำสั่งช่วยให้นักพัฒนาสามารถผสานนโยบายเหล่านี้เข้ากับขั้นตอนการทำงานเดิม ปรับเปลี่ยนให้เข้ากับรูปแบบการใช้งาน และพัฒนาระบบให้ดียิ่งขึ้นได้อย่างต่อเนื่อง

ภาพไดอะแกรมอธิบายการแบ่งประเภทนโยบายความปลอดภัยของเยาวชนและข้อมูลเนื้อหาต่างๆ ที่ส่งไปยังระบบดูแลความปลอดภัย GPT-OSS โดยระบบจะประมวลผลด้วยเหตุผลภายในตัวระบบ

พัฒนาข้อมูลชุดนี้โดยอาศัยข้อเสนอแนะจากผู้เชี่ยวชาญภายนอก

เราทำงานร่วมกับองค์กรภายนอก รวมถึง Common Sense Media⁠(เปิดในหน้าต่างใหม่) และ everyone.ai⁠(เปิดในหน้าต่างใหม่) เพื่อพัฒนานโยบายเหล่านี้ ความเชี่ยวชาญของพวกเขาช่วยกำหนดขอบเขตของเนื้อหาที่ต้องครอบคลุม ปรับปรุงโครงสร้างของคำสั่งให้มีประสิทธิภาพ และขัดเกลากรณีที่ตัดสินได้ยากให้ชัดเจนขึ้นเมื่อต้องทำการประเมินผล

งานชิ้นนี้สะท้อนถึงความมุ่งมั่นอย่างต่อเนื่องในการร่วมมือกับกลุ่มผู้เชี่ยวชาญและเครือข่ายพันธมิตรในวงกว้าง เพื่อยกระดับการทำงานของระบบ AI ในการสนับสนุนเยาวชนให้ดียิ่งขึ้น

“ช่องโหว่ที่สำคัญที่สุดประการหนึ่งในด้านความปลอดภัยของ AI สำหรับวัยรุ่นคือ การขาดนโยบายเชิงปฏิบัติที่ชัดเจนซึ่งนักพัฒนาสามารถนำไปใช้เป็นรากฐานในการสร้างระบบได้ บ่อยครั้งที่นักพัฒนาต้องเริ่มต้นจากศูนย์ นโยบายในรูปแบบคำสั่งหล่านี้ช่วยกำหนดมาตรฐานความปลอดภัยขั้นพื้นฐานที่มีประสิทธิภาพให้แก่ระบบนิเวศเทคโนโลยี อีกทั้งการเปิดเป็นโอเพนซอร์สยังเอื้อให้นักพัฒนาปรับแต่งและยกระดับมาตรฐานเหล่านี้ให้ทันสมัยอยู่เสมอ การเปิดโครงสร้างพื้นฐานให้ใช้งานได้อย่างทั่วถึงถือเป็นสัญญาณที่ดี เราคาดหวังว่าสิ่งนี้จะกลายเป็นจุดเริ่มต้นที่เชื่อมโยงมาตรฐานความปลอดภัยของเยาวชนเข้าด้วยกันในทุกภาคส่วนของอุตสาหกรรม”

—Robbie Torney หัวหน้าฝ่าย AI และการประเมินผลดิจิทัลของ Common Sense Media

“การทำให้นโยบายความปลอดภัยของเยาวชนใช้งานได้จริงถือเป็นเรื่องที่มีประโยชน์มาก เพราะช่วยเปลี่ยนความรู้จากผู้เชี่ยวชาญให้กลายเป็นแนวทางที่ใช้ในระบบจริงได้ การกำหนดนโยบายเนื้อหาเป็นจุดเริ่มต้นที่สำคัญซึ่งจะช่วยขยายผลไปสู่การศึกษาว่าพฤติกรรมของโมเดลส่งผลต่อความเสี่ยงของวัยรุ่นอย่างไรเมื่อเวลาผ่านไปในอนาคต everyone.ai ⁠(เปิดในหน้าต่างใหม่)ได้รับแรงบันดาลใจจากโครงการนี้รวมถึงงานวิจัยของเราเอง จึงจัดทำนโยบายพฤติกรรมชุดแรกที่เน้นรับมือความเสี่ยงด้านการกีดกันและการพึ่งพา AI จนเกินพอดี"

—Dr. Mathilde Cerioli ผู้บริหารฝ่ายวิทยาศาสตร์ที่ everyone.AI

นี่คือจุดเริ่มต้นเท่านั้น ไม่ใช่คำตอบสุดท้ายสำหรับทุกปัญหา

เรากำหนดให้นโยบายเหล่านี้เป็นเพียงจุดเริ่มต้นเท่านั้น ไม่ใช่คำจำกัดความที่ครอบคลุมหรือข้อสรุปสุดท้าย และไม่ใช่การรับประกันความปลอดภัยของวัยรุ่นอย่างสมบูรณ์ เนื่องจากแอปพลิเคชันแต่ละตัวมีเงื่อนไขด้านความเสี่ยงและกลุ่มเป้าหมายเฉพาะตัว นักพัฒนาจึงมีหน้าที่สำคัญในการทำความเข้าใจความเสี่ยงที่อาจเกิดขึ้นจากผลิตภัณฑ์และการนำ AI มาใช้งานในระบบของตนเอง เราสนับสนุนให้นักพัฒนานำนโยบายเหล่านี้ไปปรับปรุงและต่อยอดตามความต้องการเฉพาะด้าน พร้อมทั้งใช้งานร่วมกับมาตรการป้องกันอื่นๆ เช่น การออกแบบผลิตภัณฑ์ การควบคุมโดยผู้ใช้ ความโปร่งใสที่เป็นมิตรต่อเยาวชน ระบบเฝ้าระวัง และการสื่อสารที่คำนึงถึงอายุของผู้ใช้เป็นสำคัญ

เราเชื่อว่าแนวทางการป้องกันเชิงลึก⁠แบบหลายชั้นมีความสำคัญอย่างยิ่งต่อการสร้างระบบ AI ที่ปลอดภัยยิ่งขึ้น นโยบายเหล่านี้อ้างอิงจากประสบการณ์ภายในของเรา แต่ไม่ได้สะท้อนขอบเขตทั้งหมดของนโยบายหรือมาตรการป้องกันภายในของ OpenAI

เส้นทางข้างหน้า

เรากำลังเผยแพร่นโยบายเหล่านี้เป็นแบบโอเพนซอร์สผ่าน ROOST Model Community⁠(เปิดในหน้าต่างใหม่) เพื่อส่งเสริมการทำงานร่วมกันและการปรับปรุงอย่างต่อเนื่อง หากต้องการมีส่วนร่วม ให้ข้อเสนอแนะ หรือแบ่งปันนโยบายความปลอดภัยสำหรับวัยรุ่นเพิ่มเติม โปรดเข้าไปที่ RMC GitHub Repository⁠(เปิดในหน้าต่างใหม่)

นักพัฒนาและองค์กรสามารถปรับใช้นโยบายเหล่านี้ให้เข้ากับแอปพลิเคชันเฉพาะด้านของตนเอง แปลเป็นภาษาต่างๆ และขยายขอบเขตให้ครอบคลุมพื้นที่ความเสี่ยงเพิ่มเติมได้ เมื่อเวลาผ่านไป เราคาดหวังว่าสิ่งนี้จะกลายเป็นพื้นฐานสำคัญที่ทุกภาคส่วนใช้ร่วมกันเพื่อยกระดับการบังคับใช้นโยบายความปลอดภัยในระบบ AI ให้มีประสิทธิภาพยิ่งขึ้น

คุณสามารถเริ่มต้นใช้งาน gpt-oss-safeguard ได้โดยการดาวน์โหลดจาก Hugging Face⁠(เปิดในหน้าต่างใหม่)

อ่านต่อ

ดูทั้งหมด

ความปลอดภัยและการจัดแนวพฤติกรรมในยุคของโมเดลที่รองรับงานระยะยาว

ความปลอดภัย20 ก.ค. 2569

Why teens deserve access to safe AI — card image

เหตุใดวัยรุ่นจึงควรมีสิทธิ์เข้าถึง AI ที่ปลอดภัย

ความปลอดภัย16 ก.ค. 2569

GPT-Red: การปลดล็อกการพัฒนาตนเองเพื่อสร้างความทนทาน

ความปลอดภัย15 ก.ค. 2569