เปิดตัวโปรแกรม OpenAI Safety Bug Bounty
การทดสอบประเด็นด้านความปลอดภัยและการนำไปใช้ในทางที่ผิดครอบคลุมทั่วทั้ง OpenAI
วันนี้ OpenAI กำลังเปิดตัวโปรแกรม Safety Bug Bounty(เปิดในหน้าต่างใหม่) แบบสาธารณะ ซึ่งมุ่งเน้นการระบุการใช้งาน AI ในทางที่ผิดและความเสี่ยงด้านความปลอดภัยในผลิตภัณฑ์ต่างๆ ของเรา ยิ่งเทคโนโลยี AI ก้าวหน้าไปไวเท่าไหร่ วิธีการนำไปใช้ในทางที่ผิดที่อาจเกิดขึ้นได้ก็ยิ่งหลากหลายและซับซ้อนขึ้นเท่านั้น เป้าหมายของเราคือการทำให้มั่นใจว่าระบบของเรายังคงปลอดภัยและมั่นคง จากการใช้งานในทางที่ผิดหรือการละเมิดที่อาจนำไปสู่อันตรายที่เกิดขึ้นจริง
โปรแกรมใหม่นี้จะเข้ามาเสริมโปรแกรม Security Bug Bounty(เปิดในหน้าต่างใหม่) ของ OpenAI โดยการเปิดรับรายงานประเด็นที่ก่อให้เกิดความเสี่ยงด้านความปลอดภัย และการใช้งาน AI ผิดวัตถุประสงค์ที่มีผลกระทบร้ายแรง ถึงแม้ว่าประเด็นเหล่านั้นจะไม่เข้าข่ายช่องโหว่ด้านความปลอดภัยของระบบก็ตาม เรามีความยินดีที่จะร่วมมือกับนักวิจัยด้านความปลอดภัยและความมั่นคงอย่างต่อเนื่องผ่านโปรแกรมนี้ เพื่อช่วยในการระบุและแก้ไขประเด็นที่อยู่นอกขอบเขตของช่องโหว่ทางเทคนิคทั่วไป แต่ยังคงก่อให้เกิดความเสี่ยงที่เกิดขึ้นจริง รายงานที่ส่งเข้ามาจะผ่านการคัดกรองโดยทีมงาน Safety Bug Bounty และ Security Bug Bounty ของ OpenAI ซึ่งอาจมีการส่งต่อข้อมูลระหว่างทั้งสองโปรแกรมตามความเหมาะสมของขอบเขตและความรับผิดชอบของเนื้อหา
โปรแกรม Safety Bug Bounty(เปิดในหน้าต่างใหม่) ใหม่นี้มุ่งเน้นไปที่สถานการณ์จำลองด้านความปลอดภัยเฉพาะของ AI ตามรายการที่ระบุด้านล่างนี้
ความเสี่ยงของเอเจนต์ รวมถึง MCP
- การแทรกคำสั่งโดยบุคคลภายนอกและการลักลอบนำข้อมูลออก เมื่อข้อความของผู้โจมตีสามารถควบคุมเอเจนต์ของเหยื่อ (รวมถึงเบราว์เซอร์, ChatGPT Agent และผลิตภัณฑ์ในกลุ่มเอเจนต์อื่นๆ) ได้อย่างน่าเชื่อถือ พื่อล่อลวงให้กระทำการที่เป็นอันตรายหรือทำให้ข้อมูลที่ละเอียดอ่อนของผู้ใช้รั่วไหลออกมา พฤติกรรมดังกล่าวต้องสามารถทำซ้ำเพื่อให้เกิดผลลัพธ์เดิมได้ไม่น้อยกว่าร้อยละ 50 ของจำนวนครั้งที่ทดสอบ
- ผลิตภัณฑ์ในกลุ่มเอเจนต์ของ OpenAI ดำเนินการที่ไม่อนุญาตบนเว็บไซต์ของ OpenAI ในลักษณะที่เป็นวงกว้าง
- ผลิตภัณฑ์ในกลุ่มเอเจนต์ของ OpenAI กระทำการที่อาจก่อให้เกิดอันตรายในรูปแบบอื่นที่ไม่ได้ระบุไว้ข้างต้น รายงานที่ถูกต้องและผ่านเกณฑ์จะต้องระบุถึงความเสียหายที่มีความสมเหตุสมผลและมีความสำคัญเป็นรูปธรรม
- การทดสอบใดๆ สำหรับความเสี่ยงของ MCP จะต้องปฏิบัติตามเงื่อนไขการใช้งานของบุคคลที่สามอย่างเคร่งครัด
ข้อมูลที่เป็นกรรมสิทธิ์ของ OpenAI
- ผลลัพธ์จากโมเดลที่แสดงข้อมูลอันเป็นกรรมสิทธิ์ซึ่งเกี่ยวข้องกับกระบวนการใช้เหตุผล
- ช่องโหว่ที่เปิดเผยข้อมูลที่เป็นกรรมสิทธิ์อื่นๆ ของ OpenAI
ความถูกต้องสมบูรณ์ของบัญชีและแพลตฟอร์ม
- ช่องโหว่ที่กระทบต่อความปลอดภัยของบัญชีและระบบแพลตฟอร์ม เช่น การหลบเลี่ยงระบบควบคุมการทำงานอัตโนมัติ การปลอมแปลงข้อมูลความน่าเชื่อถือของบัญชี การพยายามกลับมาใช้งานใหม่หลังจากถูกระงับหรือแบนบัญชี รวมถึงปัญหาในลักษณะเดียวกัน
- ประเด็นที่อนุญาตให้ผู้ใช้เข้าถึงคุณลักษณะ ข้อมูล หรือฟังก์ชันการทำงานที่เกินกว่าสิทธิ์ที่ได้รับอนุญาต ควรรายงานไปยังโปรแกรม Security Bug Bounty(เปิดในหน้าต่างใหม่)
แม้ว่าการทำ Jailbreak จะไม่อยู่ในขอบเขตของโปรแกรมนี้ แต่เรามีการดำเนินแคมเปญ Bug Bounty แบบส่วนตัวเป็นระยะ เพื่อตรวจหาอันตรายเฉพาะด้าน เช่น เนื้อหาที่เสี่ยงต่อภัยทางชีวภาพในระบบของ เอเจนต์ ChatGPT และ GPT‑5 เราขอเรียนเชิญนักวิจัยที่สนใจสมัครเข้าร่วมโปรแกรมเหล่านี้เมื่อมีการเปิดรับสมัครในโอกาสต่อไป
หากนักวิจัยตรวจพบข้อบกพร่องที่ส่งผลโดยตรงต่อการเกิดอันตรายแก่ผู้ใช้นอกเหนือจากหมวดหมู่ที่ระบุไว้ข้างต้น และมีขั้นตอนการแก้ไขที่ชัดเจนและนำไปปฏิบัติได้จริง เราอาจจะพิจารณาให้รางวัลเป็นกรณีๆ ไป การหลบเลี่ยงนโยบายเนื้อหาโดยทั่วไปที่ไม่มีผลกระทบด้านความปลอดภัยหรือการใช้งานในทางที่ผิดอย่างชัดเจน ถือว่าไม่อยู่ในขอบเขตของโปรแกรมนี้ ตัวอย่างเช่น “jailbreaks” ที่ทำให้โมเดลใช้ภาษาหยาบคายหรือส่งคืนข้อมูลที่ค้นหาได้ง่ายผ่านเครื่องมือค้นหา จะอยู่นอกขอบเขต
นักวิจัยที่สนใจเข้าร่วมสามารถสมัครได้ผ่าน โปรแกรม Safety Bug Bounty(เปิดในหน้าต่างใหม่) ของเรา เรามีความยินดีที่จะได้ร่วมงานกับเหล่านักวิจัย แฮกเกอร์ที่มีจริยธรรม และชุมชนด้านความปลอดภัยและความมั่นคง เพื่อเป้าหมายในการสร้างระบบนิเวศ AI ที่มีความมั่นคงปลอดภัยสำหรับทุกคน


