ยกระดับแหล่งที่มาของคอนเทนต์เพื่อระบบนิเวศ AI ที่ปลอดภัยและโปร่งใสมากขึ้น
ช่วยให้ผู้คนเข้าใจที่มาของคอนเทนต์ที่สร้างด้วย AI ผ่าน Content Credentials, SynthID และเครื่องมือตรวจสอบสาธารณะระยะแรก
ผู้คนใช้งานเครื่องมือของ OpenAI ทุกวันเพื่อสร้างและแก้ไขรูปภาพรวมถึงเสียง ซึ่งช่วยให้การสื่อสารมีความสร้างสรรค์ มีประโยชน์ และเข้าถึงได้ง่ายยิ่งขึ้น เมื่อเครื่องมือเหล่านี้เริ่มกลายมาเป็นส่วนหนึ่งของการสร้างสรรค์ การจินตนาการ และการแบ่งปันในชีวิตผู้คน การที่ทุกคนจะสามารถทำความเข้าใจและตรวจสอบที่มาของสื่อเหล่านั้นจึงเป็นเรื่องสำคัญ เพื่อให้สามารถตีความเนื้อหาได้อย่างมั่นใจยิ่งขึ้น สัญญาณระบุแหล่งที่มาสามารถช่วยเหลือในเรื่องนี้ได้ โดยการให้ข้อมูลบริบทแก่ผู้คนว่าเนื้อหานั้นมาจากไหน มีกระบวนการสร้างสรรค์หรือปรับแต่งอย่างไร และเป็นเนื้อหาที่ถูกต้องตรงตามที่ระบุไว้จริงหรือไม่
วันนี้เราพร้อมยกระดับระบบตรวจสอบที่มาของคอนเทนต์ให้แข็งแกร่งกว่าเดิม ด้วยโมเดลแบบองค์รวมที่ขับเคลื่อนทั้งระบบนิเวศเพื่อสร้างความปลอดภัย และร่วมสร้างโลกออนไลน์ที่น่าเชื่อถือและมั่นใจได้ในทุกคลิก เรากำลังปรับปรุงให้เครื่องมือและแพลตฟอร์มอื่นๆ สามารถตรวจจับสัญญาณระบุแหล่งที่มาของเราได้ง่ายขึ้นผ่านการรับรองมาตรฐาน C2PA พร้อมทั้งเพิ่มลายน้ำ SynthID แบบข้ามแพลตฟอร์มที่มีความทนทานสูงลงในรูปภาพผ่านความร่วมมือกับ Google และเปิดโอกาสให้ทุกคนได้ทดลองใช้งานเครื่องมือเวอร์ชันตัวอย่างสำหรับตรวจสอบว่ารูปภาพดังกล่าวมาจาก OpenAI ใช่หรือไม่
การอัปเดตทั้งหมดนี้เป็นการต่อยอดจากดำเนินงานก่อนหน้านี้ของเราเพื่อสนับสนุนมาตรฐานแบบเปิด ช่วยให้ผู้คนระบุเนื้อหาที่สร้างจาก OpenAI ได้ง่ายขึ้น และผสานความร่วมมือกับภาคอุตสาหกรรมในการขับเคลื่อนระบบนิเวศข้อมูลข่าวสารให้น่าเชื่อถือยิ่งขึ้น
OpenAI ได้มีส่วนร่วมในการพัฒนาและนำมาตรฐานการระบุแหล่งที่มาของเนื้อหามาใช้ตั้งแต่ปี 2567 โดยเริ่มต้นจากการเพิ่มใบรับรองเนื้อหาลงใน DALL·E 3(เปิดในหน้าต่างใหม่) และขยายผลไปยัง ImageGen(เปิดในหน้าต่างใหม่) กับ Sora(เปิดในหน้าต่างใหม่) ในเวลาต่อมา นอกจากนี้ เรายังได้เข้าร่วมเป็นคณะกรรมการบริหารของ Coalition for Content Provenance and Authenticity (C2PA) ซึ่งเป็นกลุ่มความร่วมมือระหว่างอุตสาหกรรมที่อยู่เบื้องหลังการกำหนดมาตรฐานทางเทคนิคแบบเปิดสำหรับการระบุแหล่งที่มาของเนื้อหา แนวทางทางเทคนิคของ C2PA ใช้ข้อมูลเมทาดาตาและการลงลายมือชื่อดิจิทัลเข้ารหัส เพื่อช่วยให้ข้อมูลเกี่ยวกับสื่อชิ้นนั้นๆ เดินทางไปพร้อมกับตัวเนื้อหาได้อย่างปลอดภัย ข้อมูลดังกล่าวประกอบด้วยบริบทที่เป็นประโยชน์ต่อผู้สื่อข่าวในการประเมินแหล่งข้อมูล ช่วยแพลตฟอร์มต่างๆ ในการตัดสินใจเกี่ยวกับความน่าเชื่อถือของเนื้อหา รวมถึงช่วยให้ผู้คนเข้าใจในสิ่งที่พวกเขากำลังรับชมบนโลกออนไลน์
เมื่อเร็วๆ นี้ เราได้ดำเนินการขั้นสำคัญในการยกระดับให้ OpenAI เป็นผลิตภัณฑ์ประเภทเครื่องมือสร้างสรรค์เนื้อหาที่มีความสอดคล้องตามมาตรฐาน C2PA (C2PA Conforming Generator Product)(เปิดในหน้าต่างใหม่) การปฏิบัติตามมาตรฐาน C2PA ดังกล่าว ช่วยให้เราสามารถมอบแนวทางที่น่าเชื่อถือแก่แพลตฟอร์มต่างๆ ในการอ่าน บันทึก และส่งต่อข้อมูลระบุแหล่งที่มาที่เราได้แนบไปกับเนื้อหาของเรา เรื่องนี้มีความสำคัญอย่างยิ่ง เพราะการตรวจสอบแหล่งที่มาจะประสบความสำเร็จได้ก็ต่อเมื่อข้อมูลนั้นยังคงอยู่ ไม่สูญหายไปหลังจากหลุดจากแพลตฟอร์มแรกที่สร้างเนื้อหาขึ้นมา ซึ่งการปฏิบัติตามข้อกำหนดมาตรฐานนี้ช่วยให้สิ่งนั้นเกิดขึ้นได้จริง
ข้อมูลเมทาดาตาของ C2PA ถือเป็นรากฐานที่สำคัญสำหรับระบบการระบุแหล่งที่มาของเนื้อหา ระบบดังกล่าวช่วยให้เนื้อหาบรรจุข้อมูลเกี่ยวกับแหล่งกำเนิด กระบวนการสร้างสรรค์หรือการแก้ไข ตลอดจนบุคคลหรือองค์กรผู้ลงนามรับรองความถูกต้องของข้อมูลนั้นๆ อย่างไรก็ตามข้อมูลเมทาดาตานั้นก็มิใช่ระบบที่ปราศจากข้อผิดพลาดโดยสิ้นเชิง ข้อมูลดังกล่าวอาจถูกลบทิ้ง สูญหายระหว่างกระบวนการอัปโหลดและดาวน์โหลด หรือถูกทำลายจากการปรับเปลี่ยนโครงสร้างไฟล์ เช่น การเปลี่ยนฟอร์แมตไฟล์ การปรับเปลี่ยนขนาด หรือการแคปภาพหน้าจอ
เพื่อช่วยให้ระบบการระบุแหล่งที่มามีความยืดหยุ่นและทนทานยิ่งขึ้น เราจึงเลือกใช้แนวทางแบบหลายชั้นและบูรณาการเทคโนโลยีการฝังลายน้ำผ่านระบบ SynthID ของ Google DeepMind(เปิดในหน้าต่างใหม่) โดยจะเริ่มต้นจากรูปภาพที่สร้างขึ้นผ่าน ChatGPT, Codex หรือ OpenAI API เทคโนโลยี SynthID จะทำการฝังชั้นลายน้ำที่มองไม่เห็นด้วยตาเปล่า ซึ่งทำหน้าที่ช่วยเสริมการทำงานของการระบุแหล่งที่มาซึ่งอิงข้อมูลเมทาดาตาของ C2PA
ราเตรียมความพร้อมเพื่อเป้าหมายนี้มามาระยะหนึ่งแล้ว เราเคยทดลองใช้ลายน้ำแบบมองเห็นได้ใน Sora และลายน้ำในไฟล์เสียงสำหรับ Voice Engine มาก่อนหน้านี้แล้ว อีกทั้งยังคงเดินหน้าทดสอบและวิจัยเพื่อพัฒนาความแม่นยำและความน่าเชื่อถือมาอย่างต่อเนื่อง ผ่านการนำไปใช้งานจริง
ระบบทั้งสองนี้ต่างทำหน้าที่ช่วยส่งเสริมและสนับสนุนกัน C2PA ช่วยให้เนื้อหามีข้อมูลบริบทติดไปด้วย ส่วน SynthID ช่วยคงสัญญาณไว้แม้ข้อมูลเมตาจะสูญหายไป ลายน้ำจะมีความทนทานและไม่สูญหายไปง่ายๆ แม้จะผ่านการดัดแปลงไฟล์อย่างการแคปหน้าจอ ในขณะที่ข้อมูลเมทาดาตาก็สามารถให้รายละเอียดและข้อมูลเชิงลึกได้มากกว่าการใช้ลายน้ำเพียงอย่างเดียว การบูรณาการเทคโนโลยีทั้งสองส่วนร่วมกัน ช่วยให้ระบบการระบุแหล่งที่มามีความยืดหยุ่นและทนทานมากกว่าการพึ่งพาเทคโนโลยีชั้นใดชั้นหนึ่งเพียงลำพัง
ข้อมูลเมทาดาตาที่เชื่อถือได้ร่วมกับลายน้ำที่มีคุณสมบัติทนทานต่อการดัดแปลงส่วนใหญ่ สามารถช่วยให้สัญญาณการระบุแหล่งที่มามีความเสถียรและยืดหยุ่นยิ่งขึ้น แต่ผู้คนก็ยังต้องการแนวทางหรือเครื่องมือในการตรวจจับสัญญาณเหล่านี้อยู่ดี ขณะนี้เรากำลังเปิดให้ทดลองใช้งานเครื่องมือตรวจสอบสำหรับสาธารณะ ซึ่งจะช่วยให้ผู้คนสามารถตรวจสอบได้ว่ารูปภาพที่อัปโหลดนั้นสร้างขึ้นจาก ChatGPT, OpenAI API หรือ Codex หรือไม่ โดยระบบจะทำการเช็กสัญญาณระบุแหล่งที่มา ซึ่งรวมถึง Content Credentials และ SynthID
เราเชื่อว่าการตรวจสอบและตีความแหล่งที่มาของเนื้อหาควรเป็นเรื่องที่ง่ายขึ้นสำหรับทุกคน และเครื่องมือของเราก็สามารถช่วยให้ผู้คนมีส่วนร่วมในการหาคำตอบสำหรับคำถามที่ว่า “นี่คือผลงานที่สร้างด้วย AI ใช่หรือไม่” โดยการรวมสัญญาณตรวจจับหลายๆ ด้านเข้าด้วยกัน การดำเนินงานนี้ต่อยอดมาจากองค์ความรู้ที่ได้รับช่วงเปิดทดสอบระบบตัวจำแนกเพื่อตรวจจับรูปภาพในขั้นต้นเมื่อ 2567 ซึ่งช่วยให้ผู้คนสามารถตรวจจับได้อย่างแม่นยำว่ามีลายน้ำ SynthID จาก OpenAI ฝังอยู่ในสื่อนั้นๆ หรือไม่ พร้อมทั้งช่วยแสดงข้อมูลเมทาดาตาของ C2PA ให้เห็นเมื่อระบบตรวจพบ

ไม่มีวิธีตรวจจับใดที่ป้องกันความผิดพลาดได้ทั้งหมด ดังนั้นเราจึงใช้แนวทางอย่างระมัดระวังในกรณีที่การตรวจจับล้มเหลว ตัวอย่างเช่น หากไม่ตรวจพบเมทาดาทาหรือลายน้ำ เครื่องมือจะไม่ด่วยสรุปว่าภาพนั้นสร้างด้วยเครื่องมือของ OpenAI หรือไม่ เนื่องจากในบางกรณีสัญญาณแหล่งที่มาอาจถูกลบออกได้
ในช่วงเปิดตัวเครื่องมือนี้จะรองรับการตรวจสอบเฉพาะเนื้อหาที่สร้างขึ้นโดย OpenAI เท่านั้น ในอีกไม่กี่เดือนข้างหน้า เราตั้งเป้าที่จะสนับสนุนความพยายามข้ามอุตสาหกรรมเพื่อทำให้การตรวจสอบเป็นไปได้ข้ามแพลตฟอร์ม ในอนาคตเราตั้งเป้าที่จะขยายขอบเขตให้รองรับเนื้อหาประเภทอื่นๆ ที่ผู้คนอาจพบเจอทางออนไลน์เพิ่มมากขึ้นด้วย
เทคนิคการตรวจสอบแหล่งที่มาเพียงรูปแบบเดียวยังไม่เพียงพอที่จะรับมือได้อย่างเบ็ดเสร็จ เราเชื่อว่าแนวทางที่มีประสิทธิภาพต้องเกิดจากการผสานรวมมาตรฐานร่วมกัน สัญญาณลายน้ำที่มีความทนทาน และระบบการตรวจสอบสำหรับสาธารณะเข้าด้วยกัน ด้วยการต่อยอดจากการสนับสนุนมาตรฐาน Content Credentials ที่เราทำมาอย่างยาวนาน การปรับใช้ระบบให้สอดคล้องตามเกณฑ์ C2PA การนำเทคโนโลยี SynthID เข้ามาใช้งาน ตลอดจนการเปิดทดสอบเครื่องมือตรวจสอบสำหรับสาธารณะ เราหวังว่าสิ่งเหล่านี้จะมีส่วนช่วยพัฒนาระบบนิเวศการตรวจสอบแหล่งที่มาให้สามารถทำงานร่วมกันได้อย่างราบรื่นในระยะยาว


