ตั้งแต่วันที่ 26 เมษายน 2569 เป็นต้นไป Sora ได้ยุติการให้บริการแล้ว
Sora 2 โมเดลเรือธงสำหรับการสร้างวิดีโอและเสียงของเราได้เปิดตัวแล้ววันนี้
โมเดล Sora รุ่นแรก ที่เริ่มต้นขึ้นในเดือนกุมภาพันธ์ 2567 เป็นเหมือนกับ GPT‑1 สำหรับวิดีโอ โดยเป็นครั้งแรกที่การสร้างวิดีโอเริ่มใช้งานได้จริง และมีพฤติกรรมพื้นฐานอย่างการจดจำวัตถุเกิดขึ้นจากการประมวลผลก่อนเทรน นับตั้งแต่นั้นมาทีมงาน Sora ก็ได้มุ่งเน้นการเทรนโมเดลให้มีศักยภาพในการจำลองโลกเสมือนที่ก้าวหน้ามากยิ่งขึ้น เราเชื่อว่าระบบเหล่านี้จะมีความสำคัญอย่างยิ่งต่อการเทรนโมเดล AI ให้เข้าใจโลกทางกายภาพอย่างลึกซึ้ง หนึ่งในความก้าวหน้าที่สำคัญคือการพัฒนาความเชี่ยวชาญในการเทรนก่อนและหลังการเทรนด้วยข้อมูลวิดีโอขนาดใหญ่ ซึ่งยังถือว่าเป็นเรื่องใหม่มากเมื่อเทียบกับการประมวลผลภาษา
Prompt: figure skater performs a triple axle with a cat on her head
Sora 2 กำลังพาเราก้าวเข้าสู่จุดเปลี่ยนสำคัญของการสร้างวิดีโอที่เหมือนกับ GPT‑3.5 ในโลกของภาษา Sora 2 สามารถสร้างวีดีโอที่โมเดลวิดีโอรุ่นก่อนๆ ทำได้ยากมาก หรือบางอย่างแทบจะทำไม่ได้เลย เช่น วีดีโอการแสดงท่ายิมนาสติกระดับโอลิมปิก การตีลังกากลับหลังบนแพดเดิลบอร์ดที่จำลองแรงลอยตัวและความแข็งแรงอย่างสมจริง และการกระโดดหมุนสามรอบในขณะที่มีแมวเกาะอยู่แน่น
Prompt: a guy does a backflip
โมเดลวิดีโอรุ่นก่อนมักจะสร้างวีดีโอออกมาไม่สมจริง โดยวัตถุจะบิดเบี้ยวและความสมจริงดูผิดเพี้ยน เนื่องจากพยายามทำตามคำสั่งข้อความจนเกินไป ตัวอย่างเช่น หากนักบาสเกตบอลยิงพลาดเป้า ลูกบาสอาจวาร์ปไปที่ห่วงเองทันที ใน Sora 2 หากผู้เล่นบาสเก็ตบอลยิงพลาด ลูกบาสเก็ตบอลจะกระดอนออกจากแป้นหลัง ที่น่าสนใจก็คือ “ข้อผิดพลาด” ที่โมเดลทำขึ้นบ่อยครั้งดูเหมือนจะเป็นข้อผิดพลาดของเอเจนต์ภายในที่ Sora 2 จำลองขึ้นมา แม้ว่าจะยังออกมาไม่สมบูรณ์แบบ แต่ก็ดูสมจริงตามกฎฟิสิกส์มากกว่าระบบรุ่นก่อนๆ สำหรับระบบจำลองโลกเสมือนที่เป็นประโยชน์นั้น สิ่งที่สำคัญมากๆ ไม่ใช่แค่การจำลองความสำเร็จ แต่ต้องสมารถจำลองความล้มเหลวออกมาได้ด้วย
โมเดลนี้ยังเป็นก้าวกระโดดครั้งใหญ่ในด้านการควบคุมที่สามารถปฏิบัติตามคำสั่งที่ละเอียดซับซ้อนในหลายๆ ช็อตได้ ในขณะที่ยังคงรักษาความสมจริงได้อย่างแม่นยำ ไม่ว่าจะเป็นสไตล์สมจริง ภาพยนตร์ หรืออนิเมะก็ทำได้
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
ในฐานะระบบสร้างวิดีโอและเสียงสำหรับการใช้งานทั่วไป โมเดลนี้สามารถสร้างเสียงพื้นหลัง เสียงพูด และเอฟเฟกต์เสียงที่ซับซ้อนได้อย่างสมจริง
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
คุณยังสามารถนำองค์ประกอบจากโลกจริงใส่เข้าไปใน Sora 2 ได้โดยตรง ตัวอย่างเช่น เมื่อโมเดลดูวิดีโอของเพื่อนร่วมงานเรา มันสามารถใส่บุคคลนั้นเข้าไปในโลกที่ Sora สร้างขึ้น พร้อมจำลองรูปลักษณ์และเสียงออกมาได้อย่างแม่นยำ ความสามารถนี้เป็นความสามารถทั่วไป และสามารถนำใช้ได้กับมนุษย์ สัตว์ หรือวัตถุก็ได้
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
โมเดลนี้ยังห่างไกลจากความสมบูรณ์และมีข้อผิดพลาดมากมาย แต่ก็พิสูจน์ได้ว่าการเพิ่มขนาดเครือข่ายประสาทเทียมด้วยข้อมูลวิดีโอจะช่วยให้เราเข้าใกล้การจำลองความจริงมากขึ้นเรื่อยๆ
บนเส้นทางสู่การพัฒนาระบบจำลองและ AI อเนกประสงค์ที่สามารถใช้งานได้ในโลกจริง เรามีความเชื่อว่าผู้คนจะได้รับความสนุกสนานจากการใช้โมเดลที่เราสร้างขึ้นระหว่างทาง
ทีมงาน Sora ได้ลองล่นฟีเจอร์ ‘อัปโหลดตัวเอง’ ครั้งแรกเมื่อหลายเดือนก่อน และทุกคนก็รู้สึกว่ามันสนุกสุดๆ มันให้ความรู้สึกเหมือนเป็นวิวัฒนาการตามธรรมชาติของการสื่อสาร ตั้งแต่ข้อความ อิโมจิ การบันทึกเสียง และสุดท้ายก็มาถึงสิ่งนี้
วันนี้เรากำลังเปิดตัว แอปโซเชียล iOS ใหม่ที่ชื่อว่า “Sora” ซึ่งขับเคลื่อนโดย Sora 2 ภายในแอปนี้ คุณสามารถสร้างรีมิกซ์ผลงานของกันและกัน ค้นพบวิดีโอใหม่ในฟีด Sora ที่ปรับแต่งได้ และนำตัวคุณเองหรือเพื่อนๆ เข้ามาผ่านฟีเจอร์ที่เรียกว่า “คาแรคเตอร์” เมื่อใช้คาแรคเตอร์ คุณสามารถใส่ตัวเองเข้าไปในฉากใดก็ได้ของ Sora ได้อย่างสมจริงอย่างน่าทึ่ง หลังจากบันทึกวิดีโอและเสียงสั้นๆ เพียงครั้งเดียวในแอปเพื่อยืนยันตัวตนและบันทึกรูปลักษณ์ของคุณ
เมื่อสัปดาห์ที่แล้ว เราได้เปิดตัวแอปนี้ภายในให้กับทุกคนใน OpenAI เราเริ่มได้ยินจากเพื่อนร่วมงานว่า ฟีเจอร์นี้ช่วยให้พวกเขาได้รู้จักและเจอเพื่อนใหม่ๆ ในบริษัท เราเชื่อว่าแอปโซเชียลที่มีฟีเจอร์ “คาแรคเตอร์” เป็นจุดเด่น คือวิธีที่ดีที่สุดในการสัมผัสความมหัศจรรย์ของ Sora 2
ความกังวลเรื่องการไถหน้าจอไม่หยุด การติดจอมือถือ การปลีกตัวออกจากคนอื่น และฟีดที่ออกแบบให้ผู้ใช้ติดจอเป็นประเด็นที่เราไม่ได้มองข้ามและเราได้ดำเนินการแก้ไขปัญหาเหล่านี้
เรามอบเครื่องมือและทางเลือกให้แก่ผู้ใช้ ควบคุมสิ่งที่พวกเขาเห็นในฟีด เรานำโมเดลภาษาขนาดใหญ่ของ OpenAI มาสร้างอัลกอริทึมแนะนำรูปแบบใหม่ ที่ผู้ใช้สามารถสั่งงานได้ด้วยการใช้ภาษาธรรมชาติ นอกจากนี้เรายังได้พัฒนากลไกภายในที่คอยสอบถามสุขภาวะของผู้ใช้อย่างต่อเนื่อง พร้อมเปิดโอกาสให้ผู้ใช้ปรับฟีดได้ตามใจชอบ
ระบบจะแสดงเนื้อหาจากคนที่คุณติดตามหรือสื่อสารด้วยเป็นหลักตามค่าเริ่มต้น และและจัดลำดับความสำคัญของวิดีโอที่โมเดลคิดว่าคุณสามารถใช้เป็นแรงบันดาลใจในการสร้างสรรค์ผลงานของคุณได้ เราไม่ได้ออกแบบเพื่อให้ผู้ใช้ใช้เวลาอยู่ในฟีดมากขึ้น แต่เราตั้งใจสร้างแอปเพื่อเน้นการสร้างสรรค์ ไม่ใช่เพื่อการเสพเนื้อหา คุณสามารถดูรายละเอียดเพิ่มเติมได้ใน แนวคิดการออกแบบฟีดของเรา
แอปนี้ ออกแบบมาเพื่อการใช้งานร่วมกับเพื่อน เสียงตอบรับอย่างท่วมท้นจากผู้ทดสอบคือ คาแรคเตอร์เป็นสิ่งที่ทำให้การใช้งานรู้สึกแตกต่างและสนุก คุณต้องลองเองถึงจะเข้าใจจริงๆ แต่นี่คือวิธีการสื่อสารกับผู้คนรูปแบบใหม่ที่ไม่เหมือนใคร เราเปิดให้ใช้งานแอปนี้แบบเชิญเท่านั้น เพื่อให้คุณเข้ามาใช้งานพร้อมกับเพื่อนๆ ของคุณ ในขณะที่แพลตฟอร์มใหญ่ๆ กำลังถอยห่างจากการใช้โครงข่ายสังคม เราเชื่อว่าคาแรคเตอร์จะช่วยเสริมสร้างความเป็นชุมชนได้
การดูแลสุขภาวะที่ดีของวัยรุ่น เป็นสิ่งสำคัญสำหรับพวกเรา เรากำลังกำหนดขีดจำกัดตามค่าเริ่มต้นสำหรับจำนวนเนื้อหาที่วัยรุ่นสามารถเห็นในฟีดต่อวัน และกำลังทยอยเปิดใช้งานการตั้งค่าการอนุญาตที่เข้มงวดขึ้นสำหรับตัวละครในกลุ่มนี้ นอกเหนือจากระบบความปลอดภัยอัตโนมัติของเราแล้ว เรายังได้ขยายทีมผู้ตรวจสอบที่คอยดูแลและจัดการกับกรณีที่มีการกลั่นแกล้งเกิดขึ้นได้อย่างทันท่วงที เรากำลังเปิดตัวฟีเจอร์ การควบคุมโดยผู้ปกครอง ของ Sora ผ่านทาง ChatGPT เพื่อให้ผู้ปกครองสามารถควบคุมการเลื่อนหน้าจอไม่เลิก ปิดการปรับแต่งด้วยอัลกอริทึม และจัดการการตั้งค่าข้อความโดยตรง
เมื่อใช้คาแรคเตอร์ คุณสามารถควบคุมรูปลักษณ์และตัวตนของคุณได้อย่างสมบูรณ์ ผ่าน Sora คุณเท่านั้นที่สามารถตัดสินใจได้ว่าใครจะใช้คาแรคเตอร์ของคุณ และคุณสามารถเพิกถอนสิทธิ์หรือจะลบวิดีโอที่มีคาแรคเตอร์นั้นได้ทุกเมื่อ คุณสามารถดูวิดีโอที่มีคาแรคเตอร์ของคุณ รวมถึงฉบับร่างที่สร้างโดยผู้อื่น ได้ทุกเมื่อ
เราใส่ใจประเด็นความปลอดภัยหลายอย่างในแอปนี้ ไม่ว่าจะเป็นการขอความยินยอมเกี่ยวกับการใช้ภาพลักษณ์ การตรวจสอบแหล่งที่มา หรือการป้องกันคอนเทนต์ที่เป็นอันตราย และอีกหลายเรื่อง ดู เอกสารความปลอดภัย Sora 2 สำหรับรายละเอียดเพิ่มเติม
ปัญหามากมายของแอปอื่นๆ เกิดจากโมเดลการสร้างรายได้ที่เน้นผลักดันการตัดสินใจโดยสวนทางกับความปลอดภัยและความสบายใจของผู้ใช้ เพื่อแสดงความโปร่งใส่ แผนที่เรามีตอนนี้คือจะเปิดโอกาสให้ผู้ใช้ชำระเงินสำบางส่วนหรับการสร้างวิดีโอเพิ่มเติม หากมีความต้องการใช้งานมากจนเกินกำลังประมวลผลของระบบ ในระหว่างที่แอปมีการพัฒนาไปเรื่อยๆ เราจะสื่อสารทุกการเปลี่ยนแปลงอย่างโปร่งใส โดยยังคงให้ความสำคัญกับความเป็นอยู่ที่ดีของผู้ใช้เป็นอันดับแรก
นี่คือจุดเริ่มต้นของการเดินทาง แต่ด้วยเครื่องมืออันทรงพลังในการสร้างสรรค์และรีมิกซ์คอนเทนต์จาก Sora 2 เรามองว่านี่คือการเปิดประตูสู่ยุคใหม่ของการสร้างประสบการณ์ร่วมกัน เรามีความเชื่อมั่นว่านี่จะเป็นแพลตฟอร์มที่ดีต่อสุขภาวะ ที่สามารถสนับสนุนความบันเทิงและความสร้างสรรค์ได้ดีกว่าแพลตฟอร์มที่มีอยู่ในปัจจุบัน เราหวังว่าคุณจะเพลิดเพลินไปกับทุกช่วงเวลา :)
แอป Sora บน iOS(เปิดในหน้าต่างใหม่) พร้อมให้ดาวน์โหลดแล้ววันนี้ คุณสามารถลงทะเบียนในแอปเพื่อรับการแจ้งเตือนทันทีเมื่อบัญชีของคุณพร้อมใช้งาน วันนี้เราเริ่มการเปิดตัวครั้งแรกใน สหรัฐอเมริกาและแคนาดา โดยมีความตั้งใจที่จะขยายไปยังประเทศอื่นๆ ในเร็วๆ นี้ หลังจากที่ได้รับคำเชิญแล้ว คุณจะสามารถเข้าถึง Sora 2 ได้ผ่านทาง sora.com(เปิดในหน้าต่างใหม่) ในช่วงแรก Sora 2 จะเปิดให้ใช้งานฟรี โดยเปิดกว้างให้ผู้ใช้ทดลองและสำรวจศักยภาพได้อย่างเต็มที่ แม้จะยังมีข้อจำกัดจากทรัพยากรการประมวลผลอยู่ ผู้ใช้ ChatGPT Pro จะสามารถใช้โมเดล Sora 2 Pro ที่มีคุณภาพสูงขึ้นซึ่งอยู่ในขั้นทดลองผ่าน sora.com(เปิดในหน้าต่างใหม่) (และในแอป Sora ในอีกไม่ช้า) เรายังจะเปิดตัว Sora 2 ใน API ด้วย Sora 1 Turbo จะยังคงพร้อมใช้งาน และสิ่งคุณสร้างไว้จะถูกเก็บไว้ในคลัง sora.com(เปิดในหน้าต่างใหม่) ของคุณ
โมเดลวิดีโอกำลังพัฒนาไปในทิศทางที่ดีขึ้นอย่างรวดเร็ว เครื่องมือจำลองโลกเสมือนและหุ่นยนต์ันทแวตที่ใช้งานได้ทั่วไปจะสร้างการเปลี่ยนแปลงเชิงโครงสร้างต่อสังคม และเร่งความก้าวหน้าของมนุษยชาติ Sora 2 ถือเป็นความก้าวหน้าครั้งสำคัญในการบรรลุเป้าหมายนั้น เป้าหมายของ OpenAI คือการทำให้มนุษยชาติได้รับประโยชน์จากโมเดลเหล่านี้ตลอดช่วงเวลาการพัฒนา เราเชื่อว่า Sora จะสร้างความสุข จุดประกายความคิดสร้างสรรค์ และเชื่อมโยงผู้คนทั่วโลกเข้าด้วยกัน
— เขียนโดยทีมงาน Sora
เป้าหมายหลักและภาพที่ต้องการสื่อ
ฉากแรก: มังกรบินเฉียดยอดน้ำแข็งแหลมคม ปลายปีกก่อเกลียวลมพัดเอาเศษละอองน้ำแข็งฟุ้งกระจาย ฉากที่สอง: แผ่นน้ำแข็งที่แตกร่วงลงสู่อ่าวคดคู้สีน้ำเงินเข้ม แสงอาทิตย์สีอำพันสะท้อนแสงบนน้ำแข็งที่เกาะอยู่บนเกล็ดมังกร โทนความรู้สึก: ความสงบเย็นของนักล่า / พลังที่ไร้ขอบเขต
ฟอร์แมตและรูปลักษณ์
วิดีโอความยาว 5.0 วินาที ความละเอียด 4K ใช้ชัตเตอร์ 180° เลียนแบบการทำงานของเซ็นเซอร์ดิจิทัลขนาดใหญ่ที่ให้ไมโครคอนทราสต์คมกริบ เกรนละเอียดสูง ประกายหิมะมีแสงกระจายเล็กน้อย และเฟรมคงที่ไร้การสั่นไหว
เลนส์และฟิลเตอร์
เลนส์หลัก 50 มม. แบบทรงกลม ติดตั้งบนแพลตฟอร์มถ่ายภาพทางอากาศบริเวณจมูกเครื่อง พร้อมระบบกันสั่น ใช้การติดตามแบบขนานที่มีการโค้งเข้าด้านในเล็กน้อย ฟิลเตอร์ภาพ: ใช้ Black Pro-Mist 1/8 ร่วมกับโพลาไรเซอร์วงกลม ปรับแสงเพื่อทำให้แสงสะท้อนจากหิมะนุ่มลง แต่ยังคงประกายแสงสะท้อนเฉพาะจุด
เกรดสี / พาเลตต์
แสงไฮไลท์ขาวสะอาดดุจน้ำแข็งพร้อมไล่โทนเย็น มิดโทนเป็นธารน้ำแข็งสีน้ำเงินเข้มและอากาศมีสีฟ้าอ่อน ร่องเงาลึกมีสีเทาและเขียวอมฟ้าที่เผยให้เห็นรอยแยกธารน้ำแข็ง ขอบร่างมังกรเปล่งประกายด้วยแสงอำพันอบอุ่น และมีประกายแสงเฉพาะจุดที่คมชัดบนหิมะและเกล็ดมังกร
แสงและบรรยากาศ
แสงอาทิตย์บ่ายคล้อยส่องแสงตัดกัน ลมเย็นจากภูเขาพัดละอองหิมะลอยฟุ้ง มีหมอกเยือกแข็งบางๆ ที่สร้างมิติความลุ่มลึกให้ภาพ ละอองน้ำแข็งปลิวขึ้นเป็นระยะตามหลังมังกร พร้อมเห็นไอจางๆ จากการหายใจของมังกร
ตำแหน่งและการจัดภาพ
ทุ่งน้ำแข็งสูงเสียดฟ้าและสันเขาแหลมคมที่สลับกันไปมา กล้องเคลื่อนตามความเร็วเดียวกับมังกรที่ความสูงระดับกลาง เส้นธารน้ำแข็งทแยงนำสายตาสู่อ่าวลึก ส่วนหน้าภาพมีครีบน้ำแข็งลอยผ่านใกล้ๆ เพื่อสร้างมิติและระยะลึก และฉากปราศจากสิ่งปลูกสร้างของมนุษย์
เครื่องแต่งกาย / อุปกรณ์ประกอบฉาก / ยานพาหนะ
ไม่มี (สิ่งมีชีวิต) ลักษณะพื้นผิว: สันเขาเขาด้านนอกเป็นผิวด้าน เกล็ดกึ่งสะท้อนแสงมีน้ำแข็งละเอียดเกาะตามขอบ
เสียง
ลมสูงพัดแรง เสียงกระพือปีกมังกรแต่ละครั้งดังกึกก้อง เสียงน้ำแข็งแตกกระทบจากยอดน้ำแข็ง เสียงธารน้ำแข็งถล่มจากระยะไกล เสียงมังกรผ่อนลมหายใจพร้อมกับเสียงคำรามสั้นๆ (ไม่เกิน 1 วินาที) ไม่มีดนตรีประกอบ ใช้เสียงตามจริงที่สร้างความตื่นตะลึง
รายการช็อตที่ปรับให้เหมาะสม (1 ช็อต / 5.0 วินาที)
0.0–5.0 “การโค้งขนานตามสันเขา” (50 มม. ติดกล้องทางอากาศด้านหน้า เคลื่อนตามแนวโค้งเข้าด้านในเล็กน้อย พร้อมการดันภาพเล็กน้อย)
บินเคียงข้างมังกรที่กำลังลอดผ่านเส้นทางเสาน้ำแข็งสูงตระหง่าน ปลายปีกมังกรกวาดพาละอองหิมะฟุ้งเป็นริ้ว เศษธารน้ำแข็งแตกหล่นลงสู่เบื้องล่าง ทำให้ละอองน้ำแข็งลอยตัวขึ้น กล้องค่อยๆ เคลื่อนเข้าใกล้มังกร เผยเกล็ดที่ชัดเจนและขอบร่างอำพันที่ส่องประกาย ก่อนที่มังกรจะบินโค้งตัวสู่อ่าว ในขณะที่หางกวัดแกว่งทอดเงากว้างเหนือธารน้ำแข็ง
จุดประสงค์: ถ่ายทอดความยิ่งใหญ่ระดับตำนานด้วยความสมจริงที่สัมผัสได้ในหนึ่งเดียว ทั้งความเร็ว ความหนักแน่น และความเย็นเยือก
หมายเหตุกล้อง(ทำไมภาพถึงคมชัด)
เลนส์ 50 มิลลิเมตรทำให้ทั้งมังกรและภูมิทัศน์ดูสมดุล การเคลื่อนกล้องตามแนวขนานพร้อมโค้งเข้าด้านในช่วยสื่อถึงความเร็วและรูปทรงถูกเน้นด้วยการดันภาพที่ตรงจังหวะกับการกระพือปีก ฟิลเตอร์ช่วยลดแสงสะท้อนแต่ยังคงประกายระยิบระยับ แสงอาทิตย์ที่สองจากด้านหลังช่วยสร้างเงาร่าง โดยมีครีบน้ำแข็งเฉียดเข้าใกล้กล้องเพื่อสร้างมิติความเร็วให้สมจริง
การตกแต่ง
เกรนละเอียดมาก (~15%) หิมะมีแสงฟุ้งเพียงเล็กน้อย มีการจำลองการพิมพ์อย่างนุ่มนวลเพื่อให้สีน้ำเงินดูสมจริงและสีดำดูเข้มข้น เสียงกระพือปีกดังชัดเจนโดยไม่กลบเสียงธารน้ำแข็งแตก ภาพโปสเตอร์เป็นมังกรโค้งตัวเหนือเสาน้ำแข็งที่สะท้อนแสงอาทิตย์ ละอองหิมะฟุ้ง อ่าวลึกคุดคู้ด้านหลังมีสีน้ำเงินเข้ม
Sora 2
Debbie Mesloh
Caroline Zhao
เผยแพร่เมื่อวันที่ 30 กันยายน MMXXV


