ขอแนะนำ 4o Image Generation
การปลดล็อกการสร้างภาพที่มีประโยชน์และมีคุณค่าด้วยโมเดลประมวลผลข้อมูลหลากหลายรูปแบบที่สามารถให้เอาต์พุตที่แม่นยำ ถูกต้อง และเหมือนจริง
ที่ OpenAI เราเชื่อมาอย่างยาวนานว่าการสร้างภาพควรเป็นความสามารถหลักของโมเดลภาษาของเรา นั่นเป็นเหตุผลที่เราได้สร้างตัวสร้างภาพที่ล้ำหน้าที่สุดของเราใน GPT‑4o ผลลัพธ์คือการสร้างภาพที่ไม่เพียงแต่สวยงาม แต่ยังมีประโยชน์อีกด้วย
ตั้งแต่ภาพวาดในถ้ำยุคแรกจนถึงอินโฟกราฟิกสมัยใหม่ มนุษย์ได้ใช้ภาพเพื่อสื่อสาร โน้มน้าวใจ และวิเคราะห์ ไม่ใช่แค่เพื่อตกแต่งเท่านั้น โมเดลการสร้างในปัจจุบันสามารถสร้างฉากที่เหนือจริงและน่าทึ่งได้ แต่ยังคงมีปัญหากับภาพที่ใช้ในการแบ่งปันและสร้างข้อมูล ตั้งแต่โลโก้ไปจนถึงแผนภาพ ภาพสามารถสื่อความหมายที่ชัดเจนได้เมื่อเสริมด้วยสัญลักษณ์ที่อ้างอิงถึงภาษาและประสบการณ์ร่วมกัน
การสร้างภาพ GPT‑4o มีความเป็นเลิศในการแสดงข้อความอย่างแม่นยํา ทําตามคำสั่งอย่างแม่นยํา และใช้ประโยชน์จากความรู้และบริบทการแชตโดยธรรมชาติของ 4o รวมถึงการแปลงภาพที่อัปโหลดหรือใช้เป็นแรงบันดาลใจทางภาพ ความสามารถเหล่านี้ทำให้ง่ายต่อการสร้างภาพที่คุณจินตนาการไว้ ช่วยให้คุณสื่อสารได้อย่างมีประสิทธิผลมากขึ้นผ่านภาพ และพัฒนาการสร้างภาพให้กลายเป็นเครื่องมือที่ใช้งานได้จริงด้วยความแม่นยำและความทรงพลัง
เราได้ฝึกโมเดลของเราบนการแจกแจงร่วมของภาพและข้อความออนไลน์ โดยเรียนรู้ไม่เพียงแค่ว่าภาพเกี่ยวข้องกับภาษาอย่างไร แต่ยังรวมถึงความสัมพันธ์ระหว่างภาพด้วย เมื่อรวมกับการฝึกสอนหลังการใช้งานที่เข้มข้น โมเดลที่ได้จะมีความสามารถในการสร้างภาพที่น่าประหลาดใจ ที่สามารถสร้างภาพที่มีประโยชน์ สอดคล้อง และเข้าใจบริบท
ภาพหนึ่งภาพสามารถอธิบายแทนคำพูดได้นับพันคำ แต่บางครั้งการใส่คำเพียงไม่กี่คำในตำแหน่งที่เหมาะสมก็สามารถถ่ายทอดความหมายของภาพนั้นได้มากขึ้น ความสามารถของ 4o ในการผสมผสานสัญลักษณ์ที่แม่นยำกับภาพทำให้การสร้างภาพกลายเป็นเครื่องมือสำหรับการสื่อสารด้วยภาพ
เนื่องจากการสร้างภาพเป็นแบบ GPT‑4o คุณจึงสามารถปรับแต่งภาพผ่านการสนทนาที่เป็นธรรมชาติได้ GPT‑4o สามารถสร้างจากรูปภาพและข้อความในบริบทการแชต เพื่อให้แน่ใจว่ามีความสอดคล้องกันตลอด ตัวอย่างเช่น หากคุณกำลังออกแบบตัวละครในวิดีโอเกม ลักษณะของตัวละครจะยังคงมีความสอดคล้องกันแม้จะทำซ้ำหลายครั้งในขณะที่คุณปรับแต่งและทดลอง
การสร้างภาพของ GPT‑4o ปฏิบัติตามคำสั่งที่ละเอียดด้วยความใส่ใจในรายละเอียด ในขณะที่ระบบอื่นๆ ประสบปัญหากับวัตถุประมาณ 5-8 ชิ้น GPT‑4o สามารถจัดการวัตถุที่แตกต่างกันได้มากถึง 10-20 ชิ้น การผูกวัตถุเข้ากับลักษณะและความสัมพันธ์ได้อย่างแน่นแฟ้นยิ่งขึ้นช่วยให้ควบคุมได้ดีขึ้น
GPT‑4o สามารถวิเคราะห์และเรียนรู้จากภาพที่ผู้ใช้อัปโหลด โดยผสานรวมรายละเอียดเข้ากับบริบทได้อย่างราบรื่นเพื่อใช้ในการสร้างภาพ
การสร้างภาพเนทีฟทำให้ 4o สามารถเชื่อมโยงความรู้ระหว่างข้อความกับรูปภาพได้ ส่งผลให้โมเดลดูฉลาดและมีประสิทธิภาพมากขึ้น
การฝึกอบรมเกี่ยวกับภาพที่สะท้อนถึงรูปแบบภาพที่หลากหลาย ช่วยให้โมเดลสามารถสร้างหรือแปลงโฉมภาพได้อย่างน่าเชื่อถือ
โมเดลของเรายังไม่สมบูรณ์แบบ พวกเราตระหนักถึงข้อจำกัดหลายประการในขณะนี้ ซึ่งพวกเราจะดำเนินการแก้ไขผ่านการปรับปรุงโมเดลหลังจากการเปิดตัวครั้งแรก

เราได้สังเกตว่า GPT‑4o อาจครอบตัดภาพที่ยาวขึ้น เช่น โปสเตอร์ แน่นเกินไปในบางครั้ง โดยเฉพาะบริเวณด้านล่าง
เรามุ่งเป้าที่จะเพิ่มอิสระในการสร้างสรรค์ให้ถึงขีดสูงสุดในลักษณะที่สอดคล้องกับข้อมูลจำเพาะของโมเดลของเรา โดยสนับสนุนกรณีการใช้งานที่มีคุณค่า เช่น การพัฒนาเกม การสำรวจประวัติศาสตร์ และการศึกษา ไปพร้อมกับยังคงรักษามาตรฐานความปลอดภัยที่เข้มงวด ในขณะเดียวกัน การบล็อกคำขอที่ละเมิดมาตรฐานเหล่านั้นยังคงมีความสำคัญเช่นเดิม ด้านล่างนี้คือการประเมินด้านที่เสี่ยงเพิ่มเติม ซึ่งเรากำลังดำเนินการเพื่อเปิดการใช้งานเนื้อหาที่ปลอดภัยและมีประโยชน์สูง และสนับสนุนการแสดงออกทางความคิดสร้างสรรค์ในวงกว้างสำหรับผู้ใช้
แหล่งที่มาผ่าน C2PA และการค้นหาแบบย้อนกลับภายใน
ภาพที่สร้างขึ้นทั้งหมดมาพร้อมกับข้อมูลเมตาดาต้า C2PA ซึ่งจะระบุว่าภาพมาจาก GPT‑4o เพื่อให้เกิดความโปร่งใส นอกจากนี้ เราได้พัฒนาเครื่องมือค้นหาภายในที่ใช้คุณลักษณะทางเทคนิคของการสร้างสรรค์เพื่อช่วยตรวจสอบว่าเนื้อหามาจากโมเดลของเราหรือไม่
การบล็อกสิ่งที่ไม่ดี
เรายังคงบล็อกคำขอภาพที่สร้างขึ้นต่อไป ซึ่งอาจละเมิดนโยบายเนื้อหาของเรา เช่น สื่อเกี่ยวกับการล่วงละเมิดทางเพศเด็กและดีปเฟคลามกอนาจารทางเพศ ในกรณีที่มีภาพของคนจริงอยู่ในบริบท เราได้เพิ่มข้อจำกัดที่เข้มงวดมากขึ้นเกี่ยวกับประเภทของภาพที่สามารถสร้างได้ โดยมีมาตรการป้องกันที่เข้มงวดเป็นพิเศษในเรื่องภาพเปลือยและความรุนแรงทางกราฟิก เช่นเดียวกับการเปิดตัวใดๆ ความปลอดภัยไม่เคยเสร็จสิ้นและเป็นการลงทุนที่ต่อเนื่อง เมื่อเราได้เรียนรู้เพิ่มเติมเกี่ยวกับการใช้งานจริงของโมเดลนี้ เราจะปรับนโยบายของเราให้เหมาะสม
หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับแนวทางของเรา โปรดไปที่ภาคผนวกการสร้างภาพในการ์ดระบบ GPT‑4o
การใช้เหตุผลเพื่อเพิ่มความปลอดภัย
คล้ายกับงานการกำหนดแนวการทำงานที่รอบคอบของเรา เราได้ฝึก LLM ด้านการใช้เหตุผลให้ทำงานโดยตรงจากข้อกำหนดด้านความปลอดภัยที่เขียนโดยมนุษย์และสามารถตีความได้ เราใช้ LLM ที่ให้เหตุผลนี้ในระหว่างการพัฒนาเพื่อช่วยให้เราระบุและจัดการกับความคลุมเครือในนโยบายของเรา สิ่งนี้พร้อมด้วยความก้าวหน้าหลายโหมดและเทคนิคความปลอดภัยที่มีอยู่และได้รับการพัฒนาสำหรับ ChatGPT และ Sora ช่วยให้เราสามารถควบคุมดูแลทั้งข้อความอินพุตและรูปภาพเอาต์พุตให้เป็นไปตามนโยบายของเราได้
การสร้างภาพ 4o เริ่มเปิดตัวตั้งแต่วันนี้สำหรับผู้ใช้ Plus, Pro, Team และ Free โดยเป็นตัวสร้างภาพเริ่มต้นใน ChatGPT และจะเปิดให้ใช้งานใน Enterprise และ Edu ได้ในเร็วๆ นี้ นอกจากนี้ ยังมีให้ใช้ใน Sora สำหรับผู้ที่ชื่นชอบ DALL·E เป็นพิเศษ ก็ยังเข้าถึงได้ผ่าน DALL·E GPT โดยเฉพาะ
นักพัฒนาจะสามารถสร้างภาพด้วย GPT‑4o ผ่าน API ได้ในไม่ช้า โดยจะเริ่มเปิดตัวให้เข้าใช้งานได้ในอีกไม่กี่สัปดาห์ข้างหน้า
การสร้างและปรับแต่งภาพนั้นง่ายดายเหมือนกับการแชตโดยใช้ GPT‑4o เพียงแค่อธิบายสิ่งที่คุณต้องการ รวมถึงข้อมูลเฉพาะต่างๆ เช่น อัตราส่วนภาพ สีที่แน่นอนโดยใช้รหัสเลขฐานสิบหก หรือพื้นหลังที่โปร่งใส เนื่องจากโมเดลนี้สร้างภาพที่มีรายละเอียดมากขึ้น จึงใช้เวลาในการแสดงผลภาพนานขึ้น โดยมักจะใช้เวลาถึงหนึ่งนาที
ผู้เขียน
ภาวะผู้นำ
Gabriel Goh: การสร้างภาพ
Jackie Shannon: ผลิตภัณฑ์ ChatGPT
Mengchao Zhong, Wayne Chang: วิศวกรรม ChatGPT
Rohan Sahai: ผลิตภัณฑ์และวิศวกรรม Sora
Brendan Quinn, Tomer Kaftan: การอนุมาน
Prafulla Dhariwal: องค์กรแบบมัลติโหมด
การวิจัย
การวิจัยพื้นฐาน
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
การวิจัยหลัก
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
ผู้มีส่วนร่วมในการวิจัย
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
พฤติกรรมของโมเดล
Laurentia Romaniuk
องค์กรแบบมัลติโหมด
Andrew Gibiansky, Yang Lu
ข้อมูล
ผู้นำฝ่ายข้อมูล
Gildas Chabot, James Park Lennon
ข้อมูล
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
ผู้ดูแล
Hazel Byrne, Jennifer Luckenbill, Mariano López
ที่ปรึกษาด้านข้อมูลมนุษย์
Long Ouyang
การขยายผล
ลีดจากการอนุมาน
Brendan Quinn, Tomer Kaftan
การอนุมาน
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
ประยุกต์
ผู้นำฝ่ายผลิตภัณฑ์ ChatGPT
Jackie Shannon
ผู้นำด้านวิศวกรรม ChatGPT
Mengchao Zhong, Wayne Chang
ผู้นำฝ่ายออกแบบผลิตภัณฑ์
Matt Chan
วิทยาการข้อมูล
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
ผู้นำด้านผลิตภัณฑ์ Sora
Rohan Sahai, Wesam Manassra
ฝ่ายผลิตภัณฑ์และวิศวกรรม Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
ความปลอดภัย
ผู้นำฝ่ายความปลอดภัย
Somay Jain
ความปลอดภัย
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
กลยุทธ์
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
การตลาดและการสื่อสาร
ผู้นำฝ่ายการสื่อสารและการตลาด
Minnia Feng, Natalie Summers, Taya Christianson
การสื่อสาร
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
การออกแบบและความคิดสร้างสรรค์
ลีด
Kendra Rimbach, Veit Moeller
ดีไซน์
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
ขอบคุณเป็นพิเศษ
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






