ChatGPT Images เวอร์ชันใหม่ ขับเคลื่อนด้วยโมเดลภาพรุ่นล่าสุดของเรา ไม่ว่าจะเริ่มใหม่หรือแก้ไขภาพที่มีอยู่ ผลลัพธ์ก็จะออกมาตรงใจอย่างที่คุณคิดไว้ โมเดลนี้ช่วยแก้รายละเอียดได้อย่างแม่นยำ คงหน้าตาและรูปลักษณ์ไว้อย่างครบถ้วน และทำงานได้เร็วขึ้นสูงสุดถึง 4 เท่า นอกจากนี้ เรายังเปิดตัวฟีเจอร์ Images ใหม่ภายใน ChatGPT ที่ทำให้การทำงานกับรูปภาพสนุกขึ้น จุดประกายแรงบันดาลใจ และต่อยอดไอเดียได้อย่างลื่นไหล
โมเดล Images รุ่นใหม่และฟีเจอร์ Images กำลังทยอยเปิดให้ใช้งานใน ChatGPT สำหรับผู้ใช้ทุกคนตั้งแต่วันนี้ และพร้อมใช้งานผ่าน API ในชื่อ gpt-image-1.5
เมื่อคุณขอให้แก้ไขภาพที่อัปโหลด โมเดลจะยึดตามเจตนาของคุณได้อย่างสม่ำเสมอและแม่นยำยิ่งขึ้น แม้ในรายละเอียดเล็กๆ โดยจะเปลี่ยนเฉพาะสิ่งที่คุณร้องขอ พร้อมคงองค์ประกอบอย่างแสง องค์ประกอบภาพ และรูปลักษณ์ของคนให้สอดคล้องกันตลอดทั้งอินพุต เอาต์พุต และการแก้ไขครั้งต่อๆ ไป
สิ่งนี้ช่วยให้ได้ผลลัพธ์ที่ตรงกับสิ่งที่คุณตั้งใจไว้มากขึ้น ไม่ว่าจะเป็นการแก้ไขภาพที่ใช้งานได้จริง การลองเสื้อผ้าและทรงผมที่ดูสมจริง ไปจนถึงฟิลเตอร์เชิงสไตล์และการปรับเปลี่ยนเชิงแนวคิด ที่ยังคงแก่นของภาพต้นฉบับไว้ การปรับปรุงเหล่านี้หมายความว่า ChatGPT สามารถทำหน้าที่เป็นสตูดิโอสร้างสรรค์ในกระเป๋าของคุณได้ ทั้งในด้านการแก้ไขที่ใช้งานได้จริงและการตีความภาพใหม่อย่างสร้างสรรค์
โมเดลนี้มีความโดดเด่นในการแก้ไขหลายรูปแบบ ไม่ว่าจะเป็นการเพิ่ม ลบ รวม ผสม หรือจัดวางใหม่ ทำให้คุณได้การเปลี่ยนแปลงตามที่ต้องการ โดยยังคงสิ่งที่ทำให้ภาพมีเอกลักษณ์ไว้ครบถ้วน
ความคิดสร้างสรรค์ของโมเดลโดดเด่นผ่านการแปลงภาพที่ทั้งปรับเปลี่ยนและเพิ่มองค์ประกอบใหม่ เช่น ข้อความและเลย์เอาต์ เพื่อทำให้ไอเดียมีชีวิตขึ้นมา พร้อมคงรายละเอียดสำคัญไว้ครบถ้วน การแปลงภาพเหล่านี้รองรับทั้งแนวคิดที่เรียบง่ายและซับซ้อน และทดลองใช้งานได้ง่ายผ่านสไตล์และไอเดียที่ตั้งค่าไว้ล่วงหน้าในฟีเจอร์ ChatGPT Images(เปิดในหน้าต่างใหม่) ใหม่ โดยไม่จำเป็นต้องพิมพ์คำสั่ง
โมเดลนี้ทำตามคำสั่งได้อย่างสม่ำเสมอและเชื่อถือได้มากกว่ารุ่นแรก สิ่งนี้ช่วยให้การแก้ไขทำได้อย่างแม่นยำยิ่งขึ้น รวมถึงการสร้างองค์ประกอบต้นฉบับที่ซับซ้อนกว่าเดิม โดยยังคงความสัมพันธ์ระหว่างองค์ประกอบต่างๆ ไว้ตามที่ตั้งใจ
ใหม่
ก่อนหน้า
นอกจากนี้ โมเดลยังยกระดับความสามารถด้านการแสดงผลข้อความไปอีกขั้น รองรับข้อความที่หนาแน่นและมีขนาดเล็กได้ดียิ่งขึ้น
โมเดลยังได้รับการปรับปรุงในมิติคุณภาพอื่นๆ ที่ช่วยให้ผลลัพธ์พร้อมใช้งานได้ทันทีมากขึ้น เช่น การแสดงใบหน้าขนาดเล็กของคนจำนวนมากได้อย่างชัดเจน และความเป็นธรรมชาติของภาพที่ได้
ใหม่
ก่อนหน้า
นอกเหนือจากการสร้างภาพด้วยการอธิบายสิ่งที่คุณอยากเห็นผ่านข้อความแล้ว เรายังเปิดตัวพื้นที่เฉพาะสำหรับ Images(เปิดในหน้าต่างใหม่) ใน ChatGPT ซึ่งสามารถเข้าถึงได้จากแถบด้านข้างบนแอปมือถือ และบน chatgpt.com เพื่อให้การค้นหา ทดลอง และทำงานกับภาพเป็นไปได้รวดเร็วและง่ายยิ่งขึ้น พื้นที่นี้มาพร้อมฟิลเตอร์และคำสั่งที่ตั้งค่าไว้ล่วงหน้าหลายสิบแบบ ช่วยจุดประกายแรงบันดาลใจตั้งแต่เริ่มต้น และมีการอัปเดตอย่างสม่ำเสมอให้สอดคล้องกับเทรนด์ที่กำลังเกิดขึ้น
การอัปเกรดทั้งหมดนี้ช่วยให้คุณสามารถสร้างภาพที่ตรงกับสิ่งที่คุณตั้งใจไว้มากขึ้น ตั้งแต่การปรับแก้เล็กน้อยไปจนถึงการตีความใหม่ทั้งภาพ
โมเดลนี้ช่วยให้เวิร์กโฟลว์ทางธุรกิจทำงานได้คล่องตัวขึ้น ด้วยการสร้างภาพที่รวดเร็วขึ้น การแก้ไขที่แม่นยำ และความสม่ำเสมอของรายละเอียดเชิงภาพตลอดการทำงานซ้ำในแต่ละรอบ ทีมสามารถสำรวจไอเดีย ปรับแก้เฉพาะจุด และถ่ายทอดแนวคิดที่ซับซ้อนหรือเข้าใจยากให้เห็นภาพได้ชัดเจน รองรับการใช้งานในหลากหลายด้าน ตั้งแต่การตลาด การออกแบบ อีคอมเมิร์ซ ไปจนถึงการสื่อสารภายในองค์กร
เราได้นำตัวอย่างจำนวนมากจากการเปิดตัวระบบสร้างภาพครั้งแรกกลับมาทดสอบอีกครั้ง เพื่อประเมินประสิทธิภาพของโมเดล ผลการทดสอบแสดงให้เห็นถึงการพัฒนาอย่างชัดเจนในหลายกรณี แม้ว่าผลลัพธ์จะยังไม่สมบูรณ์แบบในทุกด้าน แม้การออกรุ่นนี้จะสะท้อนถึงความก้าวหน้าที่มีนัยสำคัญ แต่ก็ยังมีพื้นที่ให้พัฒนาเพิ่มเติมอีกมากในการอัปเดตรุ่นถัดไป
ใหม่
ก่อนหน้า
ยังคงมีความคลาดเคลื่อนทางวิทยาศาสตร์อยู่บ้าง แต่ความถูกต้องโดยรวมอยู่ที่ราว 70% ภาพมีความสดและมีรายละเอียดมากขึ้น และหลีกเลี่ยงปัญหาการครอปภาพก่อนเวลาได้ดีขึ้น
gpt-image-1.5 บน API มาพร้อมความสามารถแบบเดียวกับ ChatGPT Images โดยมีการคงสภาพของภาพและการแก้ไขที่ดีกว่า GPT Image 1 อย่างชัดเจน
คุณจะเห็นการคงโลโก้แบรนด์และภาพสำคัญได้อย่างสม่ำเสมอมากขึ้นตลอดการแก้ไข ทำให้เหมาะสำหรับงานด้านการตลาดและแบรนด์ เช่น งานกราฟิกและการสร้างโลโก้ รวมถึงทีมอีคอมเมิร์ซที่ต้องสร้างแคตตาล็อกภาพสินค้าครบชุด (ตัวเลือกสินค้า ฉาก และมุมมองต่าง ๆ) จากภาพต้นทางเพียงภาพเดียว
ค่าใช้จ่ายสำหรับอินพุตและเอาต์พุตของภาพใน GPT Image 1.5 ลดลง 20% เมื่อเทียบกับ GPT Image 1 ทำให้คุณสามารถสร้างและปรับภาพซ้ำได้มากขึ้น ภายใต้งบประมาณเท่าเดิม
คุณสามารถทดลองใช้งานโมเดลใหม่นี้ได้ใน OpenAI Playground(เปิดในหน้าต่างใหม่) หรืออ่าน คู่มือคำสั่ง (prompt guide)(เปิดในหน้าต่างใหม่) เพื่อหาไอเดียและแรงบันดาลใจเพิ่มเติม
องค์กรขนาดใหญ่และสตาร์ทอัพจากหลากหลายอุตสาหกรรม ไม่ว่าจะเป็นเครื่องมือสร้างสรรค์ อีคอมเมิร์ซ ซอฟต์แวร์ด้านการตลาด และอีกมากมาย ต่างเริ่มนำ GPT Image 1.5 ไปใช้งานแล้ว เรายินดีที่จะแชร์ตัวอย่างบางส่วนเหล่านี้ให้คุณได้เห็นด้านล่าง
ใหม่
ก่อนหน้า
“GPT Image 1.5 สร้างภาพคุณภาพสูงที่มีรายละเอียดคมชัดและสมจริง พร้อมยึดตามคำสั่งได้อย่างแม่นยำ โดยยังคงองค์ประกอบของภาพ แสง และรายละเอียดระดับลึกไว้อย่างครบถ้วน ผลลัพธ์ที่ได้ดูดี สมจริง และเชื่อถือได้ ช่วยให้เวิร์กโฟลว์ตั้งแต่แนวคิดไปจนถึงการนำไปใช้งานจริงทำได้รวดเร็วยิ่งขึ้น บนแพลตฟอร์มอย่าง Wix จากการทดสอบของเราและกรณีการใช้งานหลักที่ Wix ความสม่ำเสมอและคุณภาพของโมเดลนี้ทำให้ GPT Image 1.5 โดดเด่นขึ้นมาเป็นหนึ่งในโมเดลสร้างภาพระดับแนวหน้าของปัจจุบัน”
— Hila Gat, Head of AI Research and Data Science ที่ Wix
ChatGPT Images โฉมใหม่นี้กำลัง ทยอยเปิดให้ใช้งานสำหรับผู้ใช้ ChatGPT และผู้ใช้ API ทั่วโลก ตั้งแต่วันนี้ ครอบคลุมทุกแพลตฟอร์มการใช้งาน ฟีเจอร์นี้ทำงานร่วมกับโมเดลต่างๆ ได้โดยอัตโนมัติ คุณจึงไม่จำเป็นต้องเลือกหรือตั้งค่าใดๆ เพื่อเริ่มใช้งาน
เราเชื่อว่านี่เป็นเพียงจุดเริ่มต้นของศักยภาพที่การสร้างภาพสามารถเปิดให้เกิดขึ้นได้ การอัปเดตในวันนี้คือก้าวสำคัญอีกขั้น และยังมีอีกมากรออยู่ข้างหน้า ตั้งแต่การแก้ไขที่ละเอียดขึ้น ไปจนถึงผลลัพธ์ที่สมบูรณ์และมีรายละเอียดมากขึ้นในหลายภาษา
ผู้เขียน
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















