نُطلق اليوم إصدارًا جديدًا من ChatGPT صور، مدعومًا بنموذجنا الرائد الجديد لتوليد الصور. سواء كنت تنشئ محتوى من الصفر أو تُجري تعديلات على صورة موجودة، ستحصل الآن على النتائج التي تتخيلها بدقة. يتيح هذا الإصدار إجراء تعديلات دقيقة مع الحفاظ على التفاصيل المهمة، مثل ملامح الأشخاص، كما يوفّر سرعة توليد صور أعلى بما يصل إلى أربعة أضعاف. وبالتوازي مع ذلك، نُقدّم ميزة الصور الجديدة داخل ChatGPT، والمصممة لجعل تجربة إنشاء الصور ممتعة، وتحفيز الإلهام، وتسهيل الاستكشاف الإبداعي دون عناء.
يبدأ اليوم طرح نموذج الصور الجديد والميزة المصاحبة له داخل ChatGPT لجميع المستخدمين، كما يتوفر عبر واجهة البرمجة (API) باسم gpt-image-1.5.
بات النموذج الآن أكثر دقة في تنفيذ طلبات تعديل الصور المُحمّلة، إذ يطبّق التغييرات المطلوبة فقط، مع الالتزام الكامل بنيّتك حتى أدق التفاصيل، والحفاظ على ثبات عناصر مثل الإضاءة، والتكوين، ومظهر الأشخاص عبر جميع المخرجات والتعديلات اللاحقة.
يتيح ذلك نتائج تتوافق بدقة مع نواياك، بما يشمل تعديلات صور أكثر فائدة، وتجارب واقعية أكثر للملابس وتسريحات الشعر، إلى جانب فلاتر أسلوبية وتحويلات مفاهيمية تحافظ على جوهر الصورة الأصلية. وبفضل هذه التحسينات مجتمعة، يمكن لـ ChatGPT أن يعمل كاستوديو إبداعي في متناول يدك، قادر على تنفيذ تعديلات عملية وإعادة تصوّر إبداعية في آن واحد.
يتفوّق النموذج في مختلف أنواع التحرير، بما في ذلك الإضافة، والحذف، والدمج، والمزج، وإعادة الترتيب، ما يتيح لك الحصول على التغييرات التي تريدها دون فقدان العناصر التي تمنح الصورة تميّزها.
يبرز إبداع النموذج من خلال تحويلات تُجري تعديلات وتضيف عناصر جديدة، مثل النصوص والتنسيقات، لتحويل الأفكار إلى صور نابضة بالحياة مع الحفاظ على التفاصيل الأساسية. وتدعم هذه التحويلات المفاهيم البسيطة والمعقّدة على حد سواء، كما يمكن تجربتها بسهولة باستخدام الأنماط والأفكار الجاهزة ضمن ميزة ChatGPT صور(يفتح في نافذة جديدة) الجديدة، دون الحاجة إلى إدخال توجيه نصي.
يلتزم النموذج بالتعليمات بدرجة أعلى من الدقة مقارنةً بالإصدار الأول. ويُمكّن ذلك من تنفيذ تعديلات أكثر دقة، إلى جانب إنشاء تركيبات أصلية أكثر تعقيدًا، مع الحفاظ على العلاقات المقصودة بين العناصر كما هو مخطّط لها.
الجديد
السابق
يخطو النموذج خطوة إضافية إلى الأمام في مجال عرض النصوص، إذ أصبح قادرًا على التعامل مع نصوص أكثر كثافة وأصغر حجمًا بدقة أعلى.
يقدّم النموذج أيضًا تحسينات في جوانب أخرى تُسهم في إنتاج مخرجات قابلة للاستخدام بشكل مباشر، مثل تحسين عرض عدد كبير من الوجوه الصغيرة، وتعزيز المظهر الطبيعي للنتائج النهائية.
الجديد
السابق
بالإضافة إلى إنشاء الصور من خلال وصف ما ترغب في رؤيته ضمن رسالة، نُقدّم مساحة مخصّصة لميزة الصور(يفتح في نافذة جديدة) داخل ChatGPT، متاحة عبر الشريط الجانبي في تطبيق الهاتف المحمول وعلى موقع chatgpt.com، وذلك لتسريع استكشاف الصور وتجربتها وجعل العملية أسهل. وتتضمن هذه المساحة عشرات الفلاتر والتوجيهات الجاهزة التي تساعد على تحفيز الإلهام، ويتم تحديثها بانتظام لتعكس الاتجاهات الناشئة.
تُمكّنك هذه التحسينات مجتمعة من إنشاء صور تتوافق بشكل أفضل مع رؤيتك، بدءًا من التعديلات البسيطة وصولًا إلى إعادة تصوّر كاملة.
يسهّل هذا النموذج سير العمل المؤسسي عبر توليد الصور بسرعة أكبر، وتنفيذ تعديلات دقيقة، والحفاظ على اتساق التفاصيل البصرية عبر الإصدارات المتتالية. ويُمكّن الفرق من استكشاف الأفكار، وإجراء تعديلات موجّهة، وتقديم تصوّرات واضحة للمفاهيم المعقّدة أو غير البصرية (المجردة)، بما يدعم استخدامه في مجالات مثل التسويق، والتصميم، والتجارة الإلكترونية، والاتصالات الداخلية.
قمنا بإعادة اختبار عدد كبير من أمثلة الإطلاق الأول لتقنية توليد الصور لتقييم الأداء. وقد أظهر النموذج تحسنًا ملحوظًا في حالات متعددة، مع بقاء بعض القيود. وبينما يعكس هذا الإصدار تقدمًا مهمًا، تظل هناك فرص كبيرة لمزيد من التطوير في الإصدارات القادمة.
الجديد
السابق
لا تزال هناك بعض أوجه القصور العلمية، إلا أن الدقة تبلغ نحو 70%، مع رسومات أكثر وضوحًا وحيوية، وتجنّب أفضل لعمليات القص المبكر.
يقدّم gpt-image-1.5 عبر واجهة البرمجة (API) التحسينات نفسها المتوفرة في ChatGPT صور، مع أداء أقوى في الحفاظ على الصورة وتحريرها مقارنةً بـ GPT Image 1.
ستلاحظ مستوى أعلى من الاتساق في الحفاظ على الشعارات والعناصر البصرية الأساسية للعلامات التجارية عبر مختلف التعديلات، مما يجعل النموذج مناسبًا لأعمال التسويق وبناء العلامة التجارية، مثل إنشاء الرسومات والشعارات، وكذلك لفرق التجارة الإلكترونية التي تُنشئ كتالوجات كاملة لصور المنتجات، بما في ذلك النماذج المختلفة، والمشاهد، والزوايا، انطلاقًا من صورة مصدر واحدة.
أصبحت مدخلات ومخرجات الصور أقل تكلفة بنسبة 20% في GPT Image 1.5 مقارنةً بـ GPT Image 1، ما يتيح لك إنشاء عدد أكبر من الصور وتكرارها ضمن الميزانية نفسها.
ويمكنك تجربة النموذج الجديد عبر OpenAI Playground(يفتح في نافذة جديدة) أو الاطلاع على دليل المطالبات(يفتح في نافذة جديدة) للحصول على المزيد من الإلهام.
تعتمد مؤسسات كبرى وشركات ناشئة في قطاعات متعددة، تشمل أدوات الإبداع، والتجارة الإلكترونية، وبرمجيات التسويق وغيرها، على GPT Image 1.5 بالفعل. ويسرّنا مشاركة بعض هذه الأمثلة أدناه.
الجديد
السابق
"يُنتج GPT Image 1.5 صورًا عالية الدقة مع التزام قوي بالتوجيهات، مع الحفاظ على التكوين، والإضاءة، والتفاصيل الدقيقة. وتتميّز النتائج بالنظافة والواقعية والموثوقية، ما يدعم تسريع سير العمل من مرحلة الفكرة إلى الإنتاج على منصات مثل Wix. واستنادًا إلى اختباراتنا وحالات الاستخدام الرئيسية التي نراها في Wix، فإن مستوى الاتساق والجودة يجعله منافسًا ليكون أحد النماذج الرائدة لتوليد الصور حاليًا."
— هيلا جات، رئيسة أبحاث الذكاء الاصطناعي وعلوم البيانات في Wix
يبدأ اليوم طرح ChatGPT صور الجديد لجميع مستخدمي ChatGPT ومستخدمي واجهة البرمجة (API) حول العالم عبر مختلف الواجهات. ويعمل عبر النماذج المختلفة، لذلك لا تحتاج إلى تحديد أي إعدادات خاصة لاستخدامه.
نعتقد أننا لا نزال في بدايات الإمكانات التي يتيحها توليد الصور. ويُمثّل تحديث اليوم خطوة مهمة إلى الأمام، مع المزيد قادمًا لاحقًا، بدءًا من تعديلات أدق وأكثر تفصيلًا، وصولًا إلى مخرجات أغنى وأكثر عمقًا عبر لغات متعددة.
المؤلف
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















