آج ہم چیٹ جی پی ٹی امیجز کا نیا ورژن جاری کر رہے ہیں، جو ہماری جدید اور بہترین تصویر بنانے والی ٹیکنالوجی پر مبنی ہے۔ اب چاہے آپ بالکل نئی چیز بنا رہے ہوں یا کسی تصویر میں تبدیلی کر رہے ہوں، آپ کو وہی نتیجہ ملے گا جیسا آپ اپنے ذہن میں سوچ رہے ہیں۔ یہ لوگوں کی شکل و صورت جیسے اہم تفصیلات کو برقرار رکھتے ہوئے بہت درست تبدیلیاں کرتا ہے، اور تصاویر چار گنا تیزی سے تیار کرتا ہے۔ اسی کے ساتھ، ہم چیٹ جی پی ٹی میں ایک نیا امیجز فیچر متعارف کروا رہے ہیں، جو تصویر بنانا مزید دلچسپ بناتا ہے—تخلیقی سوچ کو اُبھارتا ہے، اور تخلیقی تجربہ آسان بنا دیتا ہے۔
نیا امیجز ماڈل اور فیچر آج ChatGPT میں تمام صارفین کے لیے جاری کیا جا رہا ہے، اور API میں اسے gpt-image-1.5 کے نام سے متعارف کرایا گیا ہے۔
اب جب آپ اپ لوڈ کی گئی تصویر میں تبدیلی کی درخواست کرتے ہیں، تو ماڈل آپ کی ہدایات پر زیادہ بہتر طریقے سے عمل کرتا ہے—حتیٰ کہ چھوٹی تفصیلات تک—اور صرف وہی چیز بدلتا ہے جو آپ کہتے ہیں، جبکہ روشنی، ترتیب، اور لوگوں کی شکل و صورت کو تمام تبدیلیوں میں یکساں برقرار رکھتا ہے۔
اس سے آپ کو وہی نتائج ملتے ہیں جو آپ چاہتے ہیں—زیادہ کارآمد فوٹو ایڈیٹس، لباس اور بالوں کے زیادہ حقیقی ٹرائی-آنز، اور اسٹائل فلٹرز اور تخلیقی تبدیلیاں جو اصل تصویر کی روح اور پہچان کو برقرار رکھتی ہیں۔ مجموعی طور پر ان بہتریوں کا مطلب یہ ہے کہ ChatGPT آپ کی جیب میں موجود ایک تخلیقی اسٹوڈیو کے بطور کام کر سکتا ہے، جو عملی ایڈٹس کے ساتھ ساتھ تخیلاتی اور فنکارانہ تبدیلیاں بھی کر سکتا ہے۔
یہ ماڈل مختلف قسم کی ایڈیٹنگ میں مہارت رکھتا ہے—جیسے شامل کرنا، ہٹانا، جوڑنا، ملانا، اور ترتیب بدلنا—تاکہ آپ کو مطلوبہ تبدیلیاں ملیں اور تصویر کی خاص پہچان برقرار رہے۔
اس ماڈل کی تخلیقی صلاحیت اُن تبدیلیوں کے ذریعے نمایاں ہوتی ہے جن میں عناصر شامل یا بدلے جاتے ہیں—جیسے متن اور لے آؤٹ—تاکہ اہم تفصیلات کو برقرار رکھتے ہوئے، خیالات کو حقیقت میں بدلا جا سکے۔ یہ تبدیلیاں سادہ اور پیچیدہ دونوں طرح کے خیالات کے لیے کام کرتی ہیں، اور نئے ChatGPT Images(نئی ونڈو میں کھلتا ہے) فیچر میں موجود تیار شدہ اسٹائلز اور آئیڈیاز کے ذریعے انہیں آزمانا بہت آسان ہے—پرامپٹ دیے بغیر۔
یہ ماڈل ہمارے ابتدائی ورژن کے مقابلے میں ہدایات پر کہیں زیادہ بہتر طریقے سے عمل کرتا ہے۔ اس سے نہ صرف زیادہ درست ترامیم ممکن ہوتی ہیں بلکہ زیادہ پیچیدہ اصل کمپوزیشنز بھی بنتی ہیں، جن میں عناصر کے درمیان تعلقات مطلوبہ انداز میں برقرار رہتے ہیں۔
نیا
پچھلا
یہ ماڈل متن کو واضح انداز میں پیش کرنے میں ایک اور قدم آگے بڑھاتا ہے، اور زیادہ گھنے اور چھوٹے متن کو بھی مؤثر طریقے سے سنبھال سکتا ہے۔
یہ ماڈل دیگر اہم پہلوؤں میں بھی بہتری لاتا ہے جو نتائج کو فوراً قابلِ استعمال بناتے ہیں، جیسے متعدد چھوٹے چہروں کو واضح انداز میں دکھانا اور آؤٹ پٹ کو زیادہ قدرتی بنانا۔
نیا
پچھلا
کسی میسیج میں تصویر کی وضاحت دے کر تصاویر بنانے کے علاوہ، ہم ChatGPT میں Images (نئی ونڈو میں کھلتا ہے)کے لیے ایک مخصوص جگہ متعارف کروا رہے ہیں—جو موبائل ایپ اور chatgpt.com پر سائیڈبار میں دستیاب ہے—اس سے تصاویر کو دیکھنا، آزمانا اور دریافت کرنا زیادہ تیز اور آسان ہو جاتا ہے۔ اس میں درجنوں پہلے سے تیار فلٹرز اور پرامپٹس شامل ہیں جو تخلیقی خیالات کو فوراً شروع کرنے میں مدد دیتے ہیں، اور انہیں باقاعدگی سے نئے اور ابھرتے ہوئے رجحانات کے مطابق اپڈیٹ کیا جاتا ہے۔
یہ تمام بہتریاں مل کر آپ کو ایسی تصاویر بنانے میں مدد دیتی ہیں جو آپ کے تصور کے زیادہ قریب ہوں، چاہے آپ تصویر میں تھوڑی سی تبدیلی کرنا چاہتے ہوں یا اسے مکمل طور پر نیا بنانا چاہتے ہوں۔
یہ کاروباری کاموں کو آسان اور تیز بناتا ہے۔ اس کے ذریعے تصاویر جلدی تیار کی جا سکتی ہیں، درست تبدیلیاں کی جا سکتی ہیں، اور ہر بار تصویر کی شکل اور تفصیل ایک جیسی رکھی جا سکتی ہے۔ ٹیمیں نئے آئیڈیاز آزما سکتی ہیں، ضرورت کے مطابق تبدیلیاں کر سکتی ہیں، اور مشکل یا خشک موضوعات کو آسانی سے تصویری شکل میں سمجھا سکتی ہیں۔ یہ مارکیٹنگ، ڈیزائن، آن لائن تجارت، اور ادارے کے اندرونی رابطے کے لیے بہت مفید ہے۔
ہم نے اپنی ابتدائی امیج جنریشن ریلیز کی کئی مثالیں دوبارہ چلا کر کارکردگی کو جانچا۔ اس ماڈل نے مختلف حالات میں واضح بہتری دکھائی ہے، لیکن نتائج اب بھی کامل نہیں ہیں۔ یہ اپڈیٹ ایک اہم پیش رفت ہے، مگر آنے والے ورژنز میں مزید بہتری کی خاصی گنجائش موجود ہے۔
نیا
پچھلا
ابھی بھی سائنسی نقطہ نظر سے کچھ غلطیاں موجود ہیں، لیکن یہ تقریباً 70٪ درست ہے۔ گرافکس پہلے سے کہیں زیادہ واضح اور جاندار ہیں، اور تصاویر وقت سے پہلے کٹنے سے بچی ہوئی ہیں۔
API میں موجود gpt-image-1.5 وہی تمام بہتریاں فراہم کرتا ہے جو ChatGPT Images میں نظر آتی ہیں۔ یہ GPT Image 1 کے مقابلے میں اصل تصویر کو برقرار رکھنے اور درست ترمیم کرنے میں زیادہ بہتر ہے۔
تبدیلیوں کے دوران برانڈ کے لوگو اور اہم بصری عناصر ایک جیسے رہتے ہیں، اسی لیے یہ مارکیٹنگ اور برانڈنگ کے کاموں، جیسے گرافکس اور لوگو بنانے، اور ای-کامرس ٹیموں کے لیے نہایت موزوں ہے جو ایک ہی اصل تصویر سے مصنوعات کی مکمل تصویری فہرست (مختلف ورژنز، مناظر اور زاویے) تیار کرتی ہیں۔
GPT Image 1.5 میں تصویر ان پٹ اور آؤٹ پٹ اب GPT Image 1 کے مقابلے میں 20٪ سستے ہیں، لہذا آپ اسی بجٹ میں مزید تصاویر بنا سکتے ہیں اور ان پر کام کر سکتے ہیں۔
آپ نیا ماڈل OpenAI Playground(نئی ونڈو میں کھلتا ہے) میں آزما سکتے ہیں، یا طریقہ استعمال کے لیے پرامپٹ گائیڈ(نئی ونڈو میں کھلتا ہے) پڑھ سکتے ہیں۔
مختلف شعبوں میں کام کرنے والی بڑی کمپنیاں اور اسٹارٹ اپس، جیسے تخلیقی ٹولز، ای-کامرس، مارکیٹنگ سافٹ ویئر وغیرہ—پہلے ہی GPT Image 1.5 استعمال کر رہے ہیں۔ ہمیں خوشی ہے کہ ہم ان میں سے کچھ مثالیں نیچے شیئر کر رہے ہیں۔
نیا
پچھلا
"GPT Image 1.5 اعلیٰ معیار کی تصاویر بناتا ہے جو پرامپٹ پر درست عمل کرتا ہے اور تصویر کی ساخت، روشنی، اور باریک تفصیلات کو برقرار رکھتا ہے۔ نتائج صاف، حقیقت سے قریب، اور قابلِ اعتماد ہوتے ہیں، جس سے Wix جیسے پلیٹ فارمز پر آئیڈیا سے لے کر مکمل پروڈکشن تک کا عمل تیز ہو جاتا ہے۔ ہمارے ٹیسٹس اور Wix میں نظر آنے والے اہم استعمالوں کی بنیاد پر، اس کی مستقل کوالٹی اور معیار اسے آج کے بہترین امیج جنریشن ماڈلز میں شامل کرتے ہیں۔"
— Hila Gat، AI ریسرچ اینڈ ڈیٹا سائنس، Wix کے سربراہ
نیا ChatGPT Images فیچر آج دنیا بھر میں تمام ChatGPT اور API صارفین کے لیے جاری کیا جا رہا ہے۔ یہ تمام ماڈلز کے ساتھ خود بخود کام کرتا ہے، اس لیے اسے استعمال کرنے کے لیے آپ کو کوئی الگ انتخاب یا سیٹنگ کرنے کی ضرورت نہیں ہے۔
ہم سمجھتے ہیں کہ امیج جنریشن کی صلاحیتیں ابھی ابتدائی مرحلے میں ہیں۔ آج کی اپڈیٹ ایک اہم پیش رفت ہے، اور آگے مزید بہتریاں آنے والی ہیں، جیسے زیادہ باریک اور درست تبدیلیاں، اور مختلف زبانوں میں زیادہ بھرپور اور تفصیلی تصاویر۔
مصنف
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















