ዛሬ፣ በአዲሱ ዋና የምስል ማመንጫ ሞዴላችን የተጎላበተውን የChatGPT Images አዲስ ስሪት እያወጣን ነው። አሁን፣ ከባዶ የሆነ ነገር እየፈጠሩም ሆነ ፎቶ እያስተካከሉ፣ እርስዎ የሚስሉትን ውጤት ያገኛሉ። እንደ የሰዎች ገጽታ ያሉ ዝርዝሮችን ሳይበላሹ ትክክለኛ ማስተካከያዎችን ያደርጋል፣ እና ምስሎችን እስከ 4x በፍጥነት ያመነጫል። በተጨማሪም፣ በChatGPT ውስጥ አዲስ የምስል ባህሪን እያስተዋወቅን ነው፣ ይህም ምሥል ማመንጨትን አስደሳች ለማድረግ የተነደፈ ነው—መነሳሳትን ለማነሳሳት እና የፈጠራ ፍለጋን ቀላል ለማድረግ
አዲሱ የImages ሞዴል እና ባህሪ ዛሬ በChatGPT ለሁሉም ተጠቃሚዎች እና በAPI ውስጥ እንደ gpt-ምስል-1.5 እየተሰራ ነው።
አሁን፣ በተሰቀለ ምሥል ላይ አርትዖቶችን ሲጠይቁ፣ ሞዴሉ ከዓላማዎ ጋር የበለጠ አስተማማኝ በሆነ መልኩ ይጣጣማል—እስከ ትናንሽ ዝርዝሮች ድረስ—እንደ ብርሃን፣ ቅንብር እና የሰዎች ገጽታ በግብዓቶች፣ በውጤቶች እና በቀጣይ አርትዖቶች ላይ ወጥነት ያለው ሆኖ ሲቆይ የሚጠይቁትን ብቻ ይለውጣል።
ይህ ከዓላማዎ ጋር የሚስማሙ ውጤቶችን ይከፍታል—የበለጠ ጠቃሚ የፎቶ አርትዖቶች፣ የበለጠ አሳማኝ የልብስ እና የፀጉር አሠራር ሙከራዎች፣ ከስታይል ማጣሪያዎች እና የመጀመሪያውን ምስል ይዘት የሚጠብቁ ፅንሰ-ሀሳባዊ ለውጦች ጋር። እነዚህ ማሻሻያዎች አንድ ላይ ሲሆኑ ChatGPT በኪስዎ ውስጥ እንደ የፈጠራ ስቱዲዮ ሆኖ ሊያገለግል ይችላል፣ ተግባራዊ አርትዖቶችን እና ገላጭ የሆኑ ዳግም ሀሳቦችን መስጠት ይችላል።
ሞዴሉ በተለያዩ የአርትዖት ዓይነቶች—መደመር፣ መቀነስ፣ መቀላቀል፣ ማዋሃድ እና ማስተላለፍን ጨምሮ—የላቀ ነው፣ ስለዚህ ምስሉን ልዩ የሚያደርገውን ሳያጡ የሚፈልጉትን ለውጦች ያገኛሉ።
የሞዴሉ የፈጠራ ችሎታ—እንደ ጽሑፍና አቀማመጥ ያሉ ነገሮችን የሚቀይሩና የሚጨምሩ ለውጦችን በማድረግ ጠቃሚ ዝርዝሮችን በመጠበቅ—ሀሳቦችን ወደ ሕይወት የሚያመጡ ለውጦችን ያደርጋል። እነዚህ ለውጦች ለሁለቱም ቀላል እና ይበልጥ ውስብስብ ፅንሰ ሀሳቦች ይሰራሉ፣ እና በአዲሱ የChatGPT Images(በአዲስ መስኮት ውስጥ ይክፈታል) ባህሪ ውስጥ አስቀድሞ የተዘጋጁ ቅጦችን እና ሀሳቦችን ለመጠቀም መሞከር ቀላል ናቸው—የጽሑፍ እርምጃ አያስፈልግም።
ሞዴሉ ከመጀመሪያ ስሪታችን በበለጠ አስተማማኝ መመሪያዎችን ይከተላል። ይህ በክፍሎች መካከል ያሉ ግንኙነቶች እንደታሰበው እንዲጠበቁ ይበልጥ ትክክለኛ የሆኑ አርትዖቶችን እንዲሁም የበለጠ ውስብስብ የሆኑ ኦሪጅናል ቅንብሮችን ያስችላል።
አዲስ
ያለፈው
ሞዴሉ በጽሑፍ አተረጓጎም ረገድ ሌላ እርምጃ ወደፊት ይወስዳል፣ ጥቅጥቅ ያሉ እና ትናንሽ ጽሑፎችን ማስተናገድ የሚችል።
ሞዴሉ እንደ ብዙ ትናንሽ ፊቶችን ማሳየት እና የተፈጥሮ ውጤቶች እንዴት እንደሚታዩ ያሉ ወዲያውኑ ጥቅም ላይ ሊውሉ ወደሚችሉ ውጤቶች የሚተረጎሙ ተጨማሪ ልኬቶችን ያሻሽላል።
አዲስ
ያለፈው
በመልዕክት ውስጥ ምን ማየት እንደሚፈልጉ በመግለጽ ምስሎችን ከማመንጨት በተጨማሪ፣ በChatGPT ውስጥ ለImagesI(በአዲስ መስኮት ውስጥ ይክፈታል) የተወሰነ መነሻ እያስተዋወቅን ነው—በሞባይል መተግበሪያ እና በchatgpt.com ላይ በጎን አሞሌው ላይ ይገኛል ምስሎችን ማሰስ እና መሞከር ፈጣን እና ቀላል ያድርጉት። ይህ ውስጥ የተዘጋጀ አጣራና እርምጃ ዝርዝር ይዟል፣ እንደገና የሚዘመኑ እና እየተፈጠሩ ያሉ አዳዲስ እንቅስቃሴዎችን ለማሳየት የሚያስተካክሉ ናቸው።
በአንድነት እነዚህ ማሻሻያዎች ከትንሽ ማስተካከያዎች እስከ ሙሉ ማስተካከያዎች ድረስ ምስሎችን ከእርስዎ ራዕይ ጋር የተሻለ እንዲስማማ ፍጠር ይፈቅድልዎታል።
ይህ ሞዴል የንግድ ሥራ ፍሰቶችን በፈጣን የምስል ማመንጨት፣ ትክክለኛ አርትዖቶች እና በተከታታይ የእይታ ዝርዝሮች በተለያዩ ድግግሞሽዎች ያመቻቻል። ቡድኖች ሐሳቦችን ማሰስ፣ የታለሙ ለውጦችን ማድረግ እና ውስብስብ ወይም ደረቅ ፅንሰ ሀሳቦችን በዓይነ ሕሊናቸው ማየት ይችላሉ፣ ይህም በግብይት፣ በዲዛይን፣ በኢ-ኮሜርስ እና በውስጥ ግንኙነቶች ውስጥ የአጠቃቀም ጉዳዮችን ይደግፋል።
አፈጻጸምን ለመገምገም ከመጀመሪያው የምስል ማመንጫ ጅማሬያችን ብዙዎቹን ምሳሌዎች እንደገና እንሰራለን። ሞዴሉ በተለያዩ ጉዳዮች ላይ ግልጽ የሆኑ ማሻሻያዎችን ያሳያል፣ ምንም እንኳን ውጤቶቹ ፍፁም ባይሆኑም። ይህ እትም ትርጉም ያለው እድገትን የሚወክል ቢሆንም፣ ወደፊት በሚደረጉ ድግግሞሾች ላይ አሁንም ከፍተኛ መሻሻል የሚያስፈልግበት ቦታ አለ።
አዲስ
ያለፈው
አሁንም አንዳንድ ሳይንሳዊ ስህተቶች አሉ፣ ነገር ግን ~70% ትክክል እና የበለጠ ግልጽ የሆኑ ግራፊክስ፣ ያለጊዜው መከርከምን ያስወግዳል።
በAPI ውስጥ ያለው gpt-ምስል-1.5 በChatGPT Images ውስጥ ተመሳሳይ ማሻሻያዎችን ያቀርባል፦ ከGPT Image 1 ይልቅ በምሥል ጥበቃ እና አርትዖት የበለጠ ጠንካራ ነው።
የምርት ስም አርማዎችን እና ቁልፍ ምስሎችን በአርትዖቶች ዙሪያ የበለጠ ወጥነት ያለው ጥበቃ ያያሉ—ይህም ለገበያ እና እንደ ግራፊክስ እና አርማ ፈጠራ ላሉ የምርት ስሞች ተስማሚ ያደርገዋል፣ እና ከአንድ ምንጭ ምስል ሙሉ የምርት ምስል ካታሎጎችን (ተለዋዋጮች፣ ትዕይንቶች እና ማዕዘኖች) ለሚያመነጩ የኢ-ኮሜርስ ቡድኖች ተስማሚ ያደርገዋል።
የምስል ግብዓቶች እና ውጤቶች አሁን በGPT ምስል 1.5 ከChatGPT Image 1.5 ጋር ሲነጻጸር በ20% ርካሽ ናቸው፣ ስለዚህ በተመሳሳይ በጀት ተጨማሪ ምስሎችን ማመንጨት እና እንደገና መስራት ይችላሉ።
አዲሱን ሞዴል በOpenAI Playground(በአዲስ መስኮት ውስጥ ይክፈታል) ውስጥ መሞከር ወይም ለመነሳሳት የእርምጃ መመሪያውን(በአዲስ መስኮት ውስጥ ይክፈታል) ማንበብ ይችላሉ።
የፈጠራ መሳሪያዎችን፣ የኢ-ኮሜርስ፣ የግብይት ሶፍትዌርን እና ሌሎችንም ጨምሮ በተለያዩ ኢንዱስትሪዎች ውስጥ ያሉ Enterprises እና ጅምር ኩባንያዎች GPT Image 1.5ን እየተጠቀሙ ነው። ከእነዚህ ምሳሌዎች ውስጥ አንዳንዶቹን ከዚህ በታች ለማጋራት ጓጉተናል።
አዲስ
ያለፈው
«GPT Image 1.5 ከፍተኛ ጥራት ያላቸውን ምስሎች በፍጥነት በማጣበቅ፣ ቅንብርን፣ ብርሃንን በመጠበቅ እና ጥቃቅን ዝርዝሮችን በመጠበቅ ያመነጫል። ውጤቶቹ ንጹህ፣ ተጨባጭ እና አስተማማኝ ናቸው፣ እንደ Wix ባሉ መድረኮች ላይ ፈጣን የፅንሰ-ሀሳብ-ወደ-ምርት የስራ ፍሰቶችን ይደግፋሉ። በWix ላይ በምናያቸው የሙከራ ዘዴዎች እና በዋና ዋና የአጠቃቀም ጉዳዮች ላይ በመመስረት፣ ወጥነት እና ጥራት ዛሬ ካሉት ዋና ዋና የምስል ማመንጫ ሞዴሎች አንዱ ለማድረግ ይወዳደራሉ።»
— Hila Gat፣ በWix ላይ የሰው ሠራሽ አስተውሎት (AI) እና የውሂብ ሳይንስ ጥናት ኃላፊ
አዲሱ የChatGPT Images አሁን በዓለም ዙሪያ ላሉ የChatGPT ተጠቃሚዎች እና የAPI ተጠቃሚዎች በሙሉ እየተሰራጨ ነው። በተለያዩ ሞዴሎች ላይ ይሰራል፣ ስለዚህ እሱን ለመጠቀም ምንም ነገር መምረጥ አያስፈልግዎትም።
አሁንም የምስል ማመንጨት ምን ማስቻል እንደሚችል መጀመሪያ ላይ እንዳለን እናምናለን። የዛሬው ዝማኔ ትርጉም ያለው ወደፊት የሚወስድ እርምጃ ሲሆን ከጥሩ ማስተካከያዎች እስከ በቋንቋዎች ውስጥ የበለጠ የበለፀጉ እና ዝርዝር ውጤቶች ድረስ ወደፊት የሚመጡ ተጨማሪ ነገሮች አሉ።
ደራሲ
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















