4o इमेज जनरेशन सादर करत आहे
नेटीव्हली मल्टिमोडल मॉडेलसह उपयुक्त आणि मौल्यवान इमेज जनरेशन उघडत आहोत जे प्रिसाईज, अॅक्युरेट आणि फोटोरीअलिस्टिक आउटपुट देण्यास सक्षम आहे.
OpenAI मध्ये आम्हाला नेहमी वाटले आहे की इमेज जनरेशन हे आमच्या भाषा मॉडेलचे एक प्राथमिक कौशल्य असावे. म्हणूनच आम्ही आमचा आतापर्यंतचा सर्वात अॅडव्हान्स्ड इमेज जनरेटर GPT‑4o मध्ये तयार केला आहे. परिणाम — इमेज जनरेशन जे फक्त सुंदर नाही तर उपयुक्तही आहे.
पहिल्या गुहेतील चित्रांपासून ते आधुनिक इन्फोग्राफिक्सपर्यंत, मानवांनी संवाद साधण्यासाठी, पटवून देण्यासाठी आणि विश्लेषण करण्यासाठी दृश्य प्रतिमांचा वापर केला आहे—फक्त सजवण्यासाठी नव्हे. आजचे जनरेटिव्ह मॉडेल्स अद्भुत, श्वास रोखून टाकणारे दृश्य तयार करू शकतात, पण माहिती शेअर करण्यासाठी आणि तयार करण्यासाठी लोक वापरत असलेल्या कामचलाऊ प्रतिमांमध्ये त्यांना अडचण येते. लोगोपासून डायग्राम्सपर्यंत, जेव्हा शेअर्ड भाषा आणि अनुभव दर्शवणाऱ्या सिम्बॉल्ससह पूरक केले जातात तेव्हा प्रतिमा अचूक अर्थ पोहोचवू शकतात.
GPT‑4o इमेज जनरेशन मजकूर अचूकपणे रेंडर करण्यात, प्रॉम्प्ट्स नीट पाळण्यात आणि 4o च्या नॅटिव्ह नॉलेज बेस व चॅट कॉन्टेक्स्टचा वापर करण्यात उत्कृष्ट आहे—यात अपलोड केलेल्या प्रतिमांचे रूपांतर करणे किंवा त्यांचा व्हिज्युअल इंस्पिरेशन म्हणून वापर करणे समाविष्ट आहे. ही क्षमतांमुळे तुम्हाला नेमकी तुम्ही कल्पना केलेली प्रतिमा तयार करणे सोपे होते, ज्यामुळे तुम्ही दृश्यांद्वारे अधिक प्रभावीपणे संवाद साधू शकता आणि इमेज जनरेशनला प्रिसीजन आणि पॉवरसह एक व्यावहारिक साधन म्हणून पुढे नेले जाते.
आम्ही आमच्या मॉडेल्सना ऑनलाइन प्रतिमा आणि मजकूर यांच्या संयुक्त वितरणावर प्रशिक्षित केले आहे, ज्यातून फक्त प्रतिमा भाषेशी कशा संबंधित आहेत हेच नव्हे तर त्या एकमेकांशी कशा संबंधित आहेत हेही शिकले आहे. आक्रमक पोस्ट-ट्रेनिंगसह एकत्रित केल्यामुळे तयार झालेले मॉडेल आश्चर्यकारक व्हिज्युअल फ्लुएन्सी दाखवते, जे उपयुक्त, सुसंगत आणि संदर्भ-जाणकार प्रतिमा तयार करण्यास सक्षम आहे.
एक चित्र हजार शब्दांइतके मौल्यवान असते, पण कधी कधी योग्य ठिकाणी काही शब्द निर्माण केल्याने प्रतिमेचा अर्थ अधिक प्रभावी होऊ शकतो. 4o ची अचूक सिम्बॉल्स प्रतिमांबरोबर मिसळण्याची क्षमता इमेज जनरेशनला व्हिज्युअल कम्युनिकेशनसाठी टूलमध्ये बदलते.
कारण इमेज जनरेशन आता GPT‑4o मध्ये नॅटिव्ह आहे, तुम्ही नैसर्गिक संभाषणातून प्रतिमा सुधारू शकता. GPT‑4o चॅट कॉन्टेक्स्टमधील प्रतिमा आणि मजकुरावर आधारित काम करू शकते आणि संपूर्ण प्रक्रियेत सुसंगतता सुनिश्चित करू शकते. उदाहरणार्थ, तुम्ही व्हिडिओ गेम कॅरॅक्टर डिझाइन करत असाल, तर त्या कॅरॅक्टरचे रूप एकाधिक पुनरावृत्त्यांमध्येही सुसंगत राहते, जसे तुम्ही सुधारणा आणि प्रयोग करता.
GPT‑4o चे इमेज जनरेशन डीटेल्ड प्रॉम्प्ट्स लक्षपूर्वक पाळते. इतर सिस्टिम्स ~5-8 ऑब्जेक्ट्समध्ये अडकतात, पण GPT‑4o 10-20 वेगवेगळ्या ऑब्जेक्ट्स हाताळू शकते. ऑब्जेक्ट्स त्यांच्या वैशिष्ट्ये आणि नात्यांशी अधिक घट्ट बांधणीमुळे चांगले नियंत्रण मिळते.
GPT‑4o वापरकर्त्यांनी अपलोड केलेल्या प्रतिमांचे विश्लेषण करून त्यातून शिकू शकते आणि त्यातील तपशील सहजपणे कॉन्टेक्स्टमध्ये समाविष्ट करून प्रतिमा निर्मितीसाठी वापरू शकते.
नेटिव्ह इमेज जनरेशन 4o ला त्यांचे ज्ञान मजकूर आणि प्रतिमांमध्ये जोडण्यास सक्षम करते, परिणामी एक मॉडेल अधिक स्मार्ट आणि अधिक कार्यक्षम वाटते.
विविध प्रतिमा शैली दाखवणाऱ्या प्रतिमांवर ट्रेनिंग केल्यामुळे मॉडेलला प्रतिमा विश्वासार्हपणे तयार करणे किंवा रूपांतर करणे शक्य होते.
आमचे मॉडेल परिपूर्ण नाही. सध्या असलेल्या अनेक मर्यादांची आम्हाला जाणीव आहे आणि प्रारंभिक लॉन्चनंतर मॉडेल सुधारणा करून त्यांना दूर करण्याचे आम्ही काम करू.

आम्ही पाहिले आहे की GPT‑4o कधी कधी लांब प्रतिमा, जसे पोस्टर्स, खूप घट्ट क्रॉप करू शकते, विशेषतः खालच्या भागात.
आमच्या मॉडेल स्पेकच्या अनुरूप, आम्ही गेम डेव्हलपमेंट, ऐतिहासिक एक्सप्लोरेशन आणि शिक्षण यांसारख्या मौल्यवान युज केसेसना समर्थन देऊन क्रिएटिव्ह फ्रीडम जास्तीत जास्त करण्याचे उद्दिष्ट ठेवतो—मजबूत सेफ्टी स्टँडर्ड्स राखून. त्याच वेळी, त्या स्टँडर्ड्सचे उल्लंघन करणाऱ्या रिक्वेस्ट्स ब्लॉक करणे पूर्वीइतकेच महत्त्वाचे राहते. खालील अतिरिक्त रिस्क एरियाजचे मूल्यांकन आहे जिथे आम्ही सुरक्षित, उच्च-उपयुक्तता असलेले कंटेंट सक्षम करण्यासाठी आणि युजर्ससाठी व्यापक क्रिएटिव्ह एक्सप्रेशनला समर्थन देण्यासाठी काम करत आहोत.
C2PA आणि अंतर्गत उलट शोधाद्वारे मूळ
सर्व तयार केलेल्या प्रतिमा C2PA मेटाडेटासह येतात, जे पारदर्शकता प्रदान करण्यासाठी GPT‑4o कडून आलेली प्रतिमा म्हणून ओळखतील. आम्ही एक इंटरनल सर्च टूल देखील तयार केले आहे जे जनरेशनच्या तांत्रिक वैशिष्ट्यांचा वापर करून कंटेंट आमच्या मॉडेलमधून आला आहे का ते पडताळण्यास मदत करते.
वाईट गोष्टींना ब्लॉक करणे
आमच्या सामग्री धोरणांचे उल्लंघन करू शकणाऱ्या, जसे की बाल लैंगिक अत्याचार साहित्य आणि लैंगिक डीपफेक, उत्पन्न केलेल्या प्रतिमांच्या विनंत्या आम्ही अवरोधित करत आहोत. जेव्हा खऱ्या व्यक्तींच्या प्रतिमा कॉन्टेक्स्टमध्ये असतात, तेव्हा कोणत्या प्रकारच्या प्रतिमा तयार केल्या जाऊ शकतात यावर आम्ही अधिक निर्बंध लावतो, विशेषतः नग्नता आणि ग्राफिक हिंसेभोवती मजबूत सुरक्षा उपाय ठेवतो. इतर कोणत्याही लॉन्चप्रमाणे, सेफ्टी कधीच पूर्ण होत नाही तर ती सतत चालणारी गुंतवणुकीची एक क्षेत्र आहे. या मॉडेलच्या वास्तविक वापराबद्दल आम्ही अधिक शिकत गेलो की, त्यानुसार आम्ही आमच्या पॉलिसीज अॅडजस्ट करू.
आमच्या दृष्टिकोनाबद्दल अधिक जाणून घेण्यासाठी, प्रतिमा निर्मिती GPT‑4o सिस्टम कार्डच्या पुरवणीला भेट द्या.
सुरक्षिततेला चालना देण्यासाठी तर्काचा वापर
आमच्या विचारपूर्वक संरेखन कार्यासारखेच, आम्ही तर्क LLM ला मानवी-लिखित आणि अर्थपूर्ण सुरक्षा वैशिष्ट्यांवरून थेट कार्य करण्यासाठी प्रशिक्षित केले आहे. डेव्हलपमेंटदरम्यान आम्ही हे रिझनिंग LLM वापरले जेणेकरून आमच्या पॉलिसीजमधील अस्पष्टता ओळखून त्यावर उपाय करता आला. आमच्या मल्टीमॉडल प्रगती आणि ChatGPT आणि Sora साठी विकसित केलेल्या विद्यमान सुरक्षा तंत्रांसह, हे आम्हाला आमच्या धोरणांविरुद्ध इनपुट मजकूर आणि आउटपुट प्रतिमा दोन्ही मवाळ करणे करण्यास अनुमती देते.
आजपासून 4o इमेज जनरेशन Plus, Pro, Team आणि Free वापरकर्त्यांसाठी ChatGPT मधील डिफॉल्ट इमेज जनरेटर म्हणून रोलआउट होत आहे, आणि लवकरच Enterprise आणि Edu वापरकर्त्यांसाठीही उपलब्ध होईल. हे Sora मध्ये वापरण्यासाठी देखील उपलब्ध आहे. DALL·E साठी विशेष स्थान असणाऱ्यांसाठी, ते अजूनही डेडिकेटेड DALL·E GPT द्वारे ॲक्सेस केले जाऊ शकते.
डेव्हलपर्स लवकरच API द्वारे GPT‑4o सह प्रतिमा जनरेट करू शकतील, पुढील काही आठवड्यांत ॲक्सेस रोल आउट होईल.
GPT‑4o वापरून प्रतिमा तयार करणे आणि सानुकूलित करणे चॅट करण्याइतके सोपे आहे – फक्त तुम्हाला काय हवे आहे ते वर्णन करा, ज्यात aspect ratio, hex कोड वापरून अचूक रंग, किंवा पारदर्शक पार्श्वभूमी यांसारख्या तपशीलांचा समावेश असू शकतो. हे मॉडेल अधिक तपशीलवार प्रतिमा तयार करते म्हणून रेंडर होण्यासाठी जास्त वेळ लागतो, बर्याचदा एक मिनिटापर्यंत.
लेखक
नेतृत्व
Gabriel Goh: प्रतिमा निर्मिती
जॅकी शॅनन: ChatGPT प्रॉडक्ट
Mengchao Zhong, Wayne Chang: ChatGPT अभियांत्रिकी
रोहन सहाय : Sora प्रॉडक्ट आणि अभियांत्रिकी
ब्रेंडन क्विन, तोमर काफ्तान: इनफरन्स
प्रफुल्ल धारीवाल: मल्टीमोडल ऑर्गनायझेशन
रिसर्च
फाऊंडेशनल रिसर्च
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
कोर रिसर्च
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
संशोधन योगदानकर्ते
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
मॉडेल बिहेविअर
Laurentia Romaniuk
मल्टिमोडल ऑर्गनायझेशन
Andrew Gibiansky, Yang Lu
डेटा
डेटा लीड्स
Gildas Chabot, James Park Lennon
डेटा
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
मॉडरेटर्स
Hazel Byrne, Jennifer Luckenbill, Mariano López
ह्युमन डेटा अॅडव्हायजर्स
Long Ouyang
स्केलिंग
इन्फरन्स लीड्स
Brendan Quinn, Tomer Kaftan
इन्फरन्स
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
अप्लाइड
ChatGPT प्रॉडक्ट लीड
Jackie Shannon
ChatGPT इंजिनिअरिंग लीड्स
Mengchao Zhong, Wayne Chang
प्रॉडक्ट डिझाइन लीड
Matt Chan
डेटा सायन्स
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora प्रॉडक्ट लीड्स
Rohan Sahai, Wesam Manassra
Sora प्रॉडक्ट आणि इंजिनिअरिंग
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
सुरक्षितता
सेफ्टी लीड
Somay Jain
सुरक्षितता
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
स्ट्रॅटेजी
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
मार्केटिंग आणि कॉम्स
कॉम्स आणि मार्केटिंग लीड्स
Minnia Feng, Natalie Summers, Taya Christianson
कॉम्स
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
डिझाईन आणि क्रिएटिव्ह
लीड्स
Kendra Rimbach, Veit Moeller
डिझाईन
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
विशेष आभार
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






