पेश है 4o इमेज जनरेशन
एक नैटिवली मल्टीमोडल मॉडल के साथ उपयोगी और मूल्यवान इमेज जेनरेशन को अनलॉक करना, जो सटीक, सही और फोटोरियलिस्टिक आउटपुट देने में सक्षम है.
OpenAI में, हम लंबे समय से मानते आए हैं कि इमेज जेनरेशन हमारे लैंग्वेज मॉडल्स की एक मुख्य क्षमता होनी चाहिए. इसीलिए हमने अपना अब तक का सबसे एडवांस्ड इमेज जेनरेटर GPT‑4o में बनाया है. नतीजा—ऐसी इमेज जेनरेशन जो न केवल खूबसूरत है, बल्कि उपयोगी भी है.
पहली गुफा चित्रकारी से लेकर आधुनिक इन्फोग्राफिक्स तक, मनुष्यों ने दृश्य चित्रण का उपयोग संवाद, प्रेरित करने और विश्लेषण के लिए किया है—सिर्फ सजावट के लिए नहीं. आज के जेनरेटिव मॉडल्स अवास्तविक और अद्भुत दृश्य उत्पन्न कर सकते हैं, लेकिन वे उन साधारण छवियों के साथ संघर्ष करते हैं जिनका उपयोग लोग जानकारी शेयर करने और बनाने के लिए करते हैं. लोगो से लेकर डायग्राम तक, इमेज तब सटीक अर्थ व्यक्त कर सकते हैं जब उन्हें उन प्रतीकों के साथ जोड़ा जाता है जो साझा भाषा और अनुभव को संदर्भित करते हैं.
GPT‑4o इमेज जेनरेशन टेक्स्ट को सटीक रूप से रेंडर करने, प्रॉम्प्ट्स को सही ढंग से फ़ॉलो करने, और 4o के अंतर्निहित जानकारी आधार और चैट कॉन्टेक्स्ट का उपयोग करने में उत्कृष्ट है—जिसमें अपलोड की गई इमेज़ों को बदलना या उन्हें दृश्य प्रेरणा के रूप में उपयोग करना शामिल है. ये क्षमताएँ आपको आपकी कल्पना के अनुसार सटीक इमेज बनाने में मदद करती हैं, जिससे आप विज़ुअल्स के माध्यम से अधिक प्रभावी ढंग से संवाद कर सकते हैं और इमेज जेनरेशन को एक सटीक और शक्तिशाली व्यावहारिक उपकरण में बदल देती हैं.
हमने अपने मॉडल को ऑनलाइन इमेज और पाठ के संयुक्त वितरण पर प्रशिक्षित किया, जिससे यह न केवल समझा जा सके कि इमेज का भाषा से क्या संबंध है, बल्कि यह भी कि वे एक-दूसरे से कैसे संबंधित हैं. एग्रेसिव पोस्ट-ट्रेनिंग के साथ मिलाकर, तैयार मॉडल में आश्चर्यजनक दृश्य प्रवाह है, जो उपयोगी, सुसंगत और कॉन्टेक्स्ट-सचेत इमेजेस जनरेट करने में सक्षम है.
एक तस्वीर हज़ार शब्दों के बराबर होती है, लेकिन सही जगह पर कुछ शब्द जनरेट करने से इमेज का अर्थ और गहरा हो सकता है. 4o की सटीक प्रतीकों और इमेजरी को मिलाने की क्षमता इमेज जेनरेशन को विज़ुअल कम्युनिकेशन के उपकरण में बदल देती है.
क्योंकि इमेज जेनरेशन अब GPT‑4o में नैटिव है, आप प्राकृतिक बातचीत के माध्यम से इमेज को परिष्कृत कर सकते हैं. GPT‑4o चैट कॉन्टेक्स्ट में इमेज और टेक्स्ट पर काम कर सकता है, और पूरी प्रक्रिया में निरंतरता सुनिश्चित करता है. उदाहरण के लिए, अगर आप एक वीडियो गेम कैरेक्टर डिज़ाइन कर रहे हैं, तो कैरेक्टर की शक्ल-सूरत कई पुनरावृत्तियों में भी एक जैसी बनी रहती है जब आप उसे परिष्कृत और प्रयोग करते हैं.
GPT‑4o की इमेज जेनरेशन विस्तृत प्रॉम्प्ट का ध्यानपूर्वक पालन करती है. जबकि अन्य सिस्टम लगभग 5-8 ऑब्जेक्ट्स पर अटक जाते हैं, GPT‑4o 10-20 विभिन्न ऑब्जेक्ट्स को संभाल सकता है. ऑब्जेक्ट्स को उनकी विशेषताओं और संबंधों से अधिक मज़बूती से जोड़ने से बेहतर नियंत्रण मिलता है.
GPT‑4o यूज़र द्वारा अपलोड की गई इमेज का विश्लेषण कर सकता है और उनकी जानकारी को अपने कॉन्टेक्स्ट में सहजता से जोड़कर इमेज जेनरेशन को सूचित करता है.
नेटिव इमेज जेनरेशन 4o को टेक्स्ट और इमेज के बीच अपनी जानकारी को लिंक करने में इनेबल करें, जिससे मॉडल अधिक स्मार्ट और प्रभावी लगता है.
कई तरह की इमेज शैली पर ट्रेनिंग से मॉडल को इमेज बनाएं या बदलने की क्षमता मिलती है, और यह उन्हें वास्तविक लगने लायक बना देता है.
हमारा मॉडल पूर्ण नहीं है. हम जानते हैं कि अभी कई सीमाएँ मौजूद हैं, जिन्हें हम शुरुआती लॉन्च के बाद मॉडल में सुधार करके दूर करेंगे.

हमने देखा है कि GPT‑4o कभी-कभी लंबी इमेजेज़, जैसे पोस्टर्स, को बहुत कसकर छांट देता है, विशेष रूप से नीचे के हिस्से में.
हमारे मॉडल स्पेक के अनुसार, हम रचनात्मक स्वतंत्रता को अधिकतम करने का लक्ष्य रखते हैं, जैसे गेम डेवलपमेंट, ऐतिहासिक अन्वेषण और शिक्षा जैसे मूल्यवान उपयोग मामलों का समर्थन करते हुए—साथ ही मज़बूत सुरक्षा मानकों को बनाए रखते हुए. साथ ही, उन अनुरोधों को ब्लॉक करना उतना ही महत्वपूर्ण है जो उन मानकों का उल्लंघन करते हैं. नीचे अतिरिक्त जोखिम क्षेत्रों का मूल्यांकन दिया गया है जहाँ हम सुरक्षित, उच्च-उपयोगिता वाली सामग्री को इनेबल करने और यूज़र के लिए व्यापक रचनात्मक अभिव्यक्ति का सपोर्ट करने पर काम कर रहे हैं.
C2PA और आंतरिक रिवर्सिबल सर्च के माध्यम से उत्पत्ति
सभी जनरेट की गई इमेज C2PA मेटाडेटा के साथ आती हैं, जो यह पहचान प्रदान करती हैं कि इमेज GPT‑4o से जनरेट की गई है, ताकि पारदर्शिता सुनिश्चित हो सके. हमने एक आंतरिक खोज उपकरण भी बनाया है जो पीढ़ियों के तकनीकी गुणों का उपयोग करके यह वेरिफ़ाई करने में मदद करता है कि सामग्री हमारे मॉडल से आई है या नहीं.
ग़लत चीज़ों को ब्लॉक करना
हम उन अनुरोधों को ब्लॉक करना जारी रख रहे हैं जिनसे जनरेट की गई इमेज़ हमारी कंटेंट पॉलिसी का उल्लंघन कर सकती हैं, जैसे बच्चों का यौन शोषण सामग्री और सेक्सुअल डीपफ़ेक्स. जब असली लोगों की इमेज कॉन्टेक्स्ट में होती हैं, तो हम इस पर कड़े प्रतिबंध लगाते हैं कि किस प्रकार की इमेज बनाई जा सकती हैं, विशेष रूप से नग्नता और ग्राफिक हिंसा के मामलों में मजबूत सुरक्षा उपाय होते हैं. किसी भी लॉन्च की तरह, सुरक्षा कभी समाप्त नहीं होती बल्कि यह निवेश का एक सतत क्षेत्र है. जैसे-जैसे हमें इस मॉडल के वास्तविक उपयोग के बारे में अधिक जानकारी मिलेगी, हम अपनी नीतियों को उसी अनुसार समायोजित करेंगे.
हमारे दृष्टिकोण के बारे में अधिक जानने के लिए, इमेज जेनरेशन GPT‑4o सिस्टम कार्ड के अडेंडम पर जाएं.
रीज़निंग का उपयोग करके सुरक्षा को सशक्त बनाना
हमारे डिलिबरेटिव एलाइन्मेंट कार्य के समान, हमने एक रीज़निंग LLM को प्रशिक्षित किया है ताकि यह मानव-लिखित और व्याख्यायित सेफ़्टी स्पेसिफिकेशन्स से सीधे काम कर सके. हमने विकास के दौरान इस रीज़निंग LLM का उपयोग किया ताकि यह हमें हमारी नीतियों में अस्पष्टताओं की पहचान करने और उन्हें दूर करने में मदद करे. हमारी मल्टीमोडल प्रगति और ChatGPT तथा Sora के लिए विकसित मौजूदा सुरक्षा तकनीकों के साथ मिलकर, यह हमें इनपुट टेक्स्ट और आउटपुट इमेज दोनों को हमारी नीतियों के अनुसार सीमित करने की अनुमति देता है.
आज से 4o इमेज जेनरेशन ChatGPT में डिफ़ॉल्ट इमेज जेनरेटर के रूप में Plus, Pro, Team और Free यूज़र्स के लिए रोल आउट हो रहा है, और जल्द ही Enterprise और Edu में भी उपलब्ध होगा. यह Sora में भी इस्तेमाल के लिए उपलब्ध है. जो लोग DALL·E के लिए अपने दिल में ख़ास जगह रखते हैं, वे इसे अभी भी एक डेडिकेटेड DALL·E GPT के ज़रिए एक्सेस कर सकते हैं.
डेवलपर्स जल्द ही API के ज़रिए GPT‑4o से इमेजेज़ जेनरेट कर पाएँगे, जिसका एक्सेस अगले कुछ हफ़्तों में रोल आउट होगा.
GPT‑4o का उपयोग करके इमेजेज़ बनाना और कस्टमाइज़ करना उतना ही आसान है जितना चैट करना—बस बताएँ कि आपको क्या चाहिए, जिसमें स्पेसिफ़िक्स जैसे आस्पेक्ट रेशियो, सटीक रंग (hex codes से) या ट्रांसपेरेंट बैकग्राउंड शामिल हो सकते हैं. क्योंकि यह मॉडल अधिक डीटेल वाली तस्वीरें बनाता है, इमेजेज़ को रेंडर होने में ज़्यादा समय लगता है—अक्सर एक मिनट तक.
लेखक
लीडरशिप
Gabriel Goh: इमेज जेनरेशन
Jackie Shannon: ChatGPT उत्पाद
Mengchao Zhong, Wayne Chang: ChatGPT इंजीनियरिंग
Rohan Sahai: Sora उत्पाद और इंजीनियरिंग
Brendan Quinn, Tomer Kaftan: इंफरेंस
Prafulla Dhariwal: मल्टीमॉडल संगठन
रिसर्च
मूलभूत अनुसंधान
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
मूल अनुसंधान
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
रिसर्च कंट्रीब्यूटर्स
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
मॉडल व्यवहार
Laurentia Romaniuk
मल्टीमोडल ऑर्गनाइज़ेशन
Andrew Gibiansky, Yang Lu
डेटा
डेटा लीड्स
Gildas Chabot, James Park Lennon
डेटा
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
मॉडरेटर्स
Hazel Byrne, Jennifer Luckenbill, Mariano López
ह्यूमन डेटा एडवाइज़र्स
Long Ouyang
स्केलिंग
इंफ़रेंस लीड्स
Brendan Quinn, Tomer Kaftan
इंफ़रेंस
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
लागू किया गया
ChatGPT प्रोडक्ट लीड
Jackie Shannon
ChatGPT इंजीनियरिंग लीड्स
Mengchao Zhong, Wayne Chang
प्रोडक्ट डिज़ाइन लीड
Matt Chan
डेटा साइंस
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora प्रोडक्ट लीड्स
Rohan Sahai, Wesam Manassra
Sora उत्पाद और इंजीनियरिंग
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
सुरक्षा
सेफ़्टी लीड
Somay Jain
सुरक्षा
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
स्ट्रैटेजी
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
मार्केटिंग और कॉम्स
कॉम्स और मार्केटिंग प्रमुख
Minnia Feng, Natalie Summers, Taya Christianson
कॉम्स
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
डिज़ाइन और रचनात्मकता
लीड्स
Kendra Rimbach, Veit Moeller
डिज़ाइन
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
विशेष धन्यवाद
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






