4o ઇમેજ જનરેશનનો પરિચય
ચોક્કસ, સચોટ અને ફોટોરિયલિસ્ટિક આઉટપુટ આપી શકતા નેટિવલી મલ્ટીમોડલ મોડલ સાથે ઉપયોગી અને મૂલ્યવાન ઇમેજ જનરેશનને અનલૉક કરવું.
OpenAI માં, અમે લાંબા સમયથી માનતા આવ્યા છીએ કે ઇમેજ જનરેશન અમારા ભાષા મોડેલ્સની મુખ્ય ક્ષમતા હોવી જોઈએ. તેથી જ અમે GPT‑4o માં અત્યાર સુધીનો અમારો સૌથી અદ્યતન ઇમેજ જનરેટર બનાવ્યો છે. પરિણામ—એવું ઇમેજ જનરેશન જે માત્ર સુંદર જ નહીં, પરંતુ ઉપયોગી પણ છે.
પ્રથમ ગુફા ચિત્રોથી લઈને આધુનિક ઇન્ફોગ્રાફિક્સ સુધી, માનવોએ દૃશ્ય કલ્પનાઓનો ઉપયોગ માત્ર સજાવટ માટે નહીં, પરંતુ સંદેશ આપવા, મનાવવા અને વિશ્લેષણ કરવા માટે કર્યો છે. આજના જનરેટિવ મોડેલ્સ અદ્ભુત અને અલૌકિક દૃશ્યો રચી શકે છે, પરંતુ લોકો માહિતી વહેંચવા અને બનાવવા માટે જે કાર્યકારી દૃશ્યો વાપરે છે તેમાં તેઓ સંઘર્ષ કરે છે. લોગોથી લઈને ડાયગ્રામ્સ સુધી, જ્યારે ઇમેજને એવા symbols સાથે વિસ્તૃત કરવામાં આવે છે જે સંયુક્ત ભાષા અને અનુભવનો સંદર્ભ આપે છે, ત્યારે તે ચોક્કસ અર્થ પહોંચાડી શકે છે.
GPT‑4o ઇમેજ જનરેશન ટેક્સ્ટને ચોક્કસ રીતે render કરવામાં, પ્રોમ્પ્ટ્સને સચોટ રીતે અનુસરવામાં, અને 4o ના મૂળભૂત જ્ઞાનભંડાર તથા ચેટ સંદર્ભનો લાભ લેવા માં ઉત્તમ છે—જેમાં અપલોડ કરેલી ઇમેજને રૂપાંતરિત કરવી અથવા દૃશ્ય પ્રેરણા તરીકે ઉપયોગ કરવો શામેલ છે. આ ક્ષમતાઓ તમને મનમાં હોય એવી જ ઇમેજ બનાવવી વધુ સરળ બનાવે છે, visuals દ્વારા વધુ અસરકારક રીતે સંદેશ આપવા મદદ કરે છે, અને ઇમેજ જનરેશનને ચોકસાઇ અને શક્તિ સાથે પ્રાયોગિક સાધન તરીકે આગળ વધારે છે.
અમે અમારા મોડેલ્સને ઑનલાઇન ઇમેજ અને ટેક્સ્ટના સંયુક્ત વિતરણ પર ટ્રેન કર્યા છે, જેથી માત્ર ઇમેજ ભાષા સાથે કેવી રીતે સંબંધિત છે તે જ નહીં, પણ તેઓ એકબીજા સાથે કેવી રીતે સંબંધિત છે તે પણ શીખી શકાય. આક્રમક post-training સાથે મળીને, પરિણામે મળેલું મોડલ આશ્ચર્યજનક દૃશ્ય પ્રવાહિતા ધરાવે છે, અને ઉપયોગી, સાતત્યપૂર્ણ તથા સંદર્ભ-જાગૃત ઇમેજ જનરેટ કરવાની ક્ષમતા ધરાવે છે.
એક ચિત્ર હજાર શબ્દો જેટલું મૂલ્યવાન હોઈ શકે છે, પરંતુ ક્યારેક યોગ્ય જગ્યાએ થોડા શબ્દો જનરેટ કરવાથી ઇમેજનો અર્થ વધુ ઊંચો થઈ શકે છે. 4o ની imagery સાથે ચોક્કસ symbols મિશ્રિત કરવાની ક્ષમતા ઇમેજ જનરેશનને દૃશ્ય સંચાર માટેના સાધનમાં ફેરવે છે.
કારણ કે ઇમેજ જનરેશન હવે GPT‑4o માં નેટિવ છે, તમે સ્વાભાવિક વાતચીત દ્વારા ઇમેજને વધુ સુધારી શકો છો. GPT‑4o ચેટના સંદર્ભમાં ઇમેજ અને ટેક્સ્ટ પર આધારિત બની શકે છે, જે સમગ્ર પ્રક્રિયામાં સાતત્ય જાળવે છે. ઉદાહરણ તરીકે, જો તમે વિડિયો ગેમનું પાત્ર ડિઝાઇન કરી રહ્યા હો, તો તમે સુધારો અને પ્રયોગ કરો તેમ અનેક iterations દરમિયાન પાત્રનું દેખાવ સુસંગત રહે છે.
GPT‑4o નું ઇમેજ જનરેશન વિગતવાર પ્રોમ્પ્ટ્સને સૂક્ષ્મ ધ્યાન સાથે અનુસરે છે. જ્યારે અન્ય સિસ્ટમ્સ ~5-8 વસ્તુઓ સાથે સંઘર્ષ કરે છે, ત્યારે GPT‑4o 10-20 સુધી વિવિધ વસ્તુઓ સંભાળી શકે છે. વસ્તુઓને તેમના લક્ષણો અને સંબંધો સાથેનું વધુ કડક બાઇન્ડિંગ વધુ સારું નિયંત્રણ આપે છે.
GPT‑4o વપરાશકર્તા દ્વારા અપલોડ કરેલી ઇમેજનું વિશ્લેષણ કરી શકે છે અને તેમાંથી શીખી શકે છે, અને ઇમેજ જનરેશનને માર્ગદર્શન આપવા માટે તેમની વિગતોને તેના સંદર્ભમાં સરળતાથી એકીકૃત કરે છે.
નેટિવ ઇમેજ જનરેશન 4o ને ટેક્સ્ટ અને ઇમેજ વચ્ચેનું તેનું જ્ઞાન જોડવાની ક્ષમતા આપે છે, જેના પરિણામે મોડલ વધુ બુદ્ધિશાળી અને વધુ કાર્યક્ષમ લાગે છે.
ઇમેજની શૈલીઓની વિશાળ વિવિધતા દર્શાવતી ઇમેજ પરનું ટ્રેનિંગ મોડલને વિશ્વસનીય રીતે ઇમેજ બનાવવા અથવા રૂપાંતરિત કરવાની મંજૂરી આપે છે.
અમારું મોડલ સંપૂર્ણ નથી. હાલ અમને અનેક મર્યાદાઓની જાણ છે, જેને પ્રારંભિક લોન્ચ પછી મોડલ સુધારાઓ દ્વારા ઉકેલવા માટે અમે કામ કરીશું.

અમે ધ્યાન આપ્યું છે કે GPT‑4o ક્યારેક પોસ્ટર જેવી લાંબી ઇમેજને ખૂબ જ ટાઇટ રીતે crop કરી શકે છે, ખાસ કરીને નીચેના ભાગની નજીક.
અમારા મોડલ સ્પેક મુજબ, અમે ગેમ ડેવલપમેન્ટ, ઐતિહાસિક અન્વેષણ અને શિક્ષણ જેવા મૂલ્યવાન ઉપયોગકેસને સમર્થન આપીને સર્જનાત્મક સ્વતંત્રતાને મહત્તમ કરવાનો ઉદ્દેશ રાખીએ છીએ—સાથે જ મજબૂત સુરક્ષા ધોરણો જાળવી રાખીએ છીએ. તે જ સમયે, આ ધોરણોનું ઉલ્લંઘન કરતી વિનંતીઓને અવરોધિત કરવું પહેલાની જેમ જ મહત્વનું છે. નીચે વધારાના જોખમ ક્ષેત્રોના મૂલ્યાંકન છે, જ્યાં અમે સુરક્ષિત, ઉચ્ચ-ઉપયોગી કન્ટેન્ટને સક્ષમ કરવા અને વપરાશકર્તાઓ માટે વ્યાપક સર્જનાત્મક અભિવ્યક્તિને સમર્થન આપવા પર કામ કરી રહ્યા છીએ.
C2PA અને આંતરિક reversible search દ્વારા provenance
બધી જનરેટ થયેલી ઇમેજ C2PA metadata સાથે આવે છે, જે પારદર્શિતા આપવા માટે ઇમેજ GPT‑4o તરફથી આવી છે તે ઓળખશે. અમે એક આંતરિક શોધ સાધન પણ બનાવ્યું છે જે જનરેશનના ટેક્નિકલ લક્ષણોનો ઉપયોગ કરીને કન્ટેન્ટ અમારા મોડલમાંથી આવ્યું છે કે નહીં તે ચકાસવામાં મદદ કરે છે.
ખરાબ વસ્તુઓને બ્લોક કરવી
અમે અમારી કન્ટેન્ટ નીતિઓનું ઉલ્લંઘન કરતી હોઈ શકે તેવી જનરેટેડ ઇમેજની વિનંતીઓને બ્લોક કરવાનું ચાલુ રાખી રહ્યા છીએ, જેમ કે બાળ યૌન શોષણ સામગ્રી અને sexual deepfakes. જ્યારે વાસ્તવિક લોકોની ઇમેજ સંદર્ભમાં હોય, ત્યારે કઈ પ્રકારની imagery બનાવી શકાય તે અંગે અમારી વધુ કડક મર્યાદાઓ છે, ખાસ કરીને નગ્નતા અને ગ્રાફિક હિંસા આસપાસ ખૂબ મજબૂત સુરક્ષા ઉપાયો સાથે. કોઈપણ લોન્ચની જેમ, સુરક્ષાનું કામ ક્યારેય પૂર્ણ થતું નથી અને તે સતત રોકાણનું ક્ષેત્ર છે. વાસ્તવિક દુનિયામાં આ મોડલના ઉપયોગ વિશે અમે વધુ શીખીશું તેમ, અમે અમારી નીતિઓને તે મુજબ સમાયોજિત કરીશું.
અમારા અભિગમ વિશે વધુ જાણવા માટે, ઇમેજ જનરેશન GPT‑4o સિસ્ટમ કાર્ડ માટેનું પરિશિષ્ટ જુઓ.
સુરક્ષાને શક્તિ આપવા માટે reasoning નો ઉપયોગ
અમારા વિચાર-વિમર્શ આધારિત અલાઇનમેન્ટ કાર્ય જેવું જ, અમે માનવો દ્વારા લખાયેલ અને અર્થઘટન કરી શકાય તેવી સુરક્ષા સ્પેસિફિકેશન્સ પરથી સીધું કામ કરવા માટે એક reasoning LLM ને ટ્રેન કર્યું છે. વિકાસ દરમિયાન અમે આ reasoning LLM નો ઉપયોગ અમારી નીતિઓમાં રહેલી અસ્પષ્ટતાઓ ઓળખવામાં અને દૂર કરવામાં મદદ માટે કર્યો. ChatGPT અને Sora માટે વિકસાવવામાં આવેલી અમારી મલ્ટીમોડલ પ્રગતિઓ અને વર્તમાન સુરક્ષા તકનીકો સાથે મળીને, આ અમને અમારી નીતિઓ સામે ઇનપુટ ટેક્સ્ટ અને આઉટપુટ ઇમેજ બંનેને મોડરેટ કરવાની મંજૂરી આપે છે.
4o ઇમેજ જનરેશન આજથી Plus, Pro, Team અને Free વપરાશકર્તાઓ માટે ChatGPT માં ડિફૉલ્ટ ઇમેજ જનરેટર તરીકે રોલ આઉટ થઈ રહ્યું છે, અને Enterprise તથા Edu માટે ઍક્સેસ ટૂંક સમયમાં આવશે. તે Sora માં ઉપયોગ માટે પણ ઉપલબ્ધ છે. જેમના દિલમાં DALL·E માટે ખાસ સ્થાન છે, તેઓ હજી પણ સમર્પિત DALL·E GPT દ્વારા તેને ઍક્સેસ કરી શકે છે.
ડેવલપર્સ ટૂંક સમયમાં API દ્વારા GPT‑4o સાથે ઇમેજ જનરેટ કરી શકશે, અને આગામી થોડા અઠવાડિયામાં ઍક્સેસ રોલ આઉટ થશે.
ઇમેજ બનાવવી અને કસ્ટમાઇઝ કરવી GPT‑4o સાથે ચેટિંગ જેટલી સરળ છે - ફક્ત તમને શું જોઈએ છે તે વર્ણવો, જેમાં aspect ratio, hex codes વડે ચોક્કસ રંગો, અથવા transparent background જેવી વિગતો સામેલ હોય. કારણ કે આ મોડલ વધુ વિગતવાર તસવીરો બનાવે છે, ઇમેજને render થવામાં વધુ સમય લાગે છે, ઘણીવાર એક મિનિટ સુધી.
લેખક
નેતૃત્વ
Gabriel Goh: ઇમેજ જનરેશન
Jackie Shannon: ChatGPT પ્રોડક્ટ
Mengchao Zhong, Wayne Chang: ChatGPT એન્જિનિયરિંગ
Rohan Sahai: Sora પ્રોડક્ટ અને એન્જિનિયરિંગ
Brendan Quinn, Tomer Kaftan: ઇન્ફરન્સ
Prafulla Dhariwal: મલ્ટીમોડલ ઓર્ગેનાઇઝેશન
રિસર્ચ
ફાઉન્ડેશનલ રિસર્ચ
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
કોર રિસર્ચ
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
રિસર્ચ યોગદાનકર્તાઓ
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
મોડલ બેહેવિયર
Laurentia Romaniuk
મલ્ટીમોડલ ઓર્ગેનાઇઝેશન
Andrew Gibiansky, Yang Lu
ડેટા
ડેટા લીડ્સ
Gildas Chabot, James Park Lennon
ડેટા
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
મોડરેટર્સ
Hazel Byrne, Jennifer Luckenbill, Mariano López
હ્યુમન ડેટા એડવાઇઝર્સ
Long Ouyang
સ્કેલિંગ
ઇન્ફરન્સ લીડ્સ
Brendan Quinn, Tomer Kaftan
ઇન્ફરન્સ
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
એપ્લાઇડ
ChatGPT પ્રોડક્ટ લીડ
Jackie Shannon
ChatGPT એન્જિનિયરિંગ લીડ્સ
Mengchao Zhong, Wayne Chang
પ્રોડક્ટ ડિઝાઇન લીડ
Matt Chan
ડેટા સાયન્સ
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora પ્રોડક્ટ લીડ્સ
Rohan Sahai, Wesam Manassra
Sora પ્રોડક્ટ અને એન્જિનિયરિંગ
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
સુરક્ષા
સુરક્ષા લીડ
Somay Jain
સુરક્ષા
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
સ્ટ્રેટેજી
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
માર્કેટિંગ અને કોમ્સ
કોમ્સ અને માર્કેટિંગ લીડ્સ
Minnia Feng, Natalie Summers, Taya Christianson
કોમ્સ
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
ડિઝાઇન અને ક્રિએટિવ
લીડ્સ
Kendra Rimbach, Veit Moeller
ડિઝાઇન
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
વિશેષ આભાર
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






