4o-ის სურათის გენერირების წარდგენა
სასარგებლო და ღირებული სურათის გენერირების გახსნა ნატიურად მულტიმოდალური მოდელით, რომელსაც შეუძლია ზუსტი, აკურატული და ფოტორეალისტური შედეგების შექმნა.
OpenAI-ში დიდი ხანია გვჯერა, რომ სურათის გენერირება ჩვენი ენობრივი მოდელების ძირითადი შესაძლებლობა უნდა იყოს. ამიტომაც ჩავაშენეთ ჩვენი დღემდე ყველაზე განვითარებული სურათის გენერატორი GPT‑4o-ში. შედეგი — სურათის გენერირება, რომელიც არა მხოლოდ ლამაზია, არამედ სასარგებლოც.
პირველი მღვიმის ნახატებიდან თანამედროვე ინფოგრაფიკებამდე ადამიანები ვიზუალურ გამოსახულებებს იყენებდნენ კომუნიკაციისთვის, დარწმუნებისთვის და ანალიზისთვის — და არა მხოლოდ დეკორაციისთვის. დღევანდელ გენერაციული მოდელები შეძლებენ სიურეალისტური, თვალწარმტაცი სცენების შექმნას, მაგრამ უჭირთ იმ სამუშაო გამოსახულებებთან გამკლავება, რომლებსაც ადამიანები ინფორმაციის გასაზიარებლად და შესაქმნელად იყენებენ. ლოგოებიდან დიაგრამებამდე, სურათებს შეუძლიათ ზუსტი მნიშვნელობის გადმოცემა, როცა ისინი გამდიდრებულია სიმბოლოებით, რომლებიც საერთო ენასა და გამოცდილებას უკავშირდება.
GPT‑4o‑ის სურათის გენერირება გამოირჩევა ტექსტის ზუსტი რენდერინგით, მოთხოვნების ზუსტად შესრულებით და 4o-ის თანდაყოლილი ცოდნის ბაზისა და ჩატის კონტექსტის გამოყენებით — მათ შორის ატვირთული სურათების გარდაქმნით ან მათი ვიზუალურ ინსპირაციად გამოყენებით. ეს შესაძლებლობები აადვილებს ზუსტად იმ სურათის შექმნას, რასაც წარმოიდგენთ, გეხმარებათ ვიზუალების მეშვეობით უფრო ეფექტურად იკომუნიკაციოთ და სურათის გენერირებას სიზუსტისა და ძალის მქონე პრაქტიკულ ინსტრუმენტად აქცევს.
ჩვენი მოდელები ვავარჯიშეთ ონლაინ სურათებისა და ტექსტის ერთობლივ განაწილებაზე, რის შედეგადაც ისწავლეს არა მხოლოდ ის, თუ როგორ უკავშირდება სურათები ენას, არამედ ისიც, თუ როგორ უკავშირდებიან ისინი ერთმანეთს. აგრესიულ პოსტ-ტრენინგთან ერთად, მიღებულ მოდელს აქვს გასაოცარი ვიზუალური გამართულობა და შეუძლია შექმნას სასარგებლო, თანმიმდევრული და კონტექსტის მცოდნე სურათები.
ამბობენ, ერთი სურათი ათას სიტყვად ღირს, მაგრამ ზოგჯერ სწორი ადგილისთვის რამდენიმე სიტყვის გენერირებამ შეიძლება სურათის მნიშვნელობა გაზარდოს. 4o-ის უნარი, ზუსტი სიმბოლოები გამოსახულებას შეუთავსოს, სურათის გენერირებას ვიზუალური კომუნიკაციის ინსტრუმენტად აქცევს.
რადგან სურათის გენერირება ახლა GPT‑4o‑სთვის ნატიურია, შეგიძლიათ სურათები ბუნებრივი საუბრის მეშვეობით დახვეწოთ. GPT‑4o‑ს შეუძლია ჩატის კონტექსტში სურათებსა და ტექსტზე დაყრდნობით განავითაროს შედეგი და უზრუნველყოს თანმიმდევრულობა. მაგალითად, თუ ვიდეოთამაშის პერსონაჟს ქმნით, მისი გარეგნობა მრავალ იტერაციაში თანმიმდევრული დარჩება, სანამ ხვეწთ და ექსპერიმენტებს ატარებთ.
GPT‑4o-ის სურათის გენერირება დეტალურ მოთხოვნებს ყურადღებით მიჰყვება. მაშინ როცა სხვა სისტემებს ~5-8 ობიექტთან უჭირთ, GPT‑4o‑ს შეუძლია 10-20-მდე განსხვავებული ობიექტის დამუშავება. ობიექტების მათი თვისებებსა და ურთიერთობებთან უფრო მჭიდრო მიბმა უკეთეს კონტროლს უზრუნველყოფს.
GPT‑4o‑ს შეუძლია გააანალიზოს და ისწავლოს მომხმარებლის მიერ ატვირთული სურათებიდან, მათი დეტალები შეუფერხებლად შეიტანოს საკუთარ კონტექსტში და ამით სურათის გენერირება წარმართოს.
ნატიური სურათის გენერირება 4o-ს საშუალებას აძლევს, ტექსტსა და სურათებს შორის თავისი ცოდნა დააკავშიროს, რის შედეგადაც მიიღება მოდელი, რომელიც უფრო ჭკვიანი და ეფექტური ჩანს.
სურათის სტილთა უზარმაზარი მრავალფეროვნების ამსახველ სურათებზე სწავლება მოდელს საშუალებას აძლევს, დამაჯერებლად შექმნას ან გარდაქმნას სურათები.
ჩვენი მოდელი სრულყოფილი არ არის. ამ ეტაპზე ვიცით რამდენიმე შეზღუდვის შესახებ, რომელთა მოგვარებაზეც საწყისი გაშვების შემდეგ მოდელის გაუმჯობესებებით ვიმუშავებთ.

შევამჩნიეთ, რომ GPT‑4o‑მ ზოგჯერ შეიძლება გრძელი სურათები, მაგალითად პოსტერები, ზედმეტად მჭიდროდ მოჭრას, განსაკუთრებით ქვედა ნაწილთან.
ჩვენი მოდელის სპეციფიკაციის შესაბამისად, მიზნად ვისახავთ კრეატიული თავისუფლების მაქსიმიზაციას ისეთი ღირებული გამოყენების შემთხვევების მხარდაჭერით, როგორიცაა თამაშების განვითარება, ისტორიული კვლევა და განათლება — ძლიერი უსაფრთხოების სტანდარტების შენარჩუნებით. ამავე დროს, კვლავაც ისეთივე მნიშვნელოვანია იმ მოთხოვნების დაბლოკვა, რომლებიც ამ სტანდარტებს არღვევს. ქვემოთ მოცემულია დამატებითი რისკის სფეროების შეფასებები, სადაც ვმუშაობთ უსაფრთხო და მაღალი სარგებლიანობის მქონე კონტენტის უზრუნველყოფაზე და მომხმარებლებისთვის უფრო ფართო კრეატიული გამოხატვის მხარდაჭერაზე.
C2PA-ისა და შიდა შექცევადი ძიების მეშვეობით წარმოშობის დადგენა
ყველა გენერირებულ სურათს ახლავს C2PA მეტამონაცემები, რომლებიც სურათს GPT‑4o‑დან წარმოშობილად დააიდენტიფიცირებს, გამჭვირვალობის უზრუნველსაყოფად. ასევე შევქმენით შიდა საძიებო ინსტრუმენტი, რომელიც გენერაციების ტექნიკურ ატრიბუტებს იყენებს იმის დასადასტურებლად, მოვიდა თუ არა კონტენტი ჩვენი მოდელიდან.
ცუდი შიგთავსის დაბლოკვა
ვაგრძელებთ გენერირებული სურათების იმ მოთხოვნების დაბლოკვას, რომლებმაც შეიძლება ჩვენი კონტენტის პოლიტიკები დაარღვიოს, მაგალითად ბავშვთა სექსუალური ძალადობის მასალები და სექსუალური deepfake-ები. როცა კონტექსტში რეალური ადამიანების სურათებია, გვაქვს გამკაცრებული შეზღუდვები იმაზე, თუ რა ტიპის გამოსახულება შეიძლება შეიქმნას, განსაკუთრებით ძლიერი დამცავი ზომებით სიშიშვლისა და გრაფიკული ძალადობის მიმართ. როგორც ყველა გაშვების შემთხვევაში, უსაფრთხოება არასოდეს არის დასრულებული და მუდმივი ინვესტირების სფეროა. როცა ამ მოდელის რეალურ გამოყენებაზე მეტს ვისწავლით, შესაბამისად შევცვლით ჩვენს პოლიტიკებს.
ჩვენი მიდგომის შესახებ მეტის გასაგებად, იხილეთ სურათის გენერირების დამატება GPT‑4o‑ის სისტემურ ბარათზე.
უსაფრთხოების გასაძლიერებლად მსჯელობის გამოყენება
ჩვენი გააზრებული შესაბამისობა-ს მსგავსად, ჩვენ ვავარჯიშეთ მსჯელობაზე დაფუძნებული LLM, რომელიც უშუალოდ ადამიანების მიერ დაწერილი და ინტერპრეტირებადი უსაფრთხოების სპეციფიკაციებით მუშაობს. განვითარების დროს ეს მსჯელობაზე დაფუძნებული LLM გამოვიყენეთ, რათა დაგვეხმარა ჩვენი პოლიტიკების ბუნდოვანებების იდენტიფიცირებასა და მოგვარებაში. ჩვენს მულტიმოდალურ წინსვლასა და ChatGPT‑სა და Sora-სთვის უკვე შემუშავებულ უსაფრთხოების ტექნიკებთან ერთად, ეს საშუალებას გვაძლევს მოდერაცია გავუწიოთ როგორც შეყვანილ ტექსტს, ისე გამომავალ სურათებს ჩვენი პოლიტიკების შესაბამისად.
4o-ის სურათის გენერირება დღეიდან ეტაპობრივად ხდება Plus, Pro, Team და Free მომხმარებლებისთვის, როგორც ChatGPT‑ში ნაგულისხმევი სურათის გენერატორი, ხოლო Enterprise-სა და Edu-ზე წვდომა მალე დაემატება. მისი გამოყენება Sora-შიც არის შესაძლებელი. მათთვის, ვისაც DALL·E განსაკუთრებულად უყვარს, მასზე წვდომა კვლავ შესაძლებელია ცალკე DALL·E GPT‑ის მეშვეობით.
დეველოპერებს მალე შეეძლებათ API-ის საშუალებით GPT‑4o‑ით სურათების გენერირება, ხოლო წვდომა უახლოეს რამდენიმე კვირაში ეტაპობრივად გაიშლება.
სურათების შექმნა და მორგება ისეთივე მარტივია, როგორც GPT‑4o‑სთან ჩატი — უბრალოდ აღწერეთ, რა გჭირდებათ, მათ შორის ისეთი დეტალებიც, როგორიცაა ასპექტის თანაფარდობა, ზუსტი ფერები hex კოდებით ან გამჭვირვალე ფონი. რადგან ეს მოდელი უფრო დეტალურ სურათებს ქმნის, რენდერს მეტი დრო სჭირდება, ხშირად ერთ წუთამდეც.
ავტორი
ლიდერობა
Gabriel Goh: სურათის გენერირება
Jackie Shannon: ChatGPT პროდუქტი
Mengchao Zhong, Wayne Chang: ChatGPT ინჟინერია
Rohan Sahai: Sora პროდუქტი და ინჟინერია
Brendan Quinn, Tomer Kaftan: ინფერენსი
Prafulla Dhariwal: მულტიმოდალური ორგანიზაცია
კვლევა
ფუნდამენტური კვლევა
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
ძირითადი კვლევა
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
კვლევის კონტრიბუტორები
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
მოდელის ქცევა
Laurentia Romaniuk
მულტიმოდალური ორგანიზაცია
Andrew Gibiansky, Yang Lu
მონაცემები
მონაცემების ლიდერები
Gildas Chabot, James Park Lennon
მონაცემები
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
მოდერატორები
Hazel Byrne, Jennifer Luckenbill, Mariano López
ადამიანური მონაცემების მრჩევლები
Long Ouyang
მასშტაბირება
ინფერენსის ლიდერები
Brendan Quinn, Tomer Kaftan
ინფერენსი
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
აპლიკაციური
ChatGPT პროდუქტის ლიდერი
Jackie Shannon
ChatGPT ინჟინერიის ლიდერები
Mengchao Zhong, Wayne Chang
პროდუქტის დიზაინის ლიდერი
Matt Chan
მონაცემთა მეცნიერება
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora პროდუქტის ლიდერები
Rohan Sahai, Wesam Manassra
Sora პროდუქტი და ინჟინერია
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
უსაფრთხოება
უსაფრთხოების ლიდერი
Somay Jain
უსაფრთხოება
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
სტრატეგია
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
მარკეტინგი და კომუნიკაციები
კომუნიკაციებისა და მარკეტინგის ლიდერები
Minnia Feng, Natalie Summers, Taya Christianson
კომუნიკაციები
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
დიზაინი და კრეატივი
ლიდერები
Kendra Rimbach, Veit Moeller
დიზაინი
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
განსაკუთრებული მადლობა
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






