Представљамо 4o генерисање слика
Откључавање корисног и вредног генерисања слика уз изворно мултимодални модел способан за прецизне, тачне и фотореалистичне резултате.
У OpenAI-у већ дуго верујемо да генерисање слика треба да буде примарна могућност наших језичких модела. Зато смо наш најнапреднији генератор слика до сада уградили у GPT‑4o. Резултат — генерисање слика које није само лепо, већ и корисно.
Од првих пећинских слика до савремених инфографика, људи користе визуелне приказе да комуницирају, убеђују и анализирају — не само да украшавају. Данашњи генеративни модели могу да дочарају надреалне, задивљујуће сцене, али имају потешкоћа са практичним сликама које људи користе за размену и стварање информација. Од логотипа до дијаграма, слике могу пренети прецизно значење када су допуњене симболима који упућују на заједнички језик и искуство.
GPT‑4o генерисање слика истиче се по тачном приказу текста, прецизном праћењу инструкција и коришћењу 4o-ове урођене базе знања и контекста ћаскања — укључујући трансформацију отпремљених слика или њихово коришћење као визуелне инспирације. Ове могућности олакшавају креирање управо оне слике коју замишљате, помажући вам да ефикасније комуницирате кроз визуеле и унапређујући генерисање слика у практичан алат са прецизношћу и снагом.
Наше моделе смо обучавали на заједничкој расподели слика и текста са интернета, учећи не само како су слике повезане са језиком, већ и како су повезане међусобно. У комбинацији са интензивним дообучавањем, добијени модел има изненађујућу визуелну течност и може да генерише слике које су корисне, доследне и свесне контекста.
Слика вреди хиљаду речи, али понекад генерисање неколико речи на правом месту може да подигне значење слике. Способност 4o да спаја прецизне симболе са сликама претвара генерисање слика у алат за визуелну комуникацију.
Пошто је генерисање слика сада изворно у GPT‑4o, можете да дорађујете слике кроз природан разговор. GPT‑4o може да надограђује слике и текст у контексту ћаскања, обезбеђујући доследност током целог процеса. На пример, ако дизајнирате лик за видео-игру, изглед лика остаје усклађен кроз више итерација док га дорађујете и експериментишете.
Генерисање слика у GPT‑4o прати детаљне инструкције уз пажњу према детаљима. Док други системи имају потешкоћа са око 5–8 објеката, GPT‑4o може да обради до 10–20 различитих објеката. Чвршће повезивање објеката са њиховим особинама и односима омогућава бољу контролу.
GPT‑4o може да анализира и учи из слика које корисници отпреме, неприметно укључујући њихове детаље у свој контекст како би усмерио генерисање слика.
Изворно генерисање слика омогућава 4o да повезује своје знање између текста и слика, што резултира моделом који делује паметније и ефикасније.
Обука на сликама које одражавају огромну разноликост стилова слика омогућава моделу да уверљиво креира или трансформише слике.
Наш модел није савршен. Свесни смо више ограничења у овом тренутку, на чијем ћемо отклањању радити кроз побољшања модела након почетног лансирања.

Приметили смо да GPT‑4o повремено може сувише тесно да исече дуже слике, попут постера, нарочито при дну.
У складу са нашим спецификацијама модела, настојимо да максимално проширимо креативну слободу подржавањем вредних случајева употребе као што су развој игара, историјска истраживања и образовање — уз одржавање високих безбедносних стандарда. Истовремено, и даље је подједнако важно блокирати захтеве који крше те стандарде. У наставку су процене додатних области ризика на којима радимо како бисмо омогућили безбедан, високо користан садржај и подржали шире креативно изражавање корисника.
Порекло путем C2PA и интерне реверзибилне претраге
Све генерисане слике долазе са C2PA метаподацима, који ће означити слику као насталу из GPT‑4o, ради транспарентности. Направили смо и интерни алат за претрагу који користи техничке атрибуте генерација како би помогао да се провери да ли садржај потиче од нашег модела.
Блокирање лоших ствари
Настављамо да блокирамо захтеве за генерисане слике који могу кршити наше политике садржаја, као што су материјали о сексуалном злостављању деце и сексуални дипфејкови. Када су слике стварних људи у контексту, имамо пооштрена ограничења у погледу тога каква врста приказа може бити креирана, уз нарочито снажне заштитне мере око нагости и експлицитног насиља. Као и код сваког лансирања, безбедност никада није завршен посао, већ стална област улагања. Како будемо сазнавали више о стварној употреби овог модела, у складу с тим ћемо прилагођавати и наше политике.
Више о нашем приступу можете прочитати у документу о генерисању слика додатак GPT‑4o системској картици.
Коришћење резоновања за унапређење безбедности
Слично нашем раду на пажљивом поравнању, обучили смо велики језички модел (LLM) за резоновање да ради директно на основу безбедносних спецификација које су написали људи и које су разумљиве. Овај LLM за резоновање користили смо током развоја како би нам помогао да уочимо и разрешимо нејасноће у нашим политикама. Заједно са нашим мултимодалним напретком и постојећим безбедносним техникама развијеним за ChatGPT и Sora, то нам омогућава да модерирамо и улазни текст и излазне слике у складу са нашим политикама.
Генерисање слика у 4o почиње да се уводи од данас за кориснике Plus, Pro, Team и Free као подразумевани генератор слика у ChatGPT‑у, а приступ ускоро стиже и за Enterprise и Edu. Доступно је и за коришћење у Sora. За оне којима DALL·E заузима посебно место у срцу, и даље му се може приступити преко наменског DALL·E GPT‑а.
Програмери ће ускоро моћи да генеришу слике помоћу GPT‑4o преко API-ја, а приступ ће се уводити током наредних неколико недеља.
Прављење и прилагођавање слика једноставно је као ћаскање уз GPT‑4o — само опишите шта вам треба, укључујући детаље као што су однос страница, тачне боје помоћу хекс-кодова или провидна позадина. Пошто овај модел прави детаљније слике, за приказивање је потребно више времена, често и до једног минута.
Аутор
Руководство
Gabriel Goh: Генерисање слика
Jackie Shannon: ChatGPT производ
Mengchao Zhong, Wayne Chang: ChatGPT инжењеринг
Rohan Sahai: Sora производ и инжењеринг
Brendan Quinn, Tomer Kaftan: Инференција
Prafulla Dhariwal: Мултимодална организација
Истраживање
Основно истраживање
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Језгро истраживања
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Истраживачки сарадници
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Понашање модела
Laurentia Romaniuk
Мултимодална организација
Andrew Gibiansky, Yang Lu
Подаци
Водећи за податке
Gildas Chabot, James Park Lennon
Подаци
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Модератори
Hazel Byrne, Jennifer Luckenbill, Mariano López
Саветници за људске податке
Long Ouyang
Скалирање
Водећи за инференцију
Brendan Quinn, Tomer Kaftan
Инференција
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Примењено
Водећи за ChatGPT производ
Jackie Shannon
Водећи за ChatGPT инжењеринг
Mengchao Zhong, Wayne Chang
Водећи за дизајн производа
Matt Chan
Наука о подацима
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Водећи за Sora производ
Rohan Sahai, Wesam Manassra
Sora производ и инжењеринг
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Безбедност
Водећи за безбедност
Somay Jain
Безбедност
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Стратегија
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Маркетинг и комуникације
Водећи за комуникације и маркетинг
Minnia Feng, Natalie Summers, Taya Christianson
Комуникације
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Дизајн и креатива
Водећи
Kendra Rimbach, Veit Moeller
Дизајн
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Посебна захвалност
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






