Iepazīstinām ar 4o Image Generation
Atbloķējot noderīgu un vērtīgu attēlu ģenerēšanu ar dabiski multimodālu modeli, kas spēj nodrošināt precīzus, akurātus, fotoreālistiskus rezultātus.
OpenAI mēs jau sen uzskatām, ka attēlu ģenerēšanai vajadzētu būt mūsu valodu modeļu galvenajai spējai. Tāpēc mēs esam radījuši mūsu līdz šim modernāko attēlu ģeneratoru GPT‑4o. Rezultāts — ne tikai skaistu, bet arī noderīgu attēlu ģenerēšana.
No pirmajiem alu gleznojumiem līdz mūsdienu infografikām cilvēki ir izmantojuši vizuālos tēlus, lai sazinātos, pārliecinātu viens otru un analizētu, nevis tikai dekorācijai. Mūsdienu ģeneratīvie modeļi var uzburt sirreālas, elpu aizraujošas ainas, bet tiem ir grūtības ar ikdienišķiem attēliem, ko cilvēki izmanto, lai dalītos un radītu informāciju. No logotipiem līdz diagrammām attēli var nodot precīzu nozīmi, ja tos papildina simboli, kas attiecas uz kopīgu valodu un pieredzi.
GPT‑4o attēlu ģenerēšana izceļas ar precīzu teksta attēlošanu, precīzi sekojot uzvednēm un izmantojot 4o raksturīgo zināšanu bāzi un tērzēšanas kontekstu, tostarp pārveidojot augšupielādētos attēlus vai izmantojot tos kā vizuālu iedvesmu. Šīs iespējas atvieglo tieši tāda attēla izveidi, kādu tu iedomājies, palīdzot efektīvāk sazināties, izmantojot vizuālos elementus, un padarot attēlu ģenerēšanu par praktisku rīku ar precizitāti un jaudu.
Mēs apmācījām savus modeļus, izmantojot tiešsaistes attēlu un teksta kopīgo izplatību, apgūstot ne tikai to, kā attēli saistās ar valodu, bet arī to, kā tie saistās savā starpā. Apvienojumā ar intensīvu pēcapmācību iegūtajam modelim ir pārsteidzošs vizuālais plūdums, kas spēj ģenerēt noderīgus, konsekventus un kontekstam atbilstošus attēlus.
Attēls ir tūkstoš vārdu vērts, bet dažkārt dažu vārdu ģenerēšana pareizajā vietā var paaugstināt attēla nozīmi. 4o spēja apvienot precīzus simbolus ar attēliem pārvērš attēlu ģenerēšanu par vizuālās komunikācijas līdzekli.
Tā kā attēlu ģenerēšana tagad ir GPT‑4o pamata funkcija, tu vari uzlabot attēlus, izmantojot dabiskas sarunas. GPT‑4o var balstīties uz attēliem un tekstu tērzēšanas kontekstā, nodrošinot konsekvenci it visā. Piemēram, ja tu veido videospēles tēlu, tā izskats paliek saskaņots vairākās iterācijās, kamēr tu to pilnveido un izmēģini.
GPT‑4o attēlu ģenerēšana seko detalizētām uzvednēm, pievēršot uzmanību sīkumiem. Kamēr citas sistēmas cīnās ar ~5–8 objektiem, GPT‑4o var apstrādāt līdz pat 10–20 dažādiem objektiem. Ciešāka objektu saistīšana ar to īpašībām un savstarpējo sasaisti ļauj labāk kontrolēt.
GPT‑4o var analizēt un mācīties no lietotāju augšupielādētajiem attēliem, nemanāmi integrējot to detaļas savā kontekstā, lai veicinātu attēlu ģenerēšanu.
Dzimtā attēlu ģenerēšana iespējo 4o saistīt savas zināšanas starp tekstu un attēliem, radot modeli, kas šķiet gudrāks un efektīvāks.
Mācības ar attēliem, kas atspoguļo plašu attēlu stilu klāstu, ļauj modelim pārliecinoši izveidot vai pārveidot attēlus.
Mūsu modelis nav perfekts. Pašlaik mēs zinām par vairākiem ierobežojumiem, kurus centīsimies novērst, uzlabojot modeli pēc tā sākotnējās palaišanas.

Esam pamanījuši, ka GPT‑4o dažkārt var pārāk cieši apgriezt garākus attēlus, piemēram, plakātus, īpaši apakšā.
Saskaņā ar mūsu modeļa specifikāciju mēs cenšamies maksimāli palielināt radošo brīvību, atbalstot vērtīgus lietošanas gadījumus, piemēram, spēļu izstrādi, vēsturisko izpēti un izglītību, vienlaikus saglabājot stingrus drošības standartus. Tajā pašā laikā aizvien ir tikpat svarīgi kā vienmēr bloķēt pieprasījumus, kas pārkāpj šos standartus. Tālāk ir sniegti papildu riska jomu izvērtējumi, kurās mēs strādājam, lai iespējotu drošu, augstas lietderības saturu un atbalstītu plašāku lietotāju radošo izpausmi.
Izcelsme, izmantojot C2PA un iekšējo atgriezenisko meklēšanu
Lai nodrošinātu pārredzamību, visiem ģenerētajiem attēliem ir pievienoti C2PA metadati, kas norāda, ka attēls ir GPT‑4o ģenerēts. Mēs esam izveidojuši arī iekšējo meklēšanas rīku, kas izmanto tehniskos atribūtus, lai palīdzētu verificēt, vai saturs ir mūsu modeļa radīts.
Bloķējam kaitīgo saturu
Mēs turpinām bloķēt pieprasījumus pēc ģenerētiem attēliem, kas var pārkāpt mūsu satura politiku, piemēram, bērnu seksuālas izmantošanas materiālus un seksuālus dziļviltojumus. Kad attēlos ir redzami reāli cilvēki, mums ir pastiprināti ierobežojumi attiecībā uz to, kāda veida attēlus var radīt, ar īpaši stingriem drošības pasākumiem attiecībā uz kailumu un grafisku vardarbību. Tāpat kā palaižot jebkuru jaunu programmu, drošība nekad nav galīga, bet drīzāk nepārtrauktu ieguldījumu joma. Kad mēs uzzināsim vairāk par šī modeļa izmantošanu reālajā pasaulē, mēs attiecīgi pielāgosim savas politikas.
Lai uzzinātu vairāk par mūsu pieeju, apmeklē GPT‑4o sistēmas kartes attēlu ģenerēšanas pielikumu.
Izmantojot argumentāciju drošības garantēšanai
Līdzīgi kā mūsu apzinātās saskaņošanas darbā, mēs esam apmācījuši argumentācijas LLM strādāt tieši no cilvēka rakstītām un interpretējamām drošības specifikācijām. Mēs izmantojām šo argumentāciju LLM izstrādes laikā, lai tā palīdzētu mums identificēt un risināt neskaidrības mūsu politikās. Līdztekus mūsu multimodālajiem sasniegumiem un esošajām drošības metodēm, kas izstrādātas ChatGPT un Sora, tas ļauj mums moderēt gan ievades tekstu, gan attēlu rezultātus atbilstoši mūsu politikām.
4o attēlu ģenerēšana sākot no šodienas tiks ieviesta Plus, Pro, Team un Free lietotājiem kā noklusējuma attēlu ģenerators ChatGPT, un drīz būs pieejama piekļuve Enterprise un Edu. Tā ir pieejams arī lietošanai Sora. Tiem, kuru sirdīs DALL·E ieņem īpašu vietu, tai joprojām var piekļūt, izmantojot speciālu DALL·E GPT.
Izstrādātāji drīz varēs ģenerēt attēlus ar GPT‑4o, izmantojot API, un piekļuve tiks nodrošināta nākamo nedēļu laikā.
Attēlu izveide un pielāgošana ir tikpat vienkārša kā tērzēšana, izmantojot GPT‑4o — vienkārši apraksti nepieciešamo, tostarp jebkādas specifikācijas, piemēram, malu attiecību, precīzas krāsas, izmantojot heksadecimālos kodus, vai caurspīdīgu fonu. Tā kā šis modelis izveido detalizētākus attēlus, attēlu atveide aizņem ilgāku laiku, bieži vien līdz vienai minūtei.
Autors
Vadība
Gabriel Goh: Attēlu ģenerēšana
Jackie Shannon: ChatGPT produkts
Mengchao Zhong, Wayne Chang: ChatGPT inženierija
Rohan Sahai: Sora produkts un inženierija
Brendan Quinn, Tomer Kaftan: Secinājumi
Prafulla Dhariwal: Multimodāla organizācija
Izpēte
Fundamentālie pētījumi
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Pamatpētījumi
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Izpētes līdzstrādnieki
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Modeļa uzvedība
Laurentia Romaniuk
Multimodāla organizācija
Andrew Gibiansky, Yang Lu
Dati
Datu vadība
Gildas Chabot, James Park Lennon
Dati
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatori
Hazel Byrne, Jennifer Luckenbill, Mariano López
Cilvēkresursu konsultanti
Long Ouyang
Mērogošana
Izvedumu vadība
Brendan Quinn, Tomer Kaftan
Izvedumi
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Lietišķo
ChatGPT produktu vadītājs
Jackie Shannon
ChatGPT inženierijas vadītāji
Mengchao Zhong, Wayne Chang
Produktu dizaina vadītājs
Matt Chan
Datu zinātne
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora produktu vadītāji
Rohan Sahai, Wesam Manassra
Sora produkti un inženierija
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Drošība
Drošības vadītājs
Somay Jain
Drošība
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Stratēģija
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Mārketings un komunikācija
Komunikācijas un mārketinga vadītāji
Minnia Feng, Natalie Summers, Taya Christianson
Komunikācija
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Dizains un Radošums
Vadība
Kendra Rimbach, Veit Moeller
Dizains
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Īpaša pateicība
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






