Pristatome „4o“ vaizdų generavimą
Atveriamos naudingo ir vertingo vaizdų generavimo galimybės naudojant interguotąjį multimodalinį modelį, galintį pateikti tikslius, preciziškus, fotorealistinius vaizdus.
Mes, „OpenAI“, jau seniai tikime, kad vaizdų generavimas turėtų būti pagrindinė mūsų kalbos modelių galimybė. Štai kodėl į „GPT‑4o“ integravome pažangiausią iki šiol sukurtą vaizdų generatorių. Rezultatas – vaizdų generavimas, kuris yra ne tik estetiškas, bet ir naudingas.
Nuo pirmųjų urvų piešinių iki šiuolaikinių infografikų žmonės naudojo vaizdinius ne tik puošti, bet ir bendrauti, įtikinti ir analizuoti. Šiandieniai generatyvieji modeliai gali sukurti siurrealias, kvapą gniaužiančias scenas, tačiau jiems sunkiau sekasi kurti darbinius vaizdus, kuriuos žmonės naudoja informacijai dalytis ir kurti. Nuo logotipų iki diagramų – vaizdai gali perteikti tikslią prasmę, kai yra papildyti simboliais, nurodančiais bendrą kalbą ir patirtį.
„GPT‑4o“ vaizdų generavimas pasižymi tiksliu teksto atvaizdavimu, precizišku raginimų laikymusi ir „4o“ žinių bazės bei pokalbio konteksto panaudojimu, įskaitant įkeltų vaizdų transformavimą arba jų naudojimą kaip vizualų įkvėpimo šaltinį. Šios galimybės leidžia lengviau sukurti tiksliai tokį vaizdą, kokį įsivaizduojate, padeda efektyviau bendrauti pasitelkiant vaizdines priemones ir paverčia vaizdų generavimą praktišku, tiksliu bei galingu įrankiu.
Mokėme savo modelius naudodami bendrą internetinių vaizdų ir teksto rinkinį, kad jie suprastų ne tik ryšį tarp vaizdų ir kalbos, bet ir tarpusavio ryšius tarp pačių vaizdų. Po intensyvaus papildomo derinimo gautas modelis pasižymi stebėtinu vizualiniu sklandumu ir gali generuoti naudingus, nuoseklius bei kontekstą atitinkančius vaizdus.
Vaizdas vertas tūkstančio žodžių, tačiau kartais tinkamoje vietoje sugeneruoti keli žodžiai gali sustiprinti vaizdo prasmę. „4o“ gebėjimas derinti tikslius simbolius su vaizdiniais paverčia vaizdų generavimą vizualinės komunikacijos įrankiu.
Kadangi vaizdų generavimas dabar yra integruotas į „GPT‑4o“, vaizdus galite tobulinti natūralaus pokalbio metu. „GPT‑4o“ gali remtis vaizdais ir tekstu pokalbio kontekste, užtikrindamas nuoseklumą. Pavyzdžiui, jei kuriate vaizdo žaidimo personažą, jo išvaizda išlieka nuosekli skirtingose iteracijose, kurias kuriate tobulindami ir eksperimentuodami.
„GPT‑4o“ vaizdų generavimo funkcija kruopščiai laikosi raginimų ir atkreipia dėmesį į detales. Kitoms sistemoms sunkiai sekasi apdoroti 5–8 objektus, o „GPT‑4o“ gali susitvarkyti su 10–20 skirtingų objektų. Glaudesnis objektų susiejimas su jų savybėmis ir ryšiais leidžia geriau juos valdyti.
„GPT‑4o“ gali analizuoti naudotojų įkeltus vaizdus ir mokytis iš jų, sklandžiai integruodamas jų detales į savo kontekstą, kad pagrįstų vaizdų generavimą.
Dėl organiško vaizdų generavimo „4o“ geba susieti teksto ir vaizdų žinias, todėl atrodo protingesnis ir efektyvesnis.
Mokydamasis iš vaizdų, atspindinčių daugybę įvairių stilių, modelis gali įtikinamai kurti arba transformuoti vaizdus.
Mūsų modelis nėra tobulas. Žinome daug jo apribojimų, kuriuos stengsimės pašalinti tobulindami modelį po pirminio paleidimo.

Pastebėjome, kad „GPT‑4o“ kartais gali per daug apkirpti ilgesnius vaizdus, pavyzdžiui, plakatus, ypač apačioje.
Vadovaudamiesi savo modelio specifikacija, siekiame maksimaliai padidinti kūrybinę laisvę palaikydami vertingus naudojimo atvejus, tokius kaip žaidimų kūrimas, istoriniai tyrinėjimai ir švietimas, kartu išlaikydami griežtus saugos standartus. Taip pat kaip niekad svarbu blokuoti užklausas, kurios pažeidžia šiuos standartus. Toliau pateikiami papildomų rizikos sričių vertinimai; jose stengiamės įgalinti saugų, labai naudingą turinį ir palaikyti platesnę naudotojų kūrybinę raišką.
Kilmės nustatymas naudojant C2PA ir vidinę grįžtamąją paiešką
Visi sugeneruoti vaizdai turi C2PA metaduomenis, kurie identifikuoja vaizdą kaip gautą iš „GPT‑4o“, kad būtų užtikrintas skaidrumas. Taip pat sukūrėme vidinį paieškos įrankį, kuris naudoja techninius generacijų atributus, padedančius patikrinti, ar turinys gautas iš mūsų modelio.
Netinkamo turinio blokavimas
Toliau blokuojame prašymus generuoti vaizdus, kurie gali pažeisti mūsų turinio politiką, pavyzdžiui, vaizdus, kuriuose vaizduojamas vaikų seksualinis išnaudojimas ar seksualinio pobūdžio giliąsias klastotes. Kai kontekste yra realių žmonių vaizdai, taikome griežtesnius apribojimus dėl to, kokio pobūdžio vaizdus galima kurti, o ypač stiprios apsaugos numatytos nuogybėms ir atviroms smurto scenoms. Kaip ir su bet kuriuo nauju produktu, sauga yra nesibaigiantis procesas – tai nuolatinė investicijų sritis. Sužinoję daugiau apie realų šio modelio naudojimą, atitinkamai pakoreguosime savo politiką.
Daugiau apie mūsų požiūrį skaitykite „GPT‑4o“ sistemos kortelės vaizdų generavimo priede.
Samprotavimu grindžiama sauga
Panašiai kaip ir mūsų apgalvoto suderinimo (angl. deliberative alignment) darbe, apmokėme samprotaujantį LLM dirbti tiesiogiai pagal žmogaus parašytas ir interpretuojamas saugos specifikacijas. Kūrybos procese šis samprotaujantis LLM padėjo nustatyti ir pašalinti mūsų politikos dviprasmybes. Naudodamiesi savo multimodalinio modelio pasiekimais ir esamais saugos metodais, sukurtais „ChatGPT“ ir „Sora“ programoms, galime moderuoti tiek įvesties tekstą, tiek išvesties vaizdus pagal mūsų politiką.
„4o“ vaizdų generavimas nuo šiandien pradedamas teikti „Plus“, „Pro“, „Team“ ir „Free“ naudotojams – jiems tai bus numatytasis vaizdų generatorius „ChatGPT“ programoje, o „Enterprise“ ir „Edu“ naudotojai prieigą gaus netrukus. Funkciją taip pat galima naudoti „Sora“ programoje. Tiems, kurie jaučia nostalgiją DALL·E, jis vis dar pasiekiamas per specialų DALL·E GPT.
Programuotojai netrukus galės generuoti vaizdus naudodamiesi „GPT‑4o“ per API; prieiga bus pradėta teikti per kelias ateinančias savaites.
Kurti ir pritaikyti vaizdus taip pat paprasta, kaip ir kalbėtis naudojant „GPT‑4o“ – tiesiog aprašykite, ko jums reikia, įskaitant bet kokią specifiką, pavyzdžiui, kraštinių santykį, tikslias spalvas naudojant šešioliktainius kodus arba permatomą foną. Kadangi šis modelis kuria detalesnius paveikslėlius, vaizdų atvaizdavimas užtrunka ilgiau, dažnai iki vienos minutės.
Autorius
Vadovybė
Gabriel Goh: vaizdų generavimas
Jackie Shannon: „ChatGPT“ produktas
Mengchao Zhong, Wayne Chang: „ChatGPT“ inžinerija
Rohan Sahai: „Sora“ produktai ir inžinerija
Brendan Quinn, Tomer Kaftan: modelio vykdymas
Prafulla Dhariwal: multimodalinis padalinys
Moksliniai tyrimai
Fundamentiniai tyrimai
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Pagrindiniai tyrimai
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Tyrimų bendraautoriai
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Modelio elgsena
Laurentia Romaniuk
Multimodalinis padalinys
Andrew Gibiansky, Yang Lu
Duomenys
Duomenų vadovai
Gildas Chabot, James Park Lennon
Duomenys
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatoriai
Hazel Byrne, Jennifer Luckenbill, Mariano López
Patarėjai žmogiškųjų duomenų klausimais
Long Ouyang
Mastelio keitimas
Modelio vykdymo vadovai
Brendan Quinn, Tomer Kaftan
Modelio vykdymas
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Taikomoji veikla
„ChatGPT“ produkto vadovas
Jackie Shannon
„ChatGPT“ inžinerijos vadovai
Mengchao Zhong, Wayne Chang
Produkto dizaino vadovas
Matt Chan
Duomenų mokslas
Xiaolin Hao
„ChatGPT“
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
„Sora“ produktų vadovai
Rohan Sahai, Wesam Manassra
„Sora“ produktai ir inžinerija
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Sauga
Saugos vadovas
Somay Jain
Sauga
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategija
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Rinkodara ir komunikacija
Komunikacijos ir rinkodaros vadovai
Minnia Feng, Natalie Summers, Taya Christianson
Komunikacija
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Dizainas ir kūryba
Vadovai
Kendra Rimbach, Veit Moeller
Dizainas
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Ypatinga padėka
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






