Esittelyssä 4o-kuvan luonti
Hyödyllisen ja arvokkaan kuvan luonnin avaaminen natiivisti multimodaalisella mallilla, joka pystyy tuottamaan tarkkoja, fotorealistisia tuloksia.
OpenAI:ssa olemme jo pitkään uskoneet, että kuvien luomisen tulisi olla kielimalliemme ensisijainen kyvykkyys. Siksi olemme rakentaneet GPT‑4o:hon edistyneimmän kuvageneraattorimme tähän mennessä. Tuloksena on paitsi kaunis, myös hyödyllinen kuvan luonti.
Ensimmäisistä luolamaalauksista nykyaikaisiin infografiikoihin ihmiset ovat käyttäneet visuaalista kuvastoa kommunikoidakseen, vakuuttaakseen ja analysoidakseen – ei vain koristeluun. Nykypäivän generatiiviset mallit voivat loihtia surrealistisia, henkeäsalpaavia kohtauksia, mutta kamppailevat sellaisten arkikuvien kanssa, joita ihmiset käyttävät tiedon jakamiseen ja luomiseen. Logot ja kaaviot voivat välittää tarkkaa merkitystä, kun kuvia täydennetään symboleilla, jotka viittaavat yhteiseen kieleen ja kokemukseen.
GPT‑4o:n kuvan luonti on erinomainen tekstin tarkassa renderoinnissa, kehotteiden tarkassa noudattamisessa ja 4o:n sisäisen tietokannan ja chat-kontekstin hyödyntämisessä – mukaan lukien ladattujen kuvien muuntaminen tai niiden käyttäminen visuaalisena inspiraationa. Nämä ominaisuudet helpottavat juuri haluamasi kuvan luomista, auttavat sinua kommunikoimaan tehokkaammin visuaalisesti ja tekevät kuvan luonnista tarkan ja tehokkaan käytännön työkalun.
Koulutimme mallimme verkossa olevien kuvien ja tekstin yhteisen jakamisen perusteella oppien paitsi kuvien ja kielen välisen suhteen, myös kuvien keskinäisen suhteen. Yhdistettynä tehokkaaseen jälkikoulutukseen, tuloksena oleva malli on yllättävän visuaalisesti sujuva ja pystyy tuottamaan hyödyllisiä, johdonmukaisia ja kontekstia huomioivia kuvia.
Kuva kertoo enemmän kuin tuhat sanaa, mutta joskus muutama sana oikeassa paikassa voi korostaa kuvan merkitystä. 4o:n kyky yhdistää tarkkoja symboleja ja kuvastoa muuttaa kuvan luonnin visuaalisen viestinnän työkaluksi.
Koska kuvan luonti on GPT‑4o:n natiiviominaisuus, voit muokata kuvia luonnollisen keskustelun kautta. GPT‑4o voi hyödyntää kuvia ja tekstiä chat-kontekstissa, mikä takaa johdonmukaisuuden. Esimerkiksi, jos suunnittelet videopelihahmoa, hahmon ulkonäkö pysyy yhdenmukaisena useiden iteraatioiden ajan, kun tarkennat ja kokeilet hahmon luontia.
GPT‑4o:n kuvan luonti noudattaa tarkasti yksityiskohtaisia kehotteita. Kun muut järjestelmät kamppailevat noin 5–8 objektin kanssa, GPT‑4o pystyy käsittelemään jopa 10–20 erilaista objektia. Objektien tiukempi sitoutuminen niiden ominaisuuksiin ja suhteisiin mahdollistaa paremman hallinnan.
GPT‑4o voi analysoida ja oppia käyttäjän lataamista kuvista, integroimalla niiden yksityiskohdat saumattomasti kontekstiinsa kuvan luontia varten.
Natiivi kuvan luonti mahdollistaa 4o:n yhdistää tietonsa tekstin ja kuvien välillä, mikä johtaa älykkäämpään ja tehokkaampaan malliin.
Koulutus, joka perustuu hyvin erilaisiin kuvatyyleihin, mahdollistaa mallin luoda tai muokata kuvia vakuuttavasti.
Mallimme ei ole täydellinen. Olemme tietoisia useista rajoituksista, joita pyrimme korjaamaan mallin parannuksilla alkuperäisen julkaisun jälkeen.

Olemme huomanneet, että GPT‑4o saattaa joskus rajata pidempiä kuvia, kuten julisteita, liian tiukasti, erityisesti alareunasta.
Mallispesifikaatiomme mukaisesti pyrimme maksimoimaan luovan vapauden tukemalla arvokkaita käyttötapauksia, kuten pelien kehittämistä, historiallista tutkimusta ja koulutusta, samalla kun ylläpidämme tiukkoja turvallisuusstandardeja. Samalla on edelleen yhtä tärkeää kuin ennenkin estää pyynnöt, jotka rikkovat näitä standardeja. Alla on arvioita muista riskialueista, joilla pyrimme mahdollistamaan turvallisen ja hyödyllisen sisällön sekä tukemaan käyttäjien laajempaa luovuuden ilmaisua.
Alkuperä C2PA:n ja sisäisen käänteishaun kautta
Kaikki luodut kuvat sisältävät C2PA-metatiedot, jotka tunnistavat kuvan olevan peräisin GPT‑4o:sta, mikä tarjoaa läpinäkyvyyttä. Olemme myös kehittäneet sisäisen hakutyökalun, joka hyödyntää sukupolvien teknisiä ominaisuuksia auttaakseen varmistamaan, onko sisältö peräisin mallistamme.
Haitallisen sisällön estäminen
Jatkamme sellaisten luotujen kuvien pyyntöjen estämistä, jotka saattavat rikkoa sisältökäytäntöjämme, kuten lasten seksuaalista hyväksikäyttöä sisältävä materiaali ja seksuaaliset deepfake-kuvat. Kun kuvat todellisista ihmisistä ovat kontekstissa, meillä on tiukemmat rajoitukset sen suhteen, millaisia kuvia voidaan luoda, ja erityisen vahvat turvatoimet alastomuuden ja graafisen väkivallan suhteen. Kuten minkä tahansa julkaisun yhteydessä, turvallisuus ei ole koskaan valmis, vaan se on jatkuva investointikohde. Kun saamme lisää tietoa tämän mallin käytöstä käytännössä, mukautamme käytäntöjämme sen mukaisesti.
Lisätietoja lähestymistavastamme löytyy kuvien luomista koskevasta lisäyksestä GPT‑4o‑järjestelmäkorttiin.
Päättelyn käyttö turvallisuuden tehostamiseen
Samoin kuin harkitsevan yhdenmukaistamisen työssämme, olemme kouluttaneet päättelevän LLM:n toimimaan suoraan ihmisten kirjoittamien ja tulkittavissa olevien turvallisuusmäärittelyjen pohjalta. Käytimme tätä päättelyyn perustuvaa LLM:ää kehityksen aikana auttamaan meitä tunnistamaan ja käsittelemään käytäntöjemme epäselvyyksiä. Yhdessä multimodaalisten edistysaskeliemme ja ChatGPT:lle ja Soralle kehitettyjen olemassa olevien turvallisuustekniikoiden kanssa tämä antaa meille mahdollisuuden moderoida sekä syötettyä tekstiä että tuotettuja kuvia käytäntöjemme mukaisesti.
4o image generation rolls out starting today to Plus, Pro, Team, and Free users as the default image generator in ChatGPT, with access coming soon to Enterprise and Edu. It’s also available to use in Sora. For those who hold a special place in their hearts for DALL·E, it can still be accessed through a dedicated DALL·E GPT.
Developers will soon be able to generate images with GPT‑4o via the API, with access rolling out in the next few weeks.
Creating and customizing images is as simple as chatting using GPT‑4o - just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. Because this model creates more detailed pictures, images take longer to render, often up to one minute.
Tekijä
Johtajuus
Gabriel Goh: Kuvan luonti
Jackie Shannon: ChatGPT-tuote
Mengchao Zhong, Wayne Chang: ChatGPT Engineering
Rohan Sahai: Sora-tuotteet ja -tekniikka
Brendan Quinn, Tomer Kaftan: Päättely
Prafulla Dhariwal: Multimodaalinen organisaatio
Tutkimus
Perustutkimus
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Ydintutkimus
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Tutkimuksen avustajat
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Mallin käyttäytyminen
Laurentia Romaniuk
Multimodaalinen organisaatio
Andrew Gibiansky, Yang Lu
Data
Tietojohtajat
Gildas Chabot, James Park Lennon
Data
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderaattorit
Hazel Byrne, Jennifer Luckenbill, Mariano López
Ihmistietojen neuvonantajat
Long Ouyang
Skaalaaminen
Päättelyjohtajat
Brendan Quinn, Tomer Kaftan
Päättely
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev ja Stanley Hsieh
Sovellettu
ChatGPT-tuotepäällikkö
Jackie Shannon
ChatGPT:n suunnittelujohtajat
Mengchao Zhong, Wayne Chang
Tuotesuunnittelun johtaja
Matt Chan
Tietojenkäsittelytiede
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Soran tuotejohtajat
Rohan Sahai, Wesam Manassra
Sora-tuotteet ja -tekniikka
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Turvallisuus
Turvallisuusvastaava
Somay Jain
Turvallisuus
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategia
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Markkinointi ja viestintä
Viestinnän ja markkinoinnin vastuuhenkilöt
Minnia Feng, Natalie Summers, Taya Christianson
Viestintä
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Suunnittelu ja luonti
Vastuuhenkilöt
Kendra Rimbach, Veit Moeller
Design
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Erityiset kiitokset
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






