Vi presenterer 4o-bildegenerering
Få tilgang til nyttig og verdifull bildegenerering med en innebygd multimodal modell som kan gi presise, korrekte og fotorealistiske utdata.
Hos OpenAI har vi lenge ment at bildegenerering bør være en primær funksjon i språkmodellene våre. Det er derfor vi har integrert vår mest avanserte bildegenerator hittil i GPT‑4o. Resultatet er bildegenerering som ikke bare er praktfull, men også nyttig.
Fra de første hulemaleriene til moderne infografikk – mennesker har brukt visuelle bilder for å kommunisere, promotere og analysere, ikke bare for å dekorere. Dagens generative modeller kan fremkalle surrealistiske, spektakulære scener, men har problemer med hverdagsbildene folk bruker for å dele og opprette informasjon. Bilder kan formidle presis mening i alt fra logoer til diagrammer når de forsterkes med symboler som refererer til et felles språk og felles erfaring.
GPT‑4o‑bildegenerering utmerker seg ved å gjengi tekst korrekt, følge meldinger presist og utnytte 4o’s iboende kunnskap og chat-kontekst, som å transformere opplastede bilder eller bruke dem som visuell inspirasjon. Disse funksjonene gjør det enklere å opprette akkurat det bildet du ser for deg, slik at du kan kommunisere mer effektivt ved hjelp av visuelle elementer og gjøre bildegenerering til et praktisk verktøy med presisjon og kraft.
Vi trente modellene våre på simultanfordelingen av bilder og tekst på nettet, og lærte ikke bare hvordan bilder er knyttet til språk, men også hvordan de er knyttet til hverandre. Dette, kombinert med aggressiv etteropplæring, har resultert i en modell med overraskende visuell flyt, som er i stand til å generere bilder som er nyttige, konsistente og kontekstbevisste.
Et bilde sier mer enn tusen ord, men noen ganger kan noen få ord generert på riktig sted gjøre betydningen av et bilde enda tydeligere. 4o's evne til å kombinere presise symboler med bilder gjør bildegenerering til et verktøy for visuell kommunikasjon.
Fordi bildegenerering nå er innebygd i GPT‑4o, kan du forbedre bilder gjennom naturlig samtale. GPT‑4o kan bygge videre på bilder og tekst i chat-kontekst og sikre gjennomgående konsistens. Hvis du for eksempel designer en karakter i et videospill, forblir karakterens utseende konsistent gjennom flere iterasjoner mens du finjusterer og eksperimenterer.
GPT‑4o’s bildegenerering følger detaljerte meldinger med fokus på detaljer. Mens andre systemer har problemer med ca. 5–8 objekter, kan GPT‑4o håndtere opptil 10–20 forskjellige objekter. Den tettere bindingen av objekter til egenskapene og relasjonene deres gir bedre kontroll.
GPT‑4o kan analysere og lære av bilder opplastet av brukere, og sømløst integrere detaljene deres i sin kontekst for å informere bildegenerering.
Innebygd bildegenerering gjør det mulig for 4o å koble kunnskapen sin mellom tekst og bilder, og resultatet er en modell som føles smartere og mer effektiv.
Opplæring på bilder som reflekterer et bredt spekter av bildestiler, gjør det mulig for modellen å opprette eller transformere bilder på en overbevisende måte.
Modellen vår er ikke perfekt. For øyeblikket er vi klar over flere begrensninger som vi vil jobbe med å løse, gjennom forbedringer av modellen etter den første lanseringen.

Vi har lagt merke til at GPT‑4o av og til kan beskjære lengre bilder, som plakater, for nært, særlig nederst.
I tråd med modellspesifikasjonene ønsker vi å maksimere kreativ frihet ved å støtte verdifulle bruksområder som spillutvikling, historisk utforskning og utdanning, samtidig som vi opprettholder strenge sikkerhetsstandarder. Og det er fortsatt like viktig som alltid å blokkere forespørsler som bryter med disse standardene. Nedenfor finner du evalueringer av ytterligere risikoområder der vi jobber med å gi mulighet for trygt og nyttig innhold og støtte bredere kreativt uttrykk for brukerne.
Proveniens via C2PA og internt reversibelt søk
Alle genererte bilder kommer med C2PA-metadata, som gir åpenhet ved å identifisere at et bilde kommer fra GPT‑4o. Vi har også utviklet et internt søkeverktøy som bruker tekniske attributter fra flere generasjoner for å bidra til å verifisere om innholdet stammer fra vår modell.
Vi blokkerer ondsinnet innhold
Vi fortsetter å blokkere forespørsler om genererte bilder som kan bryte retningslinjene våre for innhold, som seksuelt misbruk av barn og seksuelle deepfakes. Når bilder av ekte mennesker er i kontekst, har vi skjerpede restriksjoner på hva slags bilder som kan opprettes, med spesielt robuste sikkerhetstiltak rundt nakenhet og grov vold. Som med enhver lansering er sikkerhet aldri ferdig, men snarere et kontinuerlig investeringsområde. Etter hvert som vi lærer mer om bruken av denne modellen i den virkelige verden, justerer vi retningslinjene deretter.
For å lese mer om tilnærmingen vår kan du gå til bildegenereringstillegget til GPT‑4o‑systemkortet.
Bruke resonnement for å styrke sikkerheten
I likhet med vårt arbeid med deliberativ tilpasning har vi trent en resonnerende LLM til å jobbe direkte ut fra menneskeskrevne og tolkbare sikkerhetsspesifikasjoner. Vi brukte denne resonnerende LLM-en under utviklingen for å hjelpe oss med å identifisere og håndtere uklarheter i retningslinjene våre. Sammen med våre multimodale forbedringer og eksisterende sikkerhetsteknikker utviklet for ChatGPT og Sora gjør dette oss i stand til å moderere både inndatatekst og utdatabilder i henhold til retningslinjene våre.
4o image generation rolls out starting today to Plus, Pro, Team, and Free users as the default image generator in ChatGPT, with access coming soon to Enterprise and Edu. It’s also available to use in Sora. For those who hold a special place in their hearts for DALL·E, it can still be accessed through a dedicated DALL·E GPT.
Developers will soon be able to generate images with GPT‑4o via the API, with access rolling out in the next few weeks.
Creating and customizing images is as simple as chatting using GPT‑4o - just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. Because this model creates more detailed pictures, images take longer to render, often up to one minute.
Forfatter
Lederskap
Gabriel Goh: Bildegenerering
Jackie Shannon: ChatGPT-produkt
Mengchao Zhong, Wayne Chang: ChatGPT-utvikling
Rohan Sahai: Sora-produkt og -utvikling
Brendan Quinn, Tomer Kaftan: Inferens
Prafulla Dhariwal: Multimodal organisasjon
Research
Grunnleggende forskning
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Kjerneforskning
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Bidragsytere til forskning
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Modellatferd
Laurentia Romaniuk
Multimodal organisasjon
Andrew Gibiansky, Yang Lu
Data
Data-ledere
Gildas Chabot, James Park Lennon
Data
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatorer
Hazel Byrne, Jennifer Luckenbill, Mariano López
Rådgivere for menneskelige data
Long Ouyang
Skalering
Inferensledere
Brendan Quinn, Tomer Kaftan
Inferens
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Anvendt
ChatGPT-produktleder
Jackie Shannon
Utviklingsledere for ChatGPT
Mengchao Zhong, Wayne Chang
Leder for produktdesign
Matt Chan
Datavitenskap
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Produktledere for Sora
Rohan Sahai, Wesam Manassra
Sora-produkt og -utvikling
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Sikkerhet
Sikkerhetsleder
Somay Jain
Sikkerhet
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategi
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Markedsføring og kommunikasjon
Kommunikasjons- og markedsføringsledere
Minnia Feng, Natalie Summers, Taya Christianson
Kommunikasjon
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Design og kreativt arbeid
Ledere
Kendra Rimbach, Veit Moeller
Design
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Spesiell takk
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






