Introductie van 4o-beeldgeneratie
Nuttige en waardevolle beeldgeneratie mogelijk maken met een model dat van nature multimodaal is en precieze, accurate en fotorealistische resultaten levert.
Bij OpenAI zijn we er al lang van overtuigd dat beeldgeneratie een kernfunctie van onze taalmodellen moet zijn. Daarom hebben we onze meest geavanceerde beeldgenerator tot nu toe geïntegreerd in GPT‑4o. Het resultaat: beeldgeneratie die niet alleen fraai is, maar ook functioneel.
Van de eerste grotschilderingen tot moderne infographics: de mens gebruikt beeldtaal om te communiceren, te overtuigen en te analyseren, niet louter ter versiering. De huidige generatieve modellen toveren moeiteloos surrealistische, adembenemende taferelen op het scherm, maar worstelen vaak met de praktische beelden die mensen gebruiken om informatie te delen en te creëren. Van logo's tot diagrammen: beelden kunnen een precieze betekenis overbrengen wanneer ze verrijkt zijn met symbolen die verwijzen naar een gedeelde taal en ervaring.
De beeldgeneratie van GPT‑4o blinkt uit in correcte tekstweergave, het nauwkeurig opvolgen van prompts en het benutten van de ingebouwde kennis en chatcontext van 4o, inclusief het transformeren van geüploade afbeeldingen of het gebruiken daarvan als visuele inspiratie. Dankzij deze mogelijkheden maak je eenvoudiger precies dat beeld dat je voor ogen hebt. Het helpt je effectiever visueel te communiceren en transformeert beeldgeneratie tot een praktische, precieze en krachtige tool.
We hebben onze modellen getraind op de gezamenlijke distributie van online afbeeldingen en tekst, waarbij ze niet alleen leerden hoe beelden zich verhouden tot taal, maar ook hoe ze zich tot elkaar verhouden. In combinatie met intensieve post-training levert dit een model op met een verrassende visuele souplesse, dat beelden kan genereren die nuttig, consistent en contextbewust zijn.
Een afbeelding zegt meer dan duizend woorden, maar soms kunnen een paar woorden op de juiste plek de betekenis van een afbeelding naar een hoger plan tillen. Het vermogen van 4o om precieze symbolen te combineren met beelden, maakt van beeldgeneratie een ware tool voor visuele communicatie.
Omdat beeldgeneratie nu standaard is ingebouwd in GPT‑4o, kun je afbeeldingen verfijnen via een natuurlijk gesprek. GPT‑4o kan voortborduren op afbeeldingen en tekst in de chatgeschiedenis, waardoor de consistentie behouden blijft. Als je bijvoorbeeld een gamepersonage ontwerpt, blijft het uiterlijk van dat personage consistent tijdens meerdere iteraties van verfijnen en experimenteren.
De beeldgeneratie van GPT‑4o volgt uitgebreide prompts met oog voor detail. Waar andere systemen moeite hebben met 5 tot 8 objecten, kan GPT‑4o er tot wel 10 tot 20 aan. De strakkere koppeling van objecten aan hun eigenschappen en relaties zorgt voor meer controle.
GPT‑4o kan geüploade afbeeldingen analyseren en ervan leren, en de details naadloos in de context integreren om nieuwe beelden te genereren.
Dankzij de native beeldgeneratie kan 4o kennis koppelen tussen tekst en beeld, wat resulteert in een model dat slimmer en efficiënter aanvoelt.
Door te trainen op beelden in uiteenlopende stijlen, kan het model overtuigend afbeeldingen creëren of transformeren.
Ons model is niet perfect. We zijn ons bewust van diverse beperkingen die we na de lancering zullen aanpakken via modelverbeteringen.

We hebben gemerkt dat GPT‑4o langere afbeeldingen, zoals posters, soms te strak bijsnijdt, vooral aan de onderkant.
In lijn met onze modelspecificatie streven we naar maximale creatieve vrijheid door waardevolle toepassingen zoals game-ontwikkeling, geschiedenis en onderwijs te ondersteunen, met behoud van strenge veiligheidsnormen. Tegelijkertijd blijft het net zo belangrijk als altijd om verzoeken te blokkeren die deze normen schenden. Hieronder vind je evaluaties van extra risicogebieden. Hier werken we aan het mogelijk maken van veilige, nuttige content en het ondersteunen van een bredere creatieve expressie.
Herkomstbepaling via C2PA en interne omkeerbare zoekopdrachten
Alle gegenereerde afbeeldingen krijgen C2PA-metadata mee. Hiermee is te zien dat een afbeelding afkomstig is van GPT‑4o, wat zorgt voor transparantie. We hebben ook een interne zoektool gebouwd die technische kenmerken van de generaties gebruikt om te verifiëren of content van ons model afkomstig is.
Het blokkeren van schadelijke content
We blijven verzoeken blokkeren voor afbeeldingen die mogelijk in strijd zijn met ons inhoudsbeleid, zoals materiaal met seksueel misbruik van kinderen en seksuele deepfakes. Wanneer er afbeeldingen van echte mensen in de context voorkomen, gelden er strengere beperkingen, met name robuuste beveiligingen rondom naaktheid en expliciet geweld. Zoals bij elke lancering is veiligheid nooit 'af', maar een continu aandachtspunt waarin we blijven investeren. Naarmate we meer leren over het gebruik van dit model in de praktijk, zullen we ons beleid daarop aanpassen.
Bekijk voor meer informatie over onze aanpak het addendum over beeldgeneratie in de GPT‑4o 'system card'.
Redeneervermogen inzetten voor veiligheid
Net als bij ons werk aan deliberative alignment, hebben we een redenerend LLM getraind dat direct werkt op basis van door mensen geschreven, interpreteerbare veiligheidsregels. Tijdens de ontwikkeling gebruikten we dit redenerende LLM om onduidelijkheden in ons beleid op te sporen en aan te pakken. Samen met onze multimodale vooruitgang en bestaande veiligheidstechnieken uit ChatGPT en Sora, stelt dit ons in staat om zowel invoertekst als uitvoerbeelden te toetsen aan ons beleid.
4o image generation rolls out starting today to Plus, Pro, Team, and Free users as the default image generator in ChatGPT, with access coming soon to Enterprise and Edu. It’s also available to use in Sora. For those who hold a special place in their hearts for DALL·E, it can still be accessed through a dedicated DALL·E GPT.
Developers will soon be able to generate images with GPT‑4o via the API, with access rolling out in the next few weeks.
Creating and customizing images is as simple as chatting using GPT‑4o - just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. Because this model creates more detailed pictures, images take longer to render, often up to one minute.
Auteur
Leiderschap
Gabriel Goh: Beeldgeneratie
Jackie Shannon: ChatGPT-product
Mengchao Zhong, Wayne Chang: ChatGPT Engineering
Rohan Sahai: Sora Product en Engineering
Brendan Quinn, Tomer Kaftan: Inferentie
Prafulla Dhariwal: Multimodale organisatie
Onderzoek
Fundamenteel onderzoek
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Kernonderzoek
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Onderzoeksbijdragers
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Modelgedrag
Laurentia Romaniuk
Multimodale organisatie
Andrew Gibiansky, Yang Lu
Gegevens
Leads data
Gildas Chabot, James Park Lennon
Gegevens
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderators
Hazel Byrne, Jennifer Luckenbill, Mariano López
Adviseurs voor menselijke data
Long Ouyang
Opschalen
Leads inferentie
Brendan Quinn, Tomer Kaftan
Inferentie
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Toegepast
Lead ChatGPT-product
Jackie Shannon
Leads ChatGPT Engineering
Mengchao Zhong, Wayne Chang
Lead productontwerp
Matt Chan
Datawetenschap
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora*
Leads Sora-product
Rohan Sahai, Wesam Manassra
Sora Product en Engineering
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Veiligheid
Lead veiligheid
Somay Jain
Veiligheid
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategie
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketing en communicatie
Communicatie- en marketingleads
Minnia Feng, Natalie Summers, Taya Christianson
Communicatie
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Ontwerp en creativiteit
Leads
Kendra Rimbach, Veit Moeller
Ontwerp
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Speciale dank
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






