Apresentamos a geração de imagens do 4o
Desbloqueando a geração de imagens úteis e valiosas com um modelo nativamente multimodal capaz de produzir resultados precisos, exatos e fotorrealistas.
Na OpenAI, sempre acreditamos que a geração de imagens deve ser uma capacidade primordial de nossos modelos de linguagem. É por isso que incorporamos o nosso gerador de imagens mais avançado até hoje no GPT‑4o. O resultado: geração de imagens que não são apenas belas, mas também úteis.
Desde as primeiras pinturas rupestres até os infográficos modernos, os seres humanos usam imagens visuais para comunicar, persuadir e analisar — e não apenas para decorar. Os modelos generativos atuais conseguem criar cenas surreais e de tirar o fôlego, mas têm dificuldades com as imagens comuns que as pessoas usam para compartilhar e criar informações. De logotipos a diagramas, as imagens podem transmitir significados precisos quando complementadas com símbolos que remetem a uma linguagem e experiência compartilhadas.
A geração de imagens do GPT‑4o se destaca na renderização precisa de texto, no seguimento exato de instruções e no aproveitamento da base de conhecimento inerente do 4o e do contexto do chat — incluindo a transformação de imagens enviadas ou o uso delas como inspiração visual. Essas funcionalidades facilitam a criação exata da imagem que você idealiza, ajudando você a se comunicar de forma mais eficaz por meio de recursos visuais e transformando a geração de imagens em uma ferramenta prática, precisa e poderosa.
Treinamos nossos modelos na distribuição conjunta de imagens e textos online, aprendendo não apenas como as imagens se relacionam com a linguagem, mas também como elas se relacionam entre si. Combinado com um pós-treinamento agressivo, o modelo resultante apresenta uma fluência visual surpreendente, capaz de gerar imagens úteis, consistentes e contextualizadas.
Uma imagem vale mais que mil palavras, mas às vezes, algumas palavras colocadas no lugar certo podem elevar o significado de uma imagem. A capacidade do 4o de combinar símbolos precisos com imagens transforma a geração de imagens em uma ferramenta de comunicação visual.
Como a geração de imagens agora é nativa do GPT‑4o, você pode refinar as imagens por meio de conversas naturais. O GPT‑4o consegue analisar imagens e texto no contexto do chat, garantindo consistência em todas as interações. Por exemplo, se você estiver criando um personagem para um videogame, a aparência do personagem permanece coerente em várias iterações à medida que você refina e experimenta.
A geração de imagens do GPT‑4o segue instruções detalhadas com atenção aos detalhes. Enquanto outros sistemas têm dificuldades com cerca de 5 a 8 objetos, o GPT‑4o consegue lidar com até 10 a 20 objetos diferentes. A maior vinculação dos objetos às suas características e relações permite um melhor controle.
O GPT‑4o consegue analisar e aprender com imagens enviadas pelos usuários, integrando perfeitamente os detalhes dessas imagens ao seu contexto para gerar novas imagens.
A geração nativa de imagens permite que o 4o conecte seu conhecimento entre texto e imagens, resultando em um modelo que se mostra mais inteligente e eficiente.
O treinamento com imagens que refletem uma vasta gama de estilos permite ao modelo criar ou transformar imagens de forma convincente.
Nosso modelo não é perfeito. Estamos cientes de várias limitações no momento e trabalharemos para resolvê-las por meio de melhorias no modelo após o lançamento inicial.

Notamos que o GPT‑4o ocasionalmente recorta imagens mais longas, como pôsteres, de forma muito apertada, especialmente na parte inferior.
Em consonância com nossa Especificação de Modelo, buscamos maximizar a liberdade criativa, oferecendo suporte a casos de uso valiosos, como desenvolvimento de jogos, exploração histórica e educação, mantendo, ao mesmo tempo, altos padrões de segurança. Ao mesmo tempo, continua sendo tão importante quanto sempre bloquear solicitações que violem esses padrões. A seguir, apresentamos avaliações de áreas de risco adicionais nas quais estamos trabalhando para viabilizar conteúdo seguro e de alta utilidade, além de apoiar uma expressão criativa mais ampla para os usuários.
Proveniência via C2PA e busca interna reversível
Todas as imagens geradas vêm com metadados C2PA, que identificam uma imagem como proveniente do GPT‑4o, para garantir a transparência. Também desenvolvemos uma ferramenta de busca interna que utiliza atributos técnicos de gerações para ajudar a verificar se o conteúdo veio do nosso modelo.
Bloqueando o conteúdo inadequado
Continuamos bloqueando solicitações de imagens geradas que possam violar nossas políticas de conteúdo, como materiais de abuso sexual infantil e deepfakes sexuais. Quando as imagens de pessoas reais estão em contexto, temos restrições mais rigorosas quanto ao tipo de imagens que podem ser criadas, com salvaguardas particularmente robustas em relação à nudez e à violência explícita. Como em qualquer lançamento, a segurança nunca está concluída e é, na verdade, uma área contínua de investimento. À medida que aprendermos mais sobre o uso prático desse modelo, ajustaremos nossas políticas de acordo.
Para mais informações sobre nossa abordagem, visite o adendo de geração de imagens do cartão do sistema GPT‑4o.
Utilizando o raciocínio para promover a segurança
De forma semelhante ao nosso trabalho de alinhamento deliberativo , treinamos um LLM (Liderança em Aprendizagem Baseada em Evidências) de raciocínio para trabalhar diretamente com especificações de segurança escritas por humanos e interpretáveis. Utilizamos esse raciocínio do LLM durante o desenvolvimento para nos ajudar a identificar e abordar ambiguidades em nossas políticas. Em conjunto com nossos avanços multimodais e as técnicas de segurança existentes desenvolvidas para o ChatGPT e o Sora, isso nos permite moderar tanto o texto de entrada quanto as imagens de saída de acordo com nossas políticas.
4o image generation rolls out starting today to Plus, Pro, Team, and Free users as the default image generator in ChatGPT, with access coming soon to Enterprise and Edu. It’s also available to use in Sora. For those who hold a special place in their hearts for DALL·E, it can still be accessed through a dedicated DALL·E GPT.
Developers will soon be able to generate images with GPT‑4o via the API, with access rolling out in the next few weeks.
Creating and customizing images is as simple as chatting using GPT‑4o - just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. Because this model creates more detailed pictures, images take longer to render, often up to one minute.
Autoria
Liderança
Gabriel Goh: Geração de Imagens
Jackie Shannon: ChatGPT Product
Mengchao Zhong, Wayne Chang: Engenharia ChatGPT
Rohan Sahai: Produto e Engenharia Sora
Brendan Quinn, Tomer Kaftan: Inferência
Prafulla Dhariwal: Organização Multimodal
Pesquisa
Pesquisa Fundamental
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Pesquisa Central
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Colaboradores de pesquisa
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Comportamento do Modelo
Laurentia Romaniuk
Organização Multimodal
Andrew Gibiansky, Yang Lu
Dados
Líderes de Dados
Gildas Chabot, James Park Lennon
Dados
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderadores
Hazel Byrne, Jennifer Luckenbill, Mariano López
Consultores de Dados Humanos
Long Ouyang
Escalonamento
Inferência de Liderança
Brendan Quinn, Tomer Kaftan
Inferência
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Aplicado
Líder de Produto do ChatGPT
Jackie Shannon
Líderes de Engenharia do ChatGPT
Mengchao Zhong, Wayne Chang
Líder de Design de Produto
Matt Chan
Ciência de Dados
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao e Yilei Qian
Sora
Líderes de Produto Sora
Rohan Sahai e Wesam Manassra
Sora - Produtos e Engenharia
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai e Wesam Manassra
Segurança
Líder de Segurança
Somay Jain
Segurança
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Estratégia
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan e Zoe Stoll
Marketing e Comunicação
Lideranças de Comunicação e Marketing
Minnia Feng, Natalie Summers e Taya Christianson
Comunicações
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith e Souki Mansoor
Design e Criação
Lideranças
Kendra Rimbach, Veit Moeller
Design
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke e Yara Khakbaz
Agradecimentos especiais
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi e Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






