Apresentamos a Geração de Imagens do 4o
Disponibilizar a geração de imagens úteis e valiosas com um modelo multimodal nativo capaz de produzir resultados precisos, exatos e fotorrealistas.
Na OpenAI, acreditamos há muito tempo que a geração de imagens deve ser uma capacidade primária dos nossos modelos de linguagem. É por isso que integrámos o nosso gerador de imagens mais avançado até agora no GPT‑4o. O resultado—geração de imagens que além de se impressionante, também é útil.
Desde as primeiras pinturas rupestres até aos infográficos modernos, os humanos têm usado imagens para comunicar, persuadir e analisar — não apenas para decorar. Os modelos generativos atuais conseguem criar cenas surreais e de cortar a respiração, mas têm dificuldades com as imagens comuns que as pessoas utilizam para partilhar e criar informação. Desde logótipos a diagramas, as imagens podem transmitir significados precisos quando complementadas com símbolos que remetem para uma linguagem e experiência partilhadas.
A geração de imagens do GPT‑4o destaca-se na renderização precisa de texto, seguindo rigorosamente os prompts e aproveitando a base de conhecimento inerente e o contexto de chat do 4o, incluindo a transformação de imagens carregadas ou a sua utilização como inspiração visual. Estas funcionalidades facilitam a criação exata da imagem que idealiza, ajudando-o a comunicar de forma mais eficaz através de recursos visuais e transformando a geração de imagens numa ferramenta prática, precisa e poderosa.
Treinamos os nossos modelos na distribuição conjunta de imagens e textos online, aprendendo não só como as imagens se relacionam com a linguagem, mas também como se relacionam entre si. Combinado com um pós-treino agressivo, o modelo resultante apresenta uma fluência visual surpreendente, capaz de gerar imagens úteis, consistentes e contextualizadas.
Uma imagem vale mais do que mil palavras, mas por vezes, algumas palavras colocadas no lugar certo podem elevar o significado de uma imagem. A capacidade do 4o de combinar símbolos precisos com imagens transforma a geração de imagens numa ferramenta de comunicação visual.
Como a geração de imagens agora é nativa do GPT‑4o, podes refinar imagens através de conversas naturais. O GPT‑4o pode basear-se em imagens e texto no contexto do chat, garantindo consistência em todo o processo. Por exemplo, se estiveres a desenhar a personagem de um videojogo, a aparência da personagem mantém-se coerente em várias iterações à medida que refinas e experimentas.
A geração de imagens do GPT‑4o segue prompts detalhados com atenção aos detalhes. Enquanto outros sistemas têm dificuldades com cerca de 5 a 8 objetos, o GPT‑4o consegue lidar com até 10 a 20 objetos diferentes. A maior ligação dos objetos às suas caraterísticas e relações permite um melhor controlo.
O GPT‑4o consegue analisar e aprender com imagens enviadas pelos utilizadores, integrando perfeitamente os detalhes dessas imagens no seu contexto para gerar novas imagens.
A geração de imagens nativa permite que a 4o ligue o seu conhecimento entre texto e imagens, resultando num modelo que parece mais inteligente e eficiente.
O treino com imagens que refletem uma vasta gama de estilos permite ao modelo criar ou transformar imagens de forma convincente.
O nosso modelo não é perfeito. Estamos cientes de várias limitações neste momento, as quais trabalharemos para resolver através de melhorias no modelo após o lançamento inicial.

Notámos que o GPT‑4o recorta ocasionalmente imagens mais longas, como cartazes, de forma muito apertada, especialmente na parte inferior.
Em linha com a nossa Especificação de Modelo, procuramos maximizar a liberdade criativa, aceitando casos de utilização valiosos, como o desenvolvimento de jogos, a exploração histórica e a educação, mantendo, ao mesmo tempo, elevadas normas de segurança. Ao mesmo tempo, continua a ser tão importante como sempre bloquear pedidos que violem essas normas. Abaixo, apresentamos avaliações de áreas de risco adicionais em que estamos a trabalhar para viabilizar conteúdo seguro e de elevada utilidade, além de permitir uma expressão criativa mais ampla para os utilizadores.
Proveniência via C2PA e pesquisa interna reversível
Todas as imagens geradas vêm com metadados C2PA, que identificam uma imagem como originária do GPT‑4o, para garantir transparência. Também desenvolvemos uma ferramenta de pesquisa interna que utiliza atributos técnicos das gerações para ajudar a verificar se o conteúdo foi gerado pelo nosso modelo.
Bloqueio de conteúdo prejudicial
Continuamos a bloquear pedidos de imagens geradas que possam violar as nossas políticas de conteúdo, como materiais de abuso sexual infantil e deepfakes sexuais. Quando imagens de pessoas reais estão em contexto, temos restrições mais rigorosas sobre o tipo de imagens que podem ser criadas, com salvaguardas particularmente robustas em relação à nudez e à violência gráfica. Como em qualquer lançamento, a segurança nunca está finalizada e é, na verdade, uma área de investimento contínuo. À medida que aprendermos mais sobre a utilização prática deste modelo, ajustaremos as nossas políticas em conformidade.
Para mais informações sobre a nossa abordagem, visita a adenda ao cartão do sistema GPT‑4o sobre a geração de imagens.
Utilizando o raciocínio para promover a segurança
À semelhança do nosso trabalho de alinhamento deliberativo , treinamos um LLM de raciocínio para trabalhar diretamente com especificações de segurança escritas por humanos e interpretáveis. Utilizámos este LLM de raciocínio durante o desenvolvimento para nos ajudar a identificar e resolver ambiguidades nas nossas políticas. Juntamente com os nossos avanços multimodais e as técnicas de segurança existentes desenvolvidas para o ChatGPT e o Sora, isto permite-nos moderar tanto o texto de entrada como as imagens resultantes de acordo com as nossas políticas.
A geração de imagens 4o começa hoje a ser implementada para os utilizadores Plus, Pro, Team e Free como o gerador de imagens predefinido no ChatGPT, com acesso em breve para as versões Enterprise e Edu. Também está disponível para usar no Sora. Para aqueles que têm um lugar especial nos seus corações para o DALL·E, ainda é possível aceder-lhe através de um DALL·E GPT dedicado.
Em breve, os programadores poderão gerar imagens com o GPT‑4o através da API, com o acesso a ser disponibilizado nas próximas semanas.
Criar e personalizar imagens é tão simples quanto usar o chat com o GPT‑4o - basta descrever o que precisas, incluindo quaisquer detalhes como proporções, cores exatas usando códigos hexadecimais ou um fundo transparente. Como este modelo cria imagens mais detalhadas, as imagens demoram mais tempo a serem renderizadas, frequentemente até um minuto.
Autor
Liderança
Gabriel Goh: geração de imagens
Jackie Shannon: produto ChatGPT
Mengchao Zhong, Wayne Chang: engenharia do ChatGPT
Rohan Sahai: produto e engenharia Sora
Brendan Quinn, Tomer Kaftan: inferência
Prafulla Dhariwal: organização multimodal
Investigação
Investigação fundamental
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Investigação central
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Colaboradores de investigação
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Comportamento do modelo
Laurentia Romaniuk
Organização multimodal
Andrew Gibiansky, Yang Lu
Dados
Leads de dados
Gildas Chabot, James Park Lennon
Dados
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderadores
Hazel Byrne, Jennifer Luckenbill e Mariano López
Consultores de dados humanos
Long Ouyang
Escala
Leads de inferência
Brendan Quinn, Tomer Kaftan
Inferência
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Aplicado
Lead de produto ChatGPT
Jackie Shannon
Lead de engenharia ChatGPT
Mengchao Zhong, Wayne Chang
Lead de design de produto
Matt Chan
Ciência de dados
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Leads de produto Sora
Rohan Sahai, Wesam Manassra
Produto e engenharia Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Segurança
Lead de segurança
Somay Jain
Segurança
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Estratégia
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketing e comunicações
Leads de marketing e comunicações
Minnia Feng, Natalie Summers e Taya Christianson
Comunicações
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Design e criação
Leads
Kendra Rimbach, Veit Moeller
Design
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke e Yara Khakbaz
Agradecimentos Especiais
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






