Hoje, estamos lançando uma nova versão do ChatGPT Imagens, impulsionada pelo nosso novo modelo de ponta de geração de imagens. Agora, seja criando algo do zero ou editando uma foto, você vai obter o resultado que está imaginando. Ele faz edições precisas mantendo intactos detalhes como a aparência das pessoas e gera imagens até 4x mais rápido. Além disso, estamos lançando um novo recurso de Imagens no ChatGPT, feito para tornar a geração de imagens mais prazerosa — para despertar inspiração e facilitar a exploração criativa
O novo modelo e o novo recurso de Imagens começam a ser disponibilizados hoje no ChatGPT para todos os usuários e na API como gpt-image-1.5.
Agora, quando você pede para editar uma imagem enviada, o modelo segue sua intenção com mais consistência — até nos pequenos detalhes — mudando apenas o que você pediu e mantendo elementos como iluminação, composição e a aparência das pessoas consistentes entre entradas, saídas e edições posteriores.
Isso desbloqueia resultados que combinam com sua intenção — edições de foto mais úteis, testes de roupa e penteado mais realistas, além de filtros de estilo e transformações conceituais que preservam a essência da imagem original. Juntas, essas melhorias fazem com que o ChatGPT possa atuar como um estúdio criativo no seu bolso, capaz de realizar edições práticas e reinvenções mais expressivas.
O modelo se destaca em diferentes tipos de edição — incluindo adicionar, remover, combinar, mesclar e transpor — para que você consiga as mudanças que quer sem perder o que torna a imagem especial.
A criatividade do modelo aparece em transformações que mudam e adicionam elementos — como texto e layout — para dar vida às ideias, preservando detalhes importantes. Essas transformações funcionam tanto para conceitos simples quanto para ideias mais complexas e são fáceis de testar com estilos e ideias pré-definidos no novo recurso ChatGPT Imagens(abre em uma nova janela) — sem precisar escrever um prompt.
O modelo segue instruções de forma mais confiável do que nossa versão inicial. Isso permite edições mais precisas e composições originais mais complexas, em que as relações entre os elementos são preservadas como você pretendia.
Novo
Anterior
O modelo dá mais um passo na renderização de texto, conseguindo lidar com textos menores e mais densos.
O modelo também melhora em outros aspectos que se traduzem em resultados mais prontos para uso, como renderizar muitos rostos pequenos e deixar as imagens com aparência mais natural.
Novo
Anterior
Além de gerar imagens descrevendo o que você quer ver em uma mensagem, estamos criando um espaço dedicado para Imagens(abre em uma nova janela) no ChatGPT — disponível na barra lateral no app para celular e em chatgpt.com — para tornar mais rápido e fácil explorar e testar imagens. Ele inclui dezenas de filtros e prompts pré-definidos para dar o pontapé inicial na inspiração, atualizados regularmente para refletir tendências emergentes.
Juntas, essas atualizações permitem criar imagens que combinam melhor com sua visão, desde pequenos ajustes até reinvenções completas.
Esse modelo agiliza fluxos de trabalho profissionais com geração de imagens mais rápida, edições precisas e detalhes visuais consistentes entre iterações. Equipes podem explorar ideias, fazer mudanças pontuais e visualizar conceitos complexos ou pouco atraentes, dando suporte a casos de uso em marketing, design, e-commerce e comunicações internas.
Rodamos novamente muitos exemplos do nosso lançamento inicial de geração de imagens para avaliar o desempenho. O modelo mostra melhorias claras em vários casos, embora os resultados ainda não sejam perfeitos. Embora esta versão represente um avanço significativo, ainda há um espaço considerável para melhorias nas próximas iterações.
Novo
Anterior
Ainda há algumas imprecisões científicas, mas está ~70% correto e com visuais bem mais vibrantes, evitando cortes prematuros.
O gpt-image-1.5 na API traz as mesmas melhorias do ChatGPT Imagens: ele é melhor em preservação e edição de imagens do que o GPT Image 1.
Você verá uma preservação mais consistente de logotipos e elementos visuais-chave da marca entre edições — o que o torna ideal para trabalhos de marketing e marca, como criação de artes e logotipos, e para equipes de e-commerce que geram catálogos completos de imagens de produto (variações, cenários e ângulos) a partir de uma única imagem de origem.
As entradas e saídas de imagem agora são 20% mais baratas no GPT Image 1.5 em comparação com o GPT Image 1, para que você possa gerar e iterar mais imagens com o mesmo orçamento.
Você pode testar o novo modelo no OpenAI Playground(abre em uma nova janela) ou ler o guia de prompts(abre em uma nova janela) para se inspirar.
Empresas e startups de setores como ferramentas criativas, e-commerce, software de marketing e outros já estão usando o GPT Image 1.5. Estamos animados para compartilhar alguns desses exemplos a seguir.
Novo
Anterior
“O GPT Image 1.5 gera imagens de alta fidelidade, seguindo o prompt com precisão e preservando composição, iluminação e detalhes minuciosos. Os resultados são limpos, realistas e confiáveis, apoiando fluxos de trabalho mais rápidos do conceito à produção em plataformas como o Wix. Com base nos nossos testes e nos principais casos de uso que vemos no Wix, a consistência e a qualidade fazem dele um dos principais modelos de geração de imagens atualmente.”
— Hila Gat, Head de Pesquisa em IA e Ciência de Dados no Wix
O novo ChatGPT Imagens começa a ser disponibilizado hoje, globalmente, para todos os usuários do ChatGPT e da API, em todas as plataformas. Ele funciona em todos os modelos, então você não precisa selecionar nada para usar.
Acreditamos que ainda estamos no começo do que a geração de imagens pode viabilizar. A atualização de hoje é um passo importante, e vem muito mais por aí — de edições mais granulares a resultados mais ricos e detalhados em vários idiomas.
Autoria
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















