Hoje, estamos a lançar uma nova versão do ChatGPT Imagens, impulsionada pelo nosso novo modelo de geração de imagens de referência. Agora, quer esteja a criar algo de raiz ou a editar uma fotografia, obtém o resultado que está a imaginar. Faz edições precisas, mantendo intactos detalhes como a aparência das pessoas, e gera imagens até 4x mais depressa. Em paralelo, estamos a apresentar uma nova funcionalidade Imagens no ChatGPT, concebida para tornar a geração de imagens mais agradável — para despertar inspiração e tornar a exploração criativa simples
O novo modelo e a nova funcionalidade Imagens estão a ser disponibilizados hoje no ChatGPT para todos os utilizadores e, na API, como gpt-image-1.5.
Agora, ao pedir edições a uma imagem carregada, o modelo segue a intenção de forma mais fiável — até aos detalhes mais pequenos — alterando apenas o que é pedido e mantendo elementos como a iluminação, a composição e a aparência das pessoas consistentes entre inputs, outputs e edições subsequentes.
Isto desbloqueia resultados que correspondem à intenção — edições de fotografia mais úteis, simulações de roupa e penteados mais realistas, bem como filtros estilísticos e transformações conceptuais que preservam a essência da imagem original. Em conjunto, estas melhorias significam que o ChatGPT pode funcionar como um estúdio criativo no bolso, capaz de fazer edições práticas e reimaginações expressivas.
O modelo destaca-se em diferentes tipos de edição — incluindo adicionar, remover, combinar, misturar e transpor — para obter as alterações pretendidas sem perder o que torna a imagem especial.
A criatividade do modelo brilha em transformações que alteram e acrescentam elementos — como texto e layout — para dar vida às ideias, preservando detalhes importantes. Estas transformações funcionam tanto para conceitos simples como para conceitos mais complexos e são fáceis de experimentar com estilos e ideias predefinidos na nova funcionalidade ChatGPT Imagens (abre numa nova janela)— não é necessário escrever um prompt.
O modelo segue instruções de forma mais fiável do que a nossa versão inicial. Isto permite edições mais precisas, bem como composições originais mais complexas, em que as relações entre os elementos são preservadas como pretendido.
Novo
Anterior
O modelo dá mais um passo na renderização de texto, sendo capaz de lidar com texto mais denso e mais pequeno.
O modelo também melhora noutras dimensões que se traduzem em resultados imediatamente mais utilizáveis, como a renderização de muitos rostos pequenos e o aspeto mais natural dos resultados.
Novo
Anterior
Para além de gerar imagens ao descrever o que pretende ver numa mensagem, estamos a introduzir um espaço dedicado a Imagens(abre numa nova janela) no ChatGPT — disponível na barra lateral na aplicação móvel e em chatgpt.com — para tornar mais rápido e fácil explorar e experimentar imagens. Inclui dezenas de filtros e prompts predefinidos para dar um impulso inicial à inspiração, atualizados regularmente para refletir tendências emergentes.
Em conjunto, estas melhorias permitem criar imagens que correspondem melhor ao que se tem em mente, desde pequenas edições a reimaginações completas.
Este modelo simplifica fluxos de trabalho empresariais com geração de imagens mais rápida, edições precisas e detalhes visuais consistentes entre iterações. As equipas podem explorar ideias, fazer alterações direcionadas e visualizar conceitos complexos ou pouco apelativos, apoiando casos de utilização em marketing, design, e-commerce e comunicações internas.
Voltámos a executar muitos dos exemplos do nosso lançamento inicial de geração de imagens para avaliar o desempenho. O modelo mostra melhorias claras numa série de casos, embora os resultados continuem imperfeitos. Embora esta versão represente um avanço significativo, ainda há uma margem considerável para melhorar em iterações futuras.
Novo
Anterior
Ainda há algumas imprecisões científicas, mas está ~70% correto e com visuais bem mais vibrantes, evitando cortes prematuros.
gpt-image-1.5 na API oferece as mesmas melhorias do ChatGPT Imagens: é mais forte na preservação e edição de imagens do que o GPT Image 1.
Verifica-se uma preservação mais consistente de logótipos de marca e visuais-chave entre edições — o que o torna bem adequado para marketing e trabalho de marca, como criação de gráficos e logótipos, e para equipas de e-commerce que geram catálogos completos de imagens de produto (variantes, cenários e ângulos) a partir de uma única imagem de origem.
Os inputs e outputs de imagem são agora 20% mais baratos no GPT Image 1.5 do que no GPT Image 1, permitindo gerar e iterar sobre mais imagens com o mesmo orçamento.É possível experimentar o novo modelo no OpenAI Playground(abre numa nova janela) ou ler o guia de prompts(abre numa nova janela) para inspiração.
Empresas e startups de vários setores, incluindo ferramentas criativas, e-commerce, software de marketing e muito mais, já estão a usar o GPT Image 1.5. Estamos entusiasmados por partilhar alguns destes exemplos abaixo.
Novo
Anterior
«O GPT Image 1.5 gera imagens de alta fidelidade, seguindo o prompt com precisão e preservando composição, iluminação e detalhes minuciosos. Os resultados são limpos, realistas e confiáveis, apoiando fluxos de trabalho mais rápidos do conceito à produção em plataformas como o Wix. Com base nos nossos testes e nos principais casos de uso que vemos no Wix, a consistência e a qualidade fazem dele um dos principais modelos de geração de imagens atualmente.”
— Hila Gat, Head de Pesquisa em IA e Ciência de Dados no Wix
O novo ChatGPT Imagens está agora a ser disponibilizado a todos os utilizadores do ChatGPT e da API, em todo o mundo, em todas as plataformas. Funciona em todos os modelos, pelo que não é necessário selecionar nada para o usar.
Acreditamos que ainda estamos no início do que a geração de imagens pode permitir. A atualização de hoje é um avanço significativo, com muito mais por vir, desde edições mais granulares a outputs mais ricos e detalhados em várias línguas.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















