La nueva función de Imágenes de ChatGPT ya está aquí
Hoy lanzamos una nueva versión de ChatGPT Imágenes, impulsada por nuestro modelo insignia de generación de imágenes. Tanto si partes de cero como si editas una foto, ahora puedes conseguir exactamente el resultado que tienes en mente. Realiza ediciones precisas sin perder detalles importantes, como la apariencia de las personas, y genera imágenes hasta cuatro veces más rápido. Además, presentamos una nueva experiencia de imágenes dentro de ChatGPT, diseñada para que crear imágenes sea más agradable, para despertar nuevas ideas y facilitar la exploración creativa.
El nuevo modelo de imágenes y la función ya están disponibles desde hoy en ChatGPT para todos los usuarios y en la API bajo el nombre GPT‑image‑1.5.
Ahora, cuando solicitas editar una imagen que has subido, el modelo sigue tu intención creativa de manera más fiable, incluso en los detalles más pequeños. Solo modifica lo que pides y mantiene elementos consistentes, como la iluminación, la composición y la apariencia de las personas, tanto en las imágenes que subes como en los resultados y en las ediciones posteriores.
Esto te permite obtener resultados que se ajustan a tu intención: ediciones de fotos más útiles, pruebas de vestuario y peinados más realistas, junto con filtros estilísticos y transformaciones conceptuales que conservan la esencia de la imagen original. En conjunto, estas mejoras convierten a ChatGPT en un estudio creativo en tu bolsillo, capaz de realizar tanto ediciones prácticas como reinterpretaciones expresivas.
El modelo destaca en distintos tipos de edición, como agregar, eliminar, combinar, mezclar y transponer, para que consigas los cambios que deseas sin perder lo que hace especial a la imagen.
La creatividad del modelo se refleja en las transformaciones que modifican o añaden elementos, como texto y diseño, dando vida a tus ideas sin perder los detalles importantes. Estas transformaciones funcionan tanto con conceptos simples como con los más complejos y se pueden probar fácilmente con los estilos y las ideas predeterminadas en la nueva función de ChatGPT Imágenes(se abre en una ventana nueva), sin necesidad de prompts escritos.
Este modelo sigue las instrucciones de forma más confiable que nuestra versión inicial. Lo que permite realizar ediciones más precisas y composiciones originales más complejas, manteniendo las relaciones entre los elementos tal como se pretendía.
Nuevo
Anterior
El modelo mejora su manejo del texto y ofrece precisión incluso en los caracteres más pequeños y densos.
El modelo también mejora en otras dimensiones y entrega resultados más listos para usar, como la forma en que se muestran múltiples caras pequeñas y el aspecto más natural de las imágenes.
Nuevo
Anterior
Además de generar imágenes con solo describir lo que quieres ver, presentamos un espacio dedicado a Imágenes(se abre en una ventana nueva) en ChatGPT, disponible en la barra lateral de la app móvil y en chatgpt.com. Explorar y probar imágenes ahora es más rápido y sencillo. Incluye decenas de filtros y prompts predefinidos que estimulan la creatividad, actualizados regularmente para reflejar las tendencias emergentes.
Estas mejoras te permiten crear imágenes que se ajusten mejor a tu visión, desde pequeñas ediciones hasta transformaciones completas.
Este modelo mejora los flujos de trabajo empresariales al ofrecer generación de imágenes más rápida, ediciones precisas y resultados visuales consistentes en cada versión. Los equipos pueden explorar ideas, realizar cambios puntuales y visualizar conceptos complejos o abstractos, apoyando casos de uso en marketing, diseño, comercio electrónico y comunicación interna.
Volvimos a probar muchos de los ejemplos de nuestro lanzamiento inicial de generación de imágenes para evaluar el rendimiento. El modelo muestra mejoras claras en una variedad de casos, aunque los resultados aún no son perfectos. Este lanzamiento supone un avance significativo, pero todavía queda un amplio margen de mejora para las versiones futuras.
Nuevo
Anterior
Aún existen algunas inexactitudes científicas, pero el modelo acierta alrededor del 70 % de las veces y genera gráficos mucho más vivos, evitando recortes prematuros.
GPT‑image‑1.5 en la API ofrece todas las mismas mejoras que ChatGPT Imágenes: es más eficaz para preservar y editar imágenes que GPT Image 1.
Notarás una preservación más consistente de los logotipos de marca y otros elementos visuales clave en las ediciones, lo que lo hace ideal para trabajos de marketing y branding, como la creación de gráficos y logotipos, así como para equipos de comercio electrónico que generan catálogos completos de imágenes de productos (variantes, escenas y ángulos) a partir de una sola imagen fuente.
Las imágenes de entrada y salida ahora cuestan un 20 % menos en GPT Image 1.5 que en GPT Image 1, lo que te permite generar y ajustar más imágenes con el mismo presupuesto.Puedes probar el nuevo modelo en el OpenAI Playground(se abre en una ventana nueva) o consultar la guía de prompts(se abre en una ventana nueva) para inspirarte.
Empresas y startups de distintos sectores, como herramientas creativas, comercio electrónico, software de marketing y más, ya están usando GPT Image 1.5. Nos entusiasma compartir algunos de estos ejemplos a continuación.
Nuevo
Anterior
«GPT Imagen 1.5 genera imágenes de alta fidelidad que siguen fielmente los prompts, preservando la composición, la iluminación y los detalles minuciosos. Los resultados son limpios, realistas y fiables, lo que facilita flujos de trabajo de concepto a producción más rápidos en plataformas como Wix. Según nuestras pruebas y los principales casos de uso observados en Wix, la consistencia y la calidad hacen de este uno de los modelos de generación de imágenes insignia en la actualidad».
— Hila Gat, jefa de investigación de IA y ciencia de datos en Wix
La nueva ChatGPT Imágenes se está desplegando ahora para todos los usuarios de ChatGPT y de la API a nivel mundial hoy en todas las plataformas. Funciona en todos los modelos, así que no necesitas seleccionar nada para usarlo.
Creemos que todavía estamos al principio de lo que la generación de imágenes puede habilitar. La actualización de hoy es un paso significativo hacia adelante, con más por venir, desde ediciones más precisas hasta resultados más ricos y detallados en todos los idiomas.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















