Сьогодні ми випускаємо нову версію ChatGPT Images, що працює на нашій новій флагманській моделі генерації зображень. Тепер, незалежно від того, чи ви створюєте щось з нуля, чи редагуєте фото, ви отримаєте саме той результат, який уявляєте. Інструмент виконує точні редагування, зберігаючи такі деталі, як зовнішність людей, і генерує зображення до 4 разів швидше. Разом із цим ми представляємо нову функцію Images у ChatGPT, розроблену для того, щоб зробити генерацію зображень захоплюючою, надихати та полегшувати реалізацію творчих ідей
Нова модель та функція Images стануть доступні сьогодні в ChatGPT для всіх користувачів, а також в API як gpt-image-1.5.
Тепер, коли ви просите внести зміни до завантаженого зображення, модель більш точно дотримується вашого запиту — до найменших деталей — змінюючи лише те, що ви просите, і зберігаючи такі елементи, як освітлення, композиція та зовнішність людей, систематично при кожному наступному редагуванні.
Ви отримуєте саме ті результати, які планували отримати: більш корисне редагування фото, більш правдоподібні примірки одягу та зачісок, разом зі стилістичними фільтрами та концептуальними трансформаціями, що зберігають сутність оригінального зображення. Разом ці покращення роблять ChatGPT такою собі творчою студією у вашій кишені, здатною як до практичного редагування, так і до виразного переосмислення.
Модель чудово справляється з різними типами редагування, включаючи додавання, видалення, об'єднання, змішування та перестановку: ви отримуєте потрібні зміни, не втрачаючи того, що робить зображення особливим.
Креативність моделі проявляється через трансформації, які змінюють і додають такі елементи, як текст і макет, дозволяючи втілювати в життя сміливі ідеї, зберігаючи при цьому важливі деталі. Ці трансформації працюють як для простих, так і для складніших концепцій. Ви легко можете спробувати роботу з ними, використовуючи попередньо встановлені стилі та ідеї в новій функції ChatGPT Images(відкривається у новому вікні) без необхідності писати запит.
Модель надійніше дотримується інструкцій, ніж наша початкова версія. Це дозволяє здійснювати точніше редагування, а також створювати складніші оригінальні композиції, де зв'язки між елементами зберігаються належним чином.
Нова версія
Попередня версія
Модель робить ще один крок вперед у рендерингу тексту: тепер вона здатна обробляти щільніший і менший текст.
Модель також покращує додаткові параметри, що забезпечує отримання більш практичних результатів, як-от відображення великої кількості дрібних облич і природний вигляд готових зображень.
Нова версія
Попередня версія
Окрім можливості створення зображень через опис того, що ви хочете побачити, у запиті, ми представляємо спеціальний розділ для Images(відкривається у новому вікні) у ChatGPT, доступний на бічній панелі мобільного додатку та на chatgpt.com. Із ним працювати з інструментом Images стало ще швидше й простіше. У розділі містяться десятки попередньо встановлених фільтрів і творчих запитів, які регулярно оновлюються з урахуванням актуальних тенденцій.
Разом ці оновлення дозволяють вам створювати зображення, які краще відповідають вашому баченню, додаючи невеликі зміни чи переосмислюючи їх повністю.
Ця модель дозволяє оптимізувати бізнес-процеси завдяки швидшій генерації зображень, точнішому редагуванню та збереженню узгодженості візуальних деталей у всіх ітераціях. Команди можуть розробляти нові ідеї, вносити цілеспрямовані зміни та візуалізувати складні або спрощені концепції, без проблем використовуючи інструмент у маркетингу, дизайні, електронній комерції та внутрішніх комунікаціях.
Для оцінки ефективності ми ще раз запустили безліч сценаріїв із нашого початкового запуску генерації зображень. Хоча результати й були дещо недосконалими, у різних випадках модель продемонструвала очевидні покращення. Ця версія представляє значний прогрес, хоча наразі ми досі маємо значний потенціал для подальших удосконалень.
Нова версія
Попередня версія
Все ще є деякі наукові неточності, але ~70% правильних і набагато яскравіших зображень, що дозволяє уникнути передчасного обрізання.
gpt-image-1.5 в API забезпечує всі ті ж покращення, що й ChatGPT Images: він краще зберігає та редагує зображення, ніж GPT Image 1.
Помітне більш послідовне збереження фірмових логотипів та ключових візуальних елементів під час редагування, що робить цю модель чудовим вибором для маркетингової та брендової роботи, наприклад створення графіки та логотипів, а також для команд електронної комерції, які створюють повні каталоги зображень продуктів (варіанти, сцени та ракурси) з одного вихідного зображення.
Вхідні та вихідні зображення в GPT Image 1.5 тепер на 20% дешевші порівняно з GPT Image 1: ви можете генерувати та редагувати ще більше зображень за той самий бюджет.
Ви можете випробувати нову модель у OpenAI Playground(відкривається у новому вікні) або ознайомитися з посібником із написання запитів(відкривається у новому вікні).
Підприємства та стартапи в різних галузях, включаючи інструменти для творчості, електронну комерцію, маркетингове програмне забезпечення та інші, вже використовують GPT Image 1.5. Ми з радістю поділимося деякими з цих прикладів нижче.
Нова версія
Попередня версія
«GPT Image 1.5 створює зображення високої точності з сильною відповідністю запитам, зберігаючи композицію, освітлення та дрібні деталі Результати є чистими, реалістичними та надійними, що сприяє швидшим робочим процесам від концепції до виробництва на таких платформах, як Wix. На основі наших тестувань і основних випадків використання, які ми бачимо в Wix, послідовність і якість змагаються, щоб зробити її однією з провідних моделей генерації зображень сьогодні.»
— Хіла Гат, керівник відділу досліджень у сфері штучного інтелекту та науки про дані в Wix
Новий ChatGPT Images з'являться для всіх користувачів ChatGPT та користувачів API по всьому світу відсьогодні на всіх платформах. Інструмент працює з різними моделями: для його увімкнення вам не потрібно нічого вибирати.
Ми вважаємо, що ми все ще знаходимося на початку того, що може дати можливість генерації зображень. Сьогоднішнє оновлення — це важливий крок вперед, і попереду нас ще багато чого очікує, від детальнішого редагування до багатших і детальніших результатів різними мовами.
Автор
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















