Сегодня мы выпускаем новую версию ChatGPT Картинки, работающую на базе нашей новой флагманской модели генерации изображений. Теперь, будь то создание чего-либо с нуля или редактирование фотографии, вы получите именно тот результат, который себе представляете. Модель выполняет точные правки, сохраняя такие детали, как внешность людей, и формирует изображения до 4 раз быстрее. Наряду с этим мы представляем новую функцию Картинок в ChatGPT, созданную, чтобы сделать генерацию изображений увлекательной — она вдохновляет и делает творческий поиск легким.
Новая модель и функция Картинок начинают внедряться уже сегодня в ChatGPT для всех пользователей, а также в API как gpt-image-1.5.
Теперь, когда вы запрашиваете изменения в загруженном изображении, модель более надежно следует вашему намерению — вплоть до мелких деталей — изменяя только то, что вы просите, при этом сохраняя такие элементы, как освещение, композиция и внешний вид людей, неизменными в исходном изображении, в результатах и при последующих правках.
Это открывает доступ к результатам, которые соответствуют вашему намерению — более полезные правки фотографий, более правдоподобные примерки одежды и причесок, а также стилистические фильтры и концептуальные преобразования, которые сохраняют суть оригинального изображения. Вместе эти улучшения означают, что ChatGPT может выступать в роли творческой студии у вас в кармане, способной как на практические правки, так и на впечатляющие переосмысления.
Модель превосходно справляется с различными типами редактирования, включая добавление, удаление, комбинирование, смешивание и перестановку, так что вы получаете желаемые изменения, не теряя того, что делает изображение особенным.
Креативность модели проявляется через трансформации, которые изменяют и добавляют элементы, такие как текст и макет, чтобы воплощать идеи в жизнь, сохраняя важные детали. Эти преобразования работают как для простых, так и для более сложных концепций и их легко опробовать, используя предустановленные стили и идеи в новой функции ChatGPT Картинки(открывается в новом окне) — при этом промпт писать не нужно.
Модель следует инструкциям более надежно, чем наша первоначальная версия. Это включает более точные правки, а также создание более сложных оригинальных композиций, где связи между элементами сохраняются так, как задумано.
Новинка
Прежняя версия
Модель делает еще один шаг вперед в рендеринге текста и теперь способна обрабатывать текст меньшего размера и с более плотной версткой.
Модель также улучшает и другие параметры качества — это дает более пригодные для использования результаты, например корректный рендеринг множества небольших лиц и более естественный вид итоговых изображений.
Новинка
Прежняя версия
В дополнение к генерации изображений через описание в сообщении того, что вы хотели бы увидеть, мы представляем специальный раздел Картинки(открывается в новом окне) в ChatGPT — доступен в боковой панели в мобильном приложении и на chatgpt.com — который позволит быстрее и легче изучать и пробовать Картинки. Раздел включает в себя десятки предустановленных фильтров и промптов для вдохновения, которые регулярно обновляются, отражая новые тенденции.
Вместе эти обновления позволяют вам создавать изображения, которые лучше соответствуют вашему видению, от небольших правок до полного переосмысления.
Эта модель упрощает рабочие процессы благодаря более быстрой генерации изображений, точным правкам и стабильным визуальным деталям на всех итерациях. Команды могут изучать идеи, вносить целенаправленные изменения и визуализировать сложные или абстрактные концепции — для сценариев использования в маркетинге, дизайне, электронной коммерции и внутренних коммуникациях.
Мы заново прогнали многие примеры из нашего первоначального запуска генерации изображений, чтобы оценить производительность. Модель демонстрирует явные улучшения в ряде сценариев, хотя результаты все еще остаются несовершенными. Хотя это обновление представляет собой значительный прогресс, в будущих итерациях еще остается немало возможностей для улучшений.
Новинка
Прежняя версия
Все еще присутствуют некоторые научные неточности, но около 70 % правильно, и графика значительно более яркая, избегает преждевременного обрезания.
gpt-image-1.5 в API предоставляет все те же улучшения, что и ChatGPT Картинки: эта модель лучше сохраняет и редактирует изображения, чем GPT Image 1.
Вы увидите более стабильное сохранение фирменных логотипов и ключевых визуальных элементов при редактировании — благодаря чему модель хорошо подходит для маркетинга и брендовых задач (например, для создания графики и логотипов), а также для команд в электронной коммерции, создающих полные каталоги изображений товаров (варианты, сцены и ракурсы) из одного исходного изображения.
Ввод и вывод изображений теперь на 20 % дешевле в GPT Image 1.5 по сравнению с GPT Image 1, так что вы можете генерировать и итеративно улучшать больше изображений за тот же бюджет.
Вы можете попробовать новую модель в OpenAI Playground(открывается в новом окне) или прочитать руководство по созданию промптов(открывается в новом окне) для вдохновения.
Корпорации и стартапы в различных отраслях, включая производителей инструментов для творчества, электронную коммерцию, маркетингового программного обеспечения и другие, уже используют GPT Картинки 1.5. Ниже мы с радостью приведём несколько таких примеров.
Новинка
Прежняя версия
«GPT Image 1.5 формирует изображения высокого разрешения с точным соблюдением подсказок, сохраняя композицию, освещение и мелкие детали. Результаты чистые, реалистичные и надежные, что способствует более быстрым рабочим процессам от концепции до производства на таких платформах, как Wix. Основываясь на наших тестах и основных сценариях использования, которые мы видим в Wix, согласованность и качество делают её одной из ведущих моделей генерации изображений на сегодняшний день».
— Хила Гат, руководитель отдела исследований ИИ и науки о данных в Wix
Новая функция ChatGPT Картинки начинает внедряться уже сегодня для всех пользователей ChatGPT и API по всему миру на всех платформах. Функция работает со всеми моделями, поэтому дополнительно выбирать ничего не нужно.
Мы считаем, что возможности генерации изображений только начинают раскрываться. Сегодняшнее обновление — это значительный шаг, и впереди нас ждет еще больше: от более точных правок до более насыщенных и подробных результатов на разных языках.
Автор
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















