Днес пускаме нова версия на ChatGPT Images, захранвана от нашия нов водещ модел за генериране на изображения. Сега, независимо дали създавате нещо от нулата или редактирате снимка, получавате резултата, който си представяте. Той прави прецизни редакции, запазвайки непокътнати детайли като външния вид на хората, и генерира изображения до 4 пъти по-бързо. Наред с това представяме нова функция в ChatGPT, която цели да направи генерирането на изображения удоволствие, като вдъхновява и улеснява творческото търсене.
Новият модел Images и функцията се пускат днес в ChatGPT за всички потребители и в API като GPT‑image‑1.5.
Сега, когато поискате редакции на качено изображение, моделът се придържа по-надеждно към Вашето намерение—до най-малките детайли—като променя само това, което поискате, и запазва елементи като осветление, композиция и външния вид на хората последователни във въвежданията, изходите и последващите редакции.
Това отключва резултати, които съответстват на вашето намерение — по-практичнифото редакции, по-убедителни проби на облекло и прически, заедно със стилистични филтри и концептуални трансформации, които запазват същността на оригиналното изображение. Заедно тези подобрения означават, че ChatGPT може да действа като творческо студио в джоба Ви, способно както на практични редакции, така и на изразителни преосмисляния.
Моделът се отличава в различни видове редактиране—включително добавяне, премахване, комбиниране, смесване и транспониране—така че получавате промените, които желаете, без да губите това, което прави изображението специално.
Креативните възможности на модела се проявяват в трансформации, които променят и добавят елементи—като текст и оформление—за да вдъхнат живот на идеите, като същевременно запазват важни детайли. Тези трансформации са възможни както за прости, така и за по-сложни концепции и са лесни за изпробване, използвайки предварително зададени стилове и идеи в новата функция ChatGPT Images(отваря се в нов прозорец) — не е необходима текстова подкана.
Моделът следва указанията по-надеждно от нашата първоначална версия. Това позволява по-прецизни редакции, както и по-сложни оригинални композиции, където връзките между елементите са запазени както е предвидено.
Нов
Назад
Моделът прави една стъпка напред в рендерирането на текст, със способността си да обработва по-плътен и по-малък текст.
Моделът също така подобрява допълнителни компоненти, които водят до по-непосредствено използваеми резултати, като например рендериране на много малки лица и това как изглеждат естествените резултати.
Нов
Назад
В допълнение към генерирането на изображения чрез описание на това, което бихте искали да видите, ние въвеждаме специално място за изображения(отваря се в нов прозорец) в ChatGPT—достъпно в страничната лента чрез мобилното приложение и на chatgpt.com—за да направи работата с изображения и изпробването им по-бързо и по-лесно. То включва десетки предварително зададени филтри и подкани, които да вдъхновят, като се актуализират редовно, за да отразяват нововъзникващите тенденции.
Заедно тези подобрения Ви позволяват да създавате изображения, които по-добре отговарят на Вашата визия, от дребни редакции до пълни преосмисляния.
Този модел оптимизира работните процеси в бизнеса с по-бързо генериране на изображения, прецизни редакции и последователност в отделните проби на визуални детайли. Екипите могат да изпробват идеи, да правят целенасочени промени и да визуализират сложни или сухи концепции, като подкрепят примери за употреба в маркетинга, дизайна, електронната търговия и вътрешните комуникации.
Повторно изпробвахме много от примерите от нашето първоначално пускане на генериране на изображения, за да оценим производителността. Моделът показва ясни подобрения в широк спектър от случаи, въпреки че резултатите остават несъвършени. Въпреки че тази версия представлява значителен напредък, все още има значителна възможност за подобрение в бъдещите версии.
Нов
Назад
Все още има някои научни неточности, но ~70% са правилни и графиките са много по-живописни, като се избягва преждевременното изрязване.
gpt-image-1.5 в API предоставя същите подобрения в ChatGPT Images: той е по-силен в запазването и редактирането на изображения от GPT Image 1.
Ще виждате по-последователно запазване на брандирани лога и ключови визуални елементи при редакции, което го прави подходящ за маркетинг и работа с марки като създаване на графики и лога, както и за екипи за електронна търговия, които генерират пълни каталози с продуктови снимки (варианти, сцени и ъгли) от едно изходно изображение.
Въвежданията и изходите на изображения сега са с 20% по-евтини в GPT Image 1.5 в сравнение с GPT Image 1, така че можете да генерирате и създавате повече изображения за същия бюджет.
Можете да изпробвате новия модел в OpenAI Playground(отваря се в нов прозорец) или да прочетете подкана(отваря се в нов прозорец) за вдъхновение.
Предприятия и стартъпи в различни индустрии, включително креативни инструменти, електронна търговия, маркетингов софтуер и други, вече използват GPT Image 1.5. Развълнувани сме да споделим някои от тези примери по-долу.
Нов
Назад
„GPT Image 1.5 осъществява генериране на изображения с висока степен на достоверност с точно придържане към подкани, запазвайки композицията, осветлението и детайлите с висока точност. Резултатите са изчистени, реалистични и надеждни, като подкрепят по-бързи работни процеси от концепция до продукт на платформи като Wix. Въз основа на нашите тестове и основните случаи на употреба, които наблюдаваме в Wix, последователността и качеството се конкурират, за да го направят един от водещите модели за генериране на изображения днес.“
— Хила Гат, ръководител на отдела за ИИ изследвания и наука за данни в Wix
Новият ChatGPT Images вече се разпространява за всички потребители на ChatGPT и API потребители по целия свят днес на всички платформи. Той работи с различни модели, така че не е необходимо да избирате нищо, за да го използвате.
Вярваме, че все още сме в началото на това, което генерирането на изображения може да позволи. Днешната актуализация е значима стъпка напред с още предстоящи подобрения, от по-фини редакции до по-богати и по-подробни резултати на различни езици.
Автор
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















