Ma kiadjuk az új csúcskategóriás képgeneráló modellünkkel működtet ChatGPT Images új verzióját. Mostantól akár teljesen elölről kezdve alkotsz valamit, akár egy fotót szerkesztesz, pontosan azt az eredményt kapod, amit elképzeltél. Az eszköz precíz szerkesztésekre képes, miközben érintetlenül hagyja a részleteket, például az emberek megjelenését, és akár négyszer gyorsabban generálja a képeket. Ezzel párhuzamosan bemutatjuk a ChatGPT új Images funkcióját, amellyel élmény a képgenerálás – inspirációt nyújt és megkönnyíti a kreatív kísérletezést
Az új Képek modell és funkció mától kezdve gpt-image-1.5 néven minden felhasználó számára elérhetővé válik a ChatGPT‑ben, és az API-ban.
Mostantól, amikor egy feltöltött kép módosítását kéred, a modell megbízhatóbban követi a szándékodat – egészen a legapróbb részletekig –, és csak azt változtatja meg, amit szeretnél, miközben az olyan elemeket, mint a megvilágítás, a kompozíció és az emberek megjelenése, a bevitel, a kimenet és a későbbi szerkesztések során is következetesen megőrzi.
Ezáltal a szándékodnak megfelelő eredmények érhetőek el – hasznosabb fotószerkesztések, valósághűbb ruházati és hajviseleti próbák, valamint az eredeti kép lényegét megtartó stilisztikai szűrők és koncepcionális átalakítások. Ezekkel a fejlesztésekkel együtt a ChatGPT gyakorlatilag egy zsebedben hordható kreatív stúdióvá válik, amely egyaránt képes praktikus szerkesztésekre és kifejező, újragondolt alkotásokra.
A modell különféle szerkesztési típusokban – hozzáadásban, eltávolításban, egyesítésben, keverésben és áthelyezésben – is kiemelkedően teljesít, így pontosan azokat a változtatásokat kapod meg, amiket szeretnél, anélkül hogy elveszne az, ami igazán különlegessé teszi a képet.
A modell kreativitása igazán az olyan átalakításoknál mutatkozik meg, amelyek alkotóelemek – például szöveg és elrendezés – módosítására vagy hozzáadására szolgálnak, életre keltve ezáltal az ötleteidet, közben megőrizve a fontos részleteket. Ezek az átalakítások egyszerűbb és összetettebb koncepciók esetén is működnek, és könnyen kipróbálhatók az új ChatGPT Images(új ablakban nyílik meg) funkcióban elérhető előre beállított stílusokkal és ötletekkel – nincs szükség beírt utasításra.
A modell megbízhatóbban követi az utasításokat, mint a kezdeti verziónk. Ez pontosabb szerkesztéseket, valamint összetettebb, eredeti kompozíciókat tesz lehetővé, ahol az elemek közötti kapcsolatok a kívánt módon megmaradnak.
Új
Előző
A modell újabb szintre lép a szövegmegjelenítés területén is, és már sűrűbb, kisebb méretű szövegek kezelésére is képes.
A modell további területeken is javult, ami szinte azonnal felhasználható eredményeket jelent, például sok apró arc megjelenítésekor, illetve a kimenetek természetes hatásának mértékében.
Új
Előző
Amellett, hogy üzenetben leírva továbbra is generálhatsz képeket, bevezetünk egy külön Images(új ablakban nyílik meg) felületet is a – mobilalkalmazás oldalsávjában és a chatgpt.com webhelyen elérhető – ChatGPT‑ben, amellyel gyorsabbá és egyszerűbbé tehető a képek felfedezése és próbálgatása. Több tucat előre beállított szűrőt és utasítást tartalmaz, amelyek azonnali inspirációt adnak, és az újonnan megjelenő trendek követése érdekében rendszeresen frissülnek.
Ezek a frissítések lehetővé teszik, hogy képeid az apró módosításoktól egészen a teljesen újragondolt koncepciókig még jobban tükrözzék az elképzeléseidet.
Ez a modell gyorsabb képgenerálással, precíz szerkesztésekkel és az iterációk során következetesen megőrzött vizuális részletekkel teszi gördülékenyebbé az üzleti munkafolyamatokat. A csapatok könnyebben kísérletezhetnek ötletekkel, végezhetnek célzott módosításokat, és tehetnek szemléletessé összetett vagy akár száraz koncepciókat is, legyen szó marketingről, dizájnról, e-kereskedelemről vagy belső kommunikációról.
A teljesítmény kiértékeléséhez újra lefuttattuk a kezdeti képgenerálási bevezetéskor használt számos példát. A modell sokféle esetben egyértelmű fejlődést mutat, bár az eredmények továbbra sem tökéletesek. Bár ez a kiadás jelentős előrelépést jelent, a jövőbeli verziókban még mindig jelentős fejlődési lehetőség van.
Új
Előző
Továbbra is akadnak tudományos pontatlanságok, de körülbelül 70%-ban helyes, a grafika sokkal élénkebb, és elkerüli a korai levágást.
Az API-ban elérhető gpt-image-1.5 ugyanazokat a fejlesztéseket nyújtja, mint a ChatGPT Images: erősebb a képek megőrzésében és szerkesztésében, mint a GPT Image 1.
A szerkesztések során következetesebben megmaradnak a márkázott logók és a kulcsfontosságú vizuális elemek, így különösen jól használható marketing- és márkaépítési feladatokhoz – például grafikai anyagok és logók készítéséhez –, valamint e-kereskedelmi csapatok számára is, akik egyetlen forrásképből teljes termékkép-katalógusokat (változatok, jelenetek, nézőpontok) generálhatnak.
A képbemenetek és -kimenetek a GPT Image 1.5-ben most 20%-kal olcsóbbak, mint a GPT Image 1 esetében, így ugyanakkora költségkeretből több képet generálhatsz és finomíthatsz.
Kipróbálhatod az új modellt az OpenAI Playground(új ablakban nyílik meg) felületén, vagy inspirációért elolvashatod az utasításokra vonatkozó útmutatót(új ablakban nyílik meg).
A kreatív eszközöktől az e-kereskedelmen és marketingszoftvereken át számos iparágban már most is használják a vállalatok és startupok a GPT Image 1.5-ös verzióját. Izgatottan várjuk, hogy megoszthassunk néhány példát.
Új
Előző
„GPT Image 1.5 nagy fokú vizuális hűséggel generál képeket, pontosan követi az utasításokat, és megőrzi a kompozíciót, a megvilágítást és az aprólékos részleteket. Az eredmények letisztultak, élethűek és megbízhatóak, ami gyorsabb koncepciótól gyártásig tartó munkafolyamatokat tesz lehetővé olyan platformokon, mint a Wix. A tesztjeink és a Wixnél látott fő felhasználási esetek alapján az egymással versengő következetességnek és minőségnek köszönhetően joggal tekinthető a mai vezető képgeneráló modellek egyikének.”
– Hila Gat, a Wix AI-kutatásért és adattudományért felelős vezetője
Az új ChatGPT Images mától világszerte fokozatosan elérhető minden ChatGPT- és API-felhasználó számára. Több modellen is működik, így a használatához nem kell külön semmit kiválasztanod.
Úgy gondoljuk, még csak az elején járunk annak, mire lehet képes a képgenerálás. A mai frissítés jelentős előrelépést jelent, és további fejlesztések várhatók, a finomabb szerkesztésektől kezdve a gazdagabb, részletesebb eredményekig számos nyelven.
Szerző
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















