Dnes uvádzame novú verziu ChatGPT Images, poháňanú naším novým vlajkovým modelom na generovanie obrázkov. Teraz, či už niečo vytvoríte od začiatku alebo upravujete fotografiu, dostanete výsledok, ktorý si predstavujete. Vykonáva presné úpravy pri zachovaní detailov, ako je vzhľad ľudí, a generuje obrázky až štyrikrát rýchlejšie. Súčasne predstavujeme novú funkciu obrázkov v rámci ChatGPT, ktorá je navrhnutá tak—aby generovanie obrázkov bolo príjemné, podnecovalo inšpiráciu a uľahčovalo kreatívne objavovanie.
Nový model a funkcia Images sa dnes začínajú zavádzať v ChatGPT pre všetkých používateľov a v API ako gpt-image-1.5.
Teraz, keď požiadate o úpravy nahratého obrázka, model spoľahlivejšie dodržiava váš zámer—do najmenších detailov—mení iba to, čo požadujete, pričom zachováva prvky ako osvetlenie, kompozíciu a vzhľad ľudí konzistentné medzi vstupmi, výstupmi a následnými úpravami.
Toto odomyká výsledky, ktoré zodpovedajú vášmu zámeru–užitočnejšie úpravy fotografií, dôveryhodnejšie skúšanie oblečenia a účesov so štýlovými filtrami a koncepčnými transformáciami, ktoré zachovávajú podstatu pôvodného obrázka. Tieto vylepšenia znamenajú, že ChatGPT môže pôsobiť ako kreatívne štúdio vo vašom vrecku, schopné praktických úprav aj expresívnych prepracovaní.
Model vyniká v rôznych typoch úprav—vrátane pridávania, odoberania, kombinovania, miešania a transponovania—takže dosiahnete požadované zmeny bez straty toho, čo robí obrázok výnimočným.
Kreativita modelu sa prejavuje prostredníctvom transformácií, ktoré menia a pridávajú prvky—ako text a rozloženie—aby vdýchli život nápadom, pričom zachovávajú dôležité detaily. Tieto transformácie fungujú pre jednoduché aj zložitejšie koncepty a dajú sa ľahko vyskúšať pomocou prednastavených štýlov a nápadov v novej funkcii ChatGPT Images(otvorí sa v novom okne) —nie je potrebný žiadny písomný príkaz.
Model dodržiava pokyny spoľahlivejšie ako naša počiatočná verzia. Toto umožňuje presnejšie úpravy, ako aj zložitejšie pôvodné kompozície, kde sú vzťahy medzi prvkami zachované podľa zámeru.
Nový
Predchádzajúci
Model urobí ďalší krok vpred vo vykresľovaní textu, schopný spracovať hustejší a menší text.
Model tiež vylepšuje ďalšie aspekty, ktoré sa premietajú do okamžite použiteľnejších výstupov, ako je vykresľovanie mnohých malých tvárí a prirodzený vzhľad výstupov.
Nový
Predchádzajúci
Okrem generovania obrázkov opísaním toho, čo by ste chceli vidieť v správe, predstavujeme vyhradenú sekciu pre Images(otvorí sa v novom okne) v ChatGPT—dostupnú v bočnom paneli prostredníctvom mobilnej aplikácie a na chatgpt.com— s cieľom uľahčiť a zrýchliť skúmanie a skúšanie obrázkov. Obsahuje desiatky prednastavených filtrov a príkazov na naštartovanie inšpirácie, ktoré sa pravidelne aktualizujú, aby odrážali nové trendy.
Tieto vylepšenia vám umožňujú vytvoriť obrázky, ktoré lepšie zodpovedajú vašej vízii, od malých úprav až po úplné prepracovania.
Tento model zjednodušuje Business pracovné postupy rýchlejším generovaním obrázkov, presnými úpravami a konzistentnými vizuálnymi detailmi naprieč iteráciami. Tímy môžu skúmať nápady, robiť cielené zmeny a vizualizovať zložité alebo suché koncepty, podporujúc použitie v oblastiach ako marketing, dizajn, e-commerce a interná komunikácia.
Znovu sme spustili mnoho príkladov z nášho počiatočného spustenia generovania obrázkov, aby sme vyhodnotili výkonnosť. Model ukazuje jasné zlepšenia v rôznych prípadoch, aj keď výsledky zostávajú nedokonalé. Aj keď táto verzia predstavuje významný pokrok, stále je značný priestor na zlepšenie v budúcich iteráciách.
Nový
Predchádzajúci
Stále existujú niektoré vedecké nepresnosti, ale približne 70% je správnych a grafika je oveľa živšia, vyhýba sa predčasnému orezaniu.
gpt-image-1.5 v API prináša všetky rovnaké vylepšenia ako ChatGPT Images: je lepší v zachovaní a úprave obrázkov než GPT Image 1.
Uvidíte konzistentnejšie zachovanie značkových log a kľúčových vizuálov naprieč úpravami—čo ho robí vhodným pre marketing a prácu so značkou, ako je tvorba grafiky a log, a pre tímy v oblasti e-commerce, ktoré generujú kompletné katalógy produktových obrázkov (varianty, scény a uhly) z jedného zdrojového obrázka.
Vstupy a výstupy obrázkov sú teraz o 20 % lacnejšie v GPT Image 1.5 v porovnaní s GPT Image 1, takže môžete generovať a iterovať viac obrázkov za rovnaký budget.
Nový model môžete vyskúšať v OpenAI Playground(otvorí sa v novom okne) alebo si pre inšpiráciu prečítať sprievodcu príkazmi(otvorí sa v novom okne).
Podniky a startupy z rôznych odvetví, vrátane kreatívnych nástrojov, e-commerce, marketingového softvéru a ďalších, už používajú GPT Image 1.5. Máme radosť, že sa o ne s vami môžeme nižšie podeliť.
Nový
Predchádzajúci
"GPT Image 1.5 generuje vysokokvalitné obrázky s dôrazom na presnosť príkazu, pričom zachováva kompozíciu, osvetlenie a jemné detaily." Výsledky sú čisté, realistické a spoľahlivé, podporujú rýchlejšie pracovné postupy od konceptu po produkciu na platformách ako Wix. Na základe našich testov a hlavných prípadov použitia, ktoré vidíme na platforme Wix, konzistentnosť a kvalita súperia o to, aby sa stal jedným z vlajkových modelov na generovanie obrázkov dneška.
— Hila Gat, Head of AI Research and Data Science v spoločnosti Wix
Nové ChatGPT Images sa už dnes zavádzajú pre všetkých používateľov ChatGPT a používateľov API na celom svete. Funguje to naprieč modelmi, takže aby ste ho mohli používať, nemusíte nič vyberať.
Veríme, že sme stále na začiatku toho, čo generovanie obrázkov môže umožniť. Dnešná aktualizácia je významným krokom vpred s ďalšími vylepšeniami, od jemnejších úprav až po bohatšie a podrobnejšie výstupy v rôznych jazykoch.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















