Dnes vydáváme novou verzi nástroje ChatGPT Images, založeného na našem novém vlajkovém modelu pro generování obrázků. Ať už něco vytváříš od nuly nebo upravuješ fotografii, dostaneš výsledek, který si představuješ. Provádí přesné úpravy, přičemž zachovává detaily, jako je vzhled lidí, a vytváří obrázky až 4x rychleji. Současně představujeme novou funkci Obrázky v rámci ChatGPT, která je navržena tak, aby generování obrázků bylo potěšením: aby inspirovalo a usnadňovalo kreativní objevování.
Nový model a funkce Obrázky se dnes začínají zavádět pro všechny uživatele v ChatGPT a v API jako gpt-image-1.5.
Když nyní požádáš o úpravy nahraného obrázku, model spolehlivěji dodrží tvůj záměr, do nejmenších detailů. Změní pouze to, o co žádáš a současně zachová prvky jako osvětlení, kompozice a vzhled lidí konzistentní napříč vstupy, výstupy a následnými úpravami.
To vám umožní získat výsledky odpovídající vašemu záměru: užitečnější úpravy fotografií, věrohodnější oblečení a účesy , stylistické filtry a koncepční transformace, které zachovávají podstatu původního snímku. Tato vylepšení společně znamenají, že ChatGPT může fungovat jako kreativní studio v kapse, které dokáže provádět praktické úpravy i výrazné změny.
Model vyniká různými typy úprav, mezi něž patří přidávání, odebírání, kombinování, míchání a transpozice, takže dostaneš požadované změny, aniž bys ztratil to, díky čemuž je obrázek výjimečný.
Kreativita modelu se projevuje transformacemi, které mění a přidávají prvky, jako je text a rozvržení. Oživují tak myšlenky a současně zachovávají důležité detaily. Tyto transformace fungují jak pro jednoduché, tak i složitější koncepty a lze je snadno vyzkoušet s využitím přednastavených stylů a nápadů v nové funkci ChatGPT Images(otevře se v novém okně). Není potřeba žádný psaný prompt.
Model dodržuje pokyny spolehlivěji než naše původní verze. To umožňuje přesnější úpravy i složitější originální kompozice, kde jsou vztahy mezi prvky zachovány tak, jak byly zamýšleny.
Nový
Předchozí
Tento model je dalším krokem vpřed v oblasti vykreslování textu a dokáže zpracovat hustší a menší text.
Model se také zlepšuje v dalších aspektech, které se promítají do okamžitě použitelných výstupů, jako je vykreslování mnoha malých obličejů a přirozený vzhled výstupů.
Nový
Předchozí
Kromě vytváření obrázků popisem toho, co bys chtěl vidět ve zprávě, zavádíme v ChatGPT vyhrazenou sekci pro Obrázky(otevře se v novém okně). Je dostupná v postranním panelu prostřednictvím mobilní aplikace a na chatgpt.com a usnadňuje a urychluje prozkoumávání a rychlejší a snadnější vyzkoušení obrázků. Obsahuje desítky přednastavených filtrů a promptů, které podněcují inspiraci a pravidelně se aktualizují tak, aby odrážely nové trendy.
Společně ti tato vylepšení umožní vytvářet obrázky, které lépe odpovídají tvé vizi, od drobných úprav až po kompletní přepracování.
Tento model zjednodušuje firemní pracovní postupy rychlejším generováním obrázků, přesnými úpravami a konzistentními vizuálními detaily mezi jednotlivými iteracemi. Týmy mohou zkoumat nápady, provádět cílené změny a vizualizovat složité nebo suché koncepty. To podporuje způsoby využití napříč marketingem, designem, e-commerce i interní komunikací.
Znovu jsme spustili mnoho příkladů z našeho počátečního spuštění generování obrázků, abychom vyhodnotili výkonnost. Model ukazuje jasná zlepšení v různých případech, i když výsledky zůstávají nedokonalé. Přestože tato verze představuje významný pokrok, stále existuje značný prostor pro zlepšení v budoucích iteracích.
Nový
Předchozí
Stále existují některé vědecké nepřesnosti, ale asi 70 % je správně a grafika je mnohem živější. Nedochází k předčasnému oříznutí.
gpt-image-1.5 v API přináší všechna stejná vylepšení jako ChatGPT Images: je lepší v zachování a úpravě obrázků než GPT Image 1.
Budeš svědkem konzistentnějšího zachování značkových log a klíčových vizuálních prvků napříč jednotlivými úpravami, což se hodí pro marketingovou práci a práci se značkou, jako je tvorba grafiky a loga, a pro týmy elektronického obchodování, které z jediného zdrojového obrázku vytvářejí kompletní katalogy obrázků produktů (varianty, scény a úhly pohledu).
Vstupy a výstupy obrázků jsou nyní v GPT Image 1.5 o 20 % levnější ve srovnání s GPT Image 1, takže můžeš vytvořit a opakovaně upravovat více obrázků za stejný rozpočet.
Nový model si můžeš vyzkoušet v prostředí OpenAI Playground(otevře se v novém okně) nebo se nechat inspirovat přečtením průvodce pro prompty(otevře se v novém okně).
Podniky a startupy napříč odvětvími, včetně kreativních nástrojů, e-commerce, marketingového softwaru a dalších, které používají model GPT Image 1.5. Jsme nadšení, že se můžeme podělit o některé z těchto příkladů níže.
Nový
Předchozí
„GPT Image 1.5 vytváří vysoce věrné obrázky s důrazem na dodržování promptů, zachovává kompozici, osvětlení a drobné detaily. Výsledky jsou čisté, realistické a spolehlivé a podporují rychlejší přechod od konceptu k produkci na platformách typu Wix. Na základě našich testů a hlavních případů použití, které vidíme v aplikaci Wix, činí konzistence a kvalita z tohoto modelu jeden z vlajkových modelů pro generování obrázků současnosti.“
– Hila Gat, vedoucí výzkumu AI a datové vědy ve společnosti Wix
Nové ChatGPT Images se od dneška zavádějí pro všechny uživatele ChatGPT a uživatele API po celém světě. Funguje napříč modely, takže pro jejich používání není potřeba nic vybírat.
Věříme, že jsme stále na začátku toho, co generování obrázků může dokázat. Dnešní aktualizace je významným krokem vpřed a další vylepšení přijdou brzy: od jemnějších úprav po bohatší a podrobnější výstupy napříč jazyky.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















