Í dag erum við að gefa út nýja útgáfu af ChatGPT Images, knúið af nýja flaggskip myndagerðarlíkaninu okkar. Hvort sem þú ert að búa til eitthvað frá grunni eða breyta mynd, munt þú fá útkomuna sem þú ímyndar þér. Það gerir nákvæmar breytingar á meðan það heldur smáatriðum eins og útliti fólks óbreyttu og býr til myndir allt að fjórum sinnum hraðar. Á meðan þessu stendur erum við að kynna nýjan myndaeiginleika í ChatGPT, sem er hannaður til að gera myndagerð ánægjulega—til að skapa innblástur og gera skapandi könnun fyrirhafnarlitla.
Nýja myndalíkanið og eiginleikinn eru að koma út í dag í ChatGPT fyrir alla notendur, og í API sem gpt-image-1.5.
Nú þegar þú biður um breytingar á mynd sem hefur verið hlaðið upp, fylgir líkanið ásetningi þínum á áreiðanlegri hátt—niður í smáatriðin—og breytir aðeins því sem þú biður um á meðan það heldur þáttum eins og lýsingu, samsetningu og útliti fólks stöðugu í gegnum inntök, frálög og síðari breytingar.
Þetta opnar fyrir niðurstöður sem passa við ásetning þinn—gagnlegri myndvinnslu, trúverðugri fatnaðar- og hárgreiðsluprófanir, ásamt síum og hugmyndabreytingum sem halda í kjarna upprunalegu myndarinnar. Saman þýða þessar endurbætur að ChatGPT getur virkað sem skapandi vinnustofa í vasanum þínum, fær um bæði hagnýtar breytingar og tjáningarríkar endurhugsanir.
Líkanið stendur sig vel í mismunandi tegundum af vinnslu—þar á meðal að bæta við, draga frá, sameina, blanda og færa til—svo þú færð þær breytingar sem þú vilt án þess að missa það sem gerir myndina sérstaka.
Sköpunargáfa líkansins skín í gegn með umbreytingum sem breyta og bæta við þáttum—eins og texta og uppsetningu—til að láta hugmyndir verða að veruleika, á sama tíma og mikilvægar upplýsingar eru varðveittar. Þessar umbreytingar virka bæði fyrir einföld og flóknari hugtök, og eru auðveldar í prófun með því að nota fyrirfram stillta stíla og hugmyndir í nýja ChatGPT Images(opnast í nýjum glugga) eiginleikanum—engin skrifleg kvaðning nauðsynleg.
Líkanið fylgir leiðbeiningum með áreiðanlegri hætti en upphaflega útgáfan okkar. Þetta auðveldar nákvæmari breytingar og flóknari frumlegar samsetningar, þar sem tengsl milli þátta eru varðveitt eins og til var ætlast.
Nýtt
Fyrri
Líkanið tekur enn eitt skref fram á við í textaframsetningu og er fært um að meðhöndla þéttari og smærri texta.
Líkanið bætir einnig við fleiri víddum sem leiða til strax nothæfra frálaga, eins og að birta mörg lítil andlit og hvernig náttúruleg frálög líta út.
Nýtt
Fyrri
Auk þess að búa til myndir með því að lýsa því sem þú vilt sjá í skilaboðum, erum við að kynna sérstakan stað fyrir Images(opnast í nýjum glugga) í ChatGPT—aðgengilegur í hliðarstikunni í farsímaappinu og á chatgpt.com—til að gera það hraðara og auðveldara að kanna og prófa myndir. Það inniheldur tugi fyrirfram stilltra sía og kvaðninga til að koma af stað innblæstri, sem eru reglulega uppfærðar til að endurspegla nýjustu strauma.
Saman gera þessar uppfærslur þér kleift að búa til myndir sem passa betur við hugmyndir þínar, allt frá litlum breytingum til fullkominna endursköpunar.
Þessi líkan hagræðir vinnuflæði fyrirtækja með hraðari myndagerð, nákvæmum breytingum og samræmdum sjónrænum smáatriðum í öllum útfærslum. Teymi geta kannað hugmyndir, gert markvissar breytingar og séð fyrir sér flóknar eða þurrar hugmyndir, sem styður við notkunartilvik í markaðssetningu, hönnun, netverslun og innri samskiptum.
Við keyrðum mörg dæmi úr upphaflegu myndagerðarútgáfunni okkar aftur til að meta frammistöðu. Líkanið sýnir skýrar framfarir í ýmsum tilvikum, þó að niðurstöðurnar séu enn ófullkomnar. Þó að þessi útgáfa tákni þýðingarmiklar framfarir, er enn mikið svigrúm til úrbóta í framtíðarútgáfum.
Nýtt
Fyrri
Ennþá einhver vísindaleg ónákvæmni, en ~70% rétt og mun líflegri grafík, kemur í veg fyrir ótímabæran skurð.
gpt-image-1.5 í API skilar öllum sömu endurbótum í ChatGPT Images: það er sterkara í varðveislu og breytingu mynda en GPT Image 1.
Þú munt sjá samræmdari varðveislu vörumerkja og lykilmyndefnis í öllum breytingum — sem gerir það vel hentugt fyrir markaðssetningu og vörumerkjavinnu eins og grafík og gerð merkja, og fyrir netverslunarteymi sem búa til heildar vörulista (afbrigði, senur og sjónarhorn) úr einni upprunamynd.
Myndainntök og frálög eru nú 20% ódýrari í GPT Image 1.5 samanborið við GPT Image 1, svo þú getur búið til og unnið með fleiri myndir fyrir sama pening.
Þú getur prófað nýja líkanið í OpenAI Playground(opnast í nýjum glugga) eða lesið kvaðningarhandbókina(opnast í nýjum glugga) til að fá innblástur.
Fyrirtæki og sprotafyrirtæki í ýmsum greinum, þar á meðal skapandi verkfæri, netverslun, markaðshugbúnað og fleira, eru þegar að nota GPT Image 1.5. Við erum spennt að deila nokkrum af þessum dæmum hér að neðan.
Nýtt
Fyrri
„GPT Image 1.5 býr til myndir með mikilli nákvæmni og kvaðningarfylgni, þar sem samsetning, lýsing og fínleg smáatriði eru varðveitt. Niðurstöðurnar eru hreinar, raunhæfar og áreiðanlegar, sem styðja hraðari vinnuflæði frá hugmynd til framleiðslu á verkvangi eins og Wix. Byggt á prófunum okkar og helstu notkunartilvikum sem við sjáum hjá Wix, gerir samræmi og gæði það að einu af helstu myndalíkönum dagsins í dag.„“
— Hila Gat, yfirmaður gervigreindarrannsókna og gagnavísinda hjá Wix
Nýja ChatGPT Images er aðgengilegt núna fyrir alla ChatGPT‑notendur og API-notendur á heimsvísu í dag á öllum stöðum. Það virkar yfir öll líkön, svo þú þarft ekki að velja neitt til að nota það.
Við trúum að við séum enn við upphafið á því hvað myndagerð getur haft í för með sér. Uppfærslan í dag er þýðingarmikið skref fram á við og meira er í vændum, allt frá fínni breytingum til ríkari og ítarlegri frálaga á öllum tungumálum.
Höfundur
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















