Šiandien išleidžiame naują „ChatGPT Images“ versiją, veikiančią mūsų naujojo pavyzdinio vaizdų generavimo modelio pagrindu. Dabar, tiek kurdami ką nors nuo nulio, tiek redaguodami nuotrauką, gausite tokį rezultatą, kokį įsivaizduojate. Modelis atlieka tikslius pakeitimus, išlaikydamas tokias detales kaip žmonių išvaizda, ir generuoja vaizdus iki keturių kartų greičiau. Kartu pristatome naują „Images“ funkciją „ChatGPT“ platformoje, sukurtą taip, kad vaizdų generavimas teiktų malonumą – žadintų įkvėpimą ir paverstų kūrybinius ieškojimus lengvais.
Naujasis „Images“ modelis ir funkcija šiandien pradedami diegti „ChatGPT“ visiems naudotojams, o API – pavadinimu „gpt-image-1.5“.
Dabar, paprašius redaguoti įkeltą vaizdą, modelis patikimiau laikosi jūsų ketinimų – iki pat smulkiausių detalių – keisdamas tik tai, ko prašote, ir išlaikydamas tokius elementus kaip apšvietimas, kompozicija ir žmonių išvaizda nuoseklius įvestyje, išvestyje ir vėlesniuose redagavimuose.
Tai leidžia gauti rezultatus, atitinkančius jūsų ketinimus – naudingesnius nuotraukų redagavimus, tikroviškesnius drabužių ir šukuosenų pasimatavimus, taip pat stilistinius filtrus ir konceptualias transformacijas, išlaikančias originalaus vaizdo esmę. Visi šie patobulinimai reiškia, kad „ChatGPT“ gali veikti kaip kišeninė kūrybinė studija, gebanti tiek praktiškai redaguoti vaizdus, tiek išraiškingai juos perkurti.
Modelis puikiai atlieka įvairių tipų redagavimą – įskaitant pridėjimą, šalinimą, derinimą, suliejimą ir sukeitimą – todėl gaunate norimus pakeitimus neprarasdami to, kas daro vaizdą ypatingą.
Modelio kūrybiškumas atsiskleidžia per transformacijas, kurios keičia ir prideda elementų – pavyzdžiui, tekstą ir išdėstymą – kad įgyvendintų idėjas, išsaugant svarbias detales. Šios transformacijos tinka tiek paprastoms, tiek sudėtingesnėms koncepcijoms, jas lengva išbandyti naudojant iš anksto nustatytus stilius ir idėjas naujoje ChatGPT Images(atsidaro naujame lange) funkcijoje – nereikia rašyti jokio raginimo.
Modelis patikimiau laikosi instrukcijų nei pradinė versija. Todėl galima tiksliau redaguoti ir kurti sudėtingesnes originalias kompozicijas, kuriose elementų tarpusavio ryšiai išsaugomi taip, kaip numatyta.
Naujas
Ankstesnis
Modelis žengia dar vieną žingsnį į priekį teksto atvaizdavimo srityje ir geba apdoroti tankesnį bei smulkesnį tekstą.
Modelis taip pat patobulintas kitais aspektais, o tai lemia geriau iš karto panaudojamus rezultatus, pavyzdžiui, atvaizduojant daug mažų veidų ir užtikrinant natūralią išvesties išvaizdą.
Naujas
Ankstesnis
Be vaizdų generavimo aprašant tai, ką norėtumėte matyti žinutėje, pristatome specialią Images(atsidaro naujame lange) vietą „ChatGPT“ – pasiekiamą šoninėje juostoje per mobiliąją programą ir chatgpt.com – kad tyrinėti ir bandyti vaizdus būtų greičiau ir lengviau. Joje rasite dešimtis iš anksto nustatytų filtrų ir raginimų įkvėpimui paskatinti, kurie reguliariai atnaujinami atsižvelgiant į naujas tendencijas.
Visi šie atnaujinimai leidžia kurti vaizdus, geriau atitinkančius jūsų viziją – nuo smulkių pataisymų iki visiško perkūrimo.
Šis modelis supaprastina verslo darbo eigas dėl greitesnio vaizdų generavimo, tikslių redagavimų ir nuoseklių vizualinių detalių atliekant iteracijas. Komandos gali nagrinėti idėjas, atlikti tikslinius pakeitimus ir vizualizuoti sudėtingas ar nuobodžias koncepcijas, palaikydamos naudojimo atvejus rinkodaros, dizaino, el. prekybos ir vidinės komunikacijos srityse.
Pakartojome daugelį pavyzdžių iš pradinio vaizdų generavimo paleidimo, kad įvertintume našumą. Modelis rodo aiškius patobulinimus įvairiais atvejais, nors rezultatai išlieka netobuli. Nors šis leidimas rodo reikšmingą pažangą, ateities iteracijose dar yra daug vietos tobulėti.
Naujas
Ankstesnis
Vis dar yra tam tikrų mokslinių netikslumų, tačiau apie 70 proc. teisinga ir daug ryškesnė grafika, išvengiama ankstyvo apkarpymo.
API randamas „gpt-image-1.5“ modelis suteikia visus tuos pačius patobulinimus kaip ir „ChatGPT Images“: jis geriau išsaugo ir redaguoja vaizdus nei „GPT Image 1“.
Redaguojant bus nuosekliau išaugomi prekių ženklų logotipai ir pagrindiniai vaizdai, todėl modelis puikiai tinka rinkodaros ir prekių ženklo užduotims, pavyzdžiui, grafikai ir logotipų kūrimui, taip pat el. prekybos komandoms, generuojančioms išsamius produktų vaizdų katalogus (variantus, scenas ir kampus) iš vieno šaltinio vaizdo.
Vaizdų įvestys ir išvestys „GPT Image 1.5“ dabar yra 20 proc. pigesnės nei „GPT Image 1“, todėl galite generuoti ir iteruoti daugiau vaizdų už tą pačią kainą.Galite išbandyti naująjį modelį OpenAI Playground(atsidaro naujame lange) sistemoje arba paskaityti raginimų vadovą(atsidaro naujame lange) įkvėpimui.
Įmonės ir startuoliai įvairiose industrijose, įskaitant kūrybinius įrankius, el. prekybą, rinkodaros programinę įrangą ir kitas, jau naudoja „GPT Image 1.5“. Džiaugiamės galėdami pasidalyti keliais pavyzdžiais.
Naujas
Ankstesnis
„GPT Image 1.5“ generuoja itin tikslius vaizdus, griežtai laikydamasis raginimo, išsaugodamas kompoziciją, apšvietimą ir smulkias detales. Rezultatai yra švarūs, tikroviški ir patikimi, palaikantys spartesnes darbo eigas nuo koncepcijos iki gamybos tokiose platformose kaip „Wix“. Remiantis mūsų bandymais ir pagrindiniais naudojimo atvejais „Wix“, nuoseklumas ir kokybė leidžia jam konkuruoti dėl vieno iš šiandienos pavyzdinių vaizdų generavimo modelių statuso.“
— Hila Gat, „Wix“ DI tyrimų ir duomenų mokslo vadovė
Naujasis „ChatGPT Images“ šiandien pradedamas diegti visiems „ChatGPT“ ir API naudotojams visame pasaulyje visose platformose. Jis veikia su įvairiais modeliais, todėl norint juo naudotis, nereikia nieko pasirinkti.
Tikime, kad pradėjome atrasti, ką gali suteikti vaizdų generavimas. Šiandienos atnaujinimas yra reikšmingas žingsnis į priekį, o ateityje laukia dar daugiau – nuo detalesnių redagavimų iki turtingesnių, detalesnių išvesčių įvairiomis kalbomis.
Autorius
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















