Šodien mēs izlaižam jaunu ChatGPT Images versiju, kuru darbina mūsu jaunais vadošais attēlu ģenerēšanas modelis. Tagad, neatkarīgi no tā, vai tu izveido kaut ko no nulles vai rediģē fotoattēlu, tu iegūsi rezultātu, ko esi iedomājies. Tas veic precīzus labojumus, saglabājot tādas detaļas kā nepārveidots cilvēku izskats, un ģenerē attēlus līdz pat 4x ātrāk. Vienlaikus mēs iepazīstinām ar jaunu attēlu funkciju ChatGPT, kas ir izstrādāta, lai attēlu ģenerēšana būtu patīkama—iedvesmotu un padarītu radošo izpēti bez piepūles.
Jaunais attēlu modelis un funkcija tiek ieviesti šodien ChatGPT visiem lietotājiem, kā arī API kā GPT‑image‑1.5.
Tagad, kad tu lūdz veikt izmaiņas augšupielādētā attēlā, modelis uzticami ievēro tavu nodomu—līdz pat sīkākajām detaļām—mainot tikai to, ko tu lūdz, vienlaikus saglabājot tādus elementus kā apgaismojums, kompozīcija un cilvēku izskats konsekventus ievadēs, rezultātos un turpmākajās rediģēšanas reizēs.
Tas uzrāda rezultātus, kas atbilst tavam nodomam—noderīgāki foto rediģējumi, ticamākas apģērbu un frizūru pielaikošanas, kā arī stilistiskie filtri un konceptuālās transformācijas, kas saglabā oriģinālā attēla būtību. Kopā šie uzlabojumi nozīmē, ka ChatGPT var darboties kā radoša studija tavā kabatā, spējīga gan uz praktiskiem labojumiem, gan uz izteiksmīgiem pārveidojumiem.
Modelis izceļas dažādu veidu rediģēšanā—tostarp pievienošana, atņemšana, apvienošana, sajaukšana un transponēšana—tādējādi tu iegūsti vēlamās izmaiņas, nezaudējot to, kas padara attēlu īpašu.
Modeļa radošums izpaužas transformācijās, kas maina un pievieno elementus, piemēram, tekstu un izkārtojumu, lai iedzīvinātu idejas, vienlaikus saglabājot svarīgas detaļas. Šīs transformācijas darbojas gan ar vienkāršiem, gan sarežģītākiem konceptiem, un tās ir viegli izmēģināt, izmantojot iepriekš iestatītus stilus un idejas jaunajā ChatGPT attēli(atveras jaunā logā) funkcijā—nav nepieciešama rakstiska uzvedne.
Modelis seko norādījumiem uzticamāk nekā mūsu sākotnējā versija. Tas ļauj veikt precīzākus labojumus, kā arī veidot sarežģītākas oriģinālās kompozīcijas, kur elementi tiek saglabāti savstarpējās attiecībās, kā bija iecerēts.
Jauns
Iepriekšējais
Modelis sper vēl vienu soli uz priekšu teksta atveidē, spējot apstrādāt blīvāku un mazāku tekstu.
Modelis arī uzlabo papildu dimensijas, kas pārvēršas par tūlītēji izmantojamiem rezultātiem, piemēram, daudzu mazu seju attēlošanu un to, cik dabiski izskatās rezultāti.
Jauns
Iepriekšējais
Papildus attēlu ģenerēšanai, aprakstot, ko tu vēlies redzēt ziņojumā, mēs ieviešam īpašu Images(atveras jaunā logā) mājvietu ChatGPT—pieejamu sānu joslā, izmantojot mobilo lietotni un vietnē chatgpt.com—lai paātrinātu un vienkāršotu attēlu izpēti un izmēģināšanu. Tas ietver desmitiem iepriekš iestatītu filtru un uzvedņu, lai iedvesmotu, un tiek regulāri atjaunināts, lai atspoguļotu jaunākās tendences.
Kopā šie uzlabojumi ļauj tev izveidot attēlus, kas labāk atbilst tavam redzējumam, sākot ar nelieliem labojumiem un beidzot ar pilnīgu pārveidi.
Šis modelis optimizē uzņēmuma darbplūsmas ar ātrāku attēlu ģenerēšanu, precīziem labojumiem un konsekventām vizuālajām detaļām visās iterācijās. Komandas var izpētīt idejas, veikt mērķtiecīgas izmaiņas un vizualizēt sarežģītas vai sausas koncepcijas, atbalstot lietošanas gadījumus mārketingā, dizainā, e-komercijā un iekšējā komunikācijā.
Mēs atkārtoti izpildījām daudzus piemērus no mūsu sākotnējās attēlu ģenerēšanas palaišanas, lai novērtētu veiktspēju. Modelis uzrāda skaidrus uzlabojumus dažādos gadījumos, lai gan rezultāti joprojām nav ideāli. Lai gan šis izlaidums nozīmē būtisku progresu, nākotnes iterācijās joprojām ir ievērojamas iespējas uzlabojumiem.
Jauns
Iepriekšējais
Joprojām ir dažas zinātniskas neprecizitātes, bet ~70% ir pareizi un grafika ir daudz spilgtāka, izvairoties no priekšlaicīgas apgriešanas.
gpt-image-1.5 API nodrošina visus tos pašus uzlabojumus kā ChatGPT Images: tas ir spēcīgāks attēlu saglabāšanā un rediģēšanā nekā GPT attēls 1.
Tu redzēsi konsekventāku zīmolu logotipu un galveno vizuālo elementu saglabāšanu visos rediģējumos, padarot to labi piemērotu mārketinga un zīmola darbam, piemēram, grafikai un logotipu izveidei, kā arī e-komercijas komandām, kas ģenerē pilnus produktu attēlu katalogus (varianti, ainas un leņķi) no viena avota attēla.
Attēlu ievades un izvades tagad ir par 20% lētākas GPT Image 1.5 salīdzinājumā ar GPT Image 1, tāpēc tu vari ģenerēt un iterēt vairāk attēlu par to pašu budžetu.
Tu vari izmēģināt jauno modeli OpenAI Playground(atveras jaunā logā) vai izlasīt uzvednes rokasgrāmatu(atveras jaunā logā) iedvesmai.
Uzņēmumi un jaunuzņēmumi dažādās nozarēs, tostarp radošo rīku, e-komercijas, mārketinga programmatūras un citās, jau izmanto GPT attēls 1.5. Mēs ar prieku dalāmies ar dažiem no šiem piemēriem.
Jauns
Iepriekšējais
“GPT Image 1.5 ģenerē augstas precizitātes attēlus ar spēcīgu uzvedņu atbilstību, saglabājot kompozīciju, apgaismojumu un smalkas detaļas.” Rezultāti ir tīri, reālistiski un uzticami, nodrošinot ātrākas darbplūsmas no koncepcijas līdz ražošanai tādās platformās kā Wix. Pamatojoties uz mūsu testēšanu un galvenajiem lietošanas gadījumiem, ko redzam Wix, konsekvence un kvalitāte sacenšas, lai padarītu to par vienu no vadošajiem attēlu ģenerēšanas modeļiem mūsdienās.
— Hila Gata (Hila Gat), mākslīgā intelekta pētniecības un datu zinātnes vadītāja uzņēmumā Wix
Jaunie ChatGPT attēli pašlaik tiek ieviesti visiem ChatGPT lietotājiem un API lietotājiem visā pasaulē visās platformās. Tas darbojas visos modeļos, tāpēc tev nav jāizvēlas nekas, lai to izmantotu.
Mēs uzskatām, ka attēliu ģenerēšanas jomā joprojām atrodamies pašā sākumā. Šodienas atjauninājums ir nozīmīgs solis uz priekšu, un vēl ir gaidāmi uzlabojumi, sākot ar smalkākām rediģēšanas iespējām un beidzot ar bagātīgākiem, detalizētākiem rezultātiem dažādās valodās.
Autors
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















