Tänään julkaisemme uuden version ChatGPT‑kuvista, jota ohjaa uusi kuvan luonti -lippulaivamallimme. Olitpa luomassa jotain tyhjästä tai muokkaamassa valokuvaa, saat juuri sellaisen lopputuloksen kuin kuvittelet. Se tekee tarkkoja muokkauksia säilyttäen samalla yksityiskohdat, kuten ihmisten ulkonäön, ennallaan, ja tuottaa kuvia jopa neljä kertaa nopeammin. Samalla esittelemme ChatGPT:ssä uuden kuvatoiminnon, joka on suunniteltu tekemään kuvien luomisesta miellyttävää – herättämään inspiraatiota ja helpottamaan luovaa tutkimista.
Uusi kuvamalli ja ominaisuus otetaan käyttöön tänään ChatGPT:ssä kaikille käyttäjille, ja API:ssa nimellä gpt-image-1.5.
Kun pyydät muokkauksia ladattuun kuvaan, malli noudattaa aihetta luotettavammin – pienimpiä yksityiskohtia myöten – muuttamalla vain sitä, mitä pyydät, ja säilyttäen samalla elementit, kuten valaistuksen, sommittelun ja ihmisten ulkonäön, yhdenmukaisina syötteissä, tulosteissa ja myöhemmissä muokkauksissa.
Tämä avaa tuloksia,jotka vastaavat tarkoitustasi –käytännöllisempiä valokuvien muokkauksia,uskottavampia vaatteiden ja kampauksien kokeiluja sekä tyylillisiä suodattimia ja käsitteellisiä muutoksia, jotka säilyttävät alkuperäisen kuvan olemuksen. Yhdessä nämä parannukset tarkoittavat, että ChatGPT voi toimia luovana studiona taskussasi, joka kykenee sekä käytännön muokkauksiin että ilmeikkäisiin uudelleensuunnitteluihin.
Malli sopii erinomaisesti erilaisiin muokkaustehtäviin, kuten lisäämiseen, poistamiseen, yhdistämiseen, sekoittamiseen ja siirtämiseen, joten saat haluamasi muutokset ilman, että kuva menettää erityispiirteitään.
Mallin luovuus näkyy muutoksissa, jotka muuttavat ja lisäävät elementtejä, kuten tekstiä ja asettelua, ideoiden toteuttamiseksi tärkeät yksityiskohdat säilyttäen. Nämä muunnokset toimivat sekä yksinkertaisiin että monimutkaisempiin käsitteisiin, ja niitä on helppo kokeilla valmiiden tyylien ja ideoiden avulla uudessa ChatGPT kuvat(avautuu uudessa ikkunassa) -ominaisuudessa – kirjallista kehotetta ei tarvita.
Malli noudattaa ohjeita luotettavammin kuin alkuperäinen versio. Tämä mahdollistaa tarkemmat muokkaukset sekä monimutkaisemmat alkuperäiset sommitelmat, joissa elementtien väliset suhteet säilyvät tarkoitetulla tavalla.
Uusi
Edellinen
Malli ottaa jälleen askeleen eteenpäin tekstin renderöinnissä ja pystyy käsittelemään tiheämpää ja pienempää tekstiä.
Malli parantaa myös muita ulottuvuuksia, jotka näkyvät välittömästi käyttökelpoisina tuloksina, kuten monien pienten kasvojen renderöintinä ja luonnollisten tuotosten ulkonäkönä.
Uusi
Edellinen
Sen lisäksi, että voit luoda kuvia kuvailemalla, mitä haluat nähdä viestissä, esittelemme ChatGPT:ssä omistetun osion Kuvat(avautuu uudessa ikkunassa)-osion, joka on käytettävissä mobiilisovelluksen sivupalkissa ja chatgpt.com-sivustolla. Sen avulla kuvien selaaminen ja kokeileminen on nopeampaa ja helpompaa. Se sisältää kymmeniä valmiita suodattimia ja kehotteita, jotka antavat inspiraatiota ja joita päivitetään säännöllisesti vastaamaan uusia trendejä.
Näiden päivitysten avulla voit luoda kuvia, jotka vastaavat paremmin visiotasi, pienistä muokkauksista täydellisiin uudistuksiin.
Tämä malli tehostaa liiketoiminnan työnkulkuja nopeamman kuvien luomisen, tarkkojen muokkausten ja toistuvien visuaalisten yksityiskohtien avulla. Tiimit voivat tutkia ideoita, tehdä kohdennettuja muutoksia ja visualisoida monimutkaisia tai kuivia käsitteitä, mikä tukee käyttötapauksia markkinoinnin, suunnittelun, verkkokaupan ja sisäisen viestinnän aloilla.
Suoritimme uudelleen monet esimerkit alkuperäisestä kuvageneraation lanseerauksesta suorituskyvyn arvioimiseksi. Malli osoittaa selkeitä parannuksia useissa tapauksissa, vaikka tulokset eivät ole vielä täydellisiä. Vaikka tämä julkaisu edustaa merkittävää edistystä, tulevissa versioissa on vielä paljon parantamisen varaa.
Uusi
Edellinen
Edelleen joitakin tieteellisiä epätarkkuuksia, mutta noin 70 % oikein ja paljon elävämmät grafiikat, välttää ennenaikaisen rajauksen.
gpt-image-1.5 API:ssa tarjoaa samat parannukset kuin ChatGPT‑kuvat: se on tehokkaampi kuvien säilyttämisessä ja muokkaamisessa kuin GPT Kuva 1.
Brändilogot ja keskeiset visuaaliset elementit säilyvät entistä yhdenmukaisemmin eri muokkauksissa, mikä tekee ohjelmasta sopivan markkinointi- ja brändityöhön, kuten grafiikan ja logojen luomiseen, sekä verkkokaupan tiimeille, jotka luovat täydellisiä tuotekuvakatalogeja (variantteja, kohtauksia ja kuvakulmia) yhdestä lähdekuvasta.
Kuvasyötteet ja -tulokset ovat nyt 20 % halvempia GPT Image 1.5:ssä verrattuna GPT Image 1:een, joten voit luoda ja iteratiivisesti kehittää enemmän kuvia samalla budjetilla.
Voit kokeilla uutta mallia OpenAI Playgroundissa(avautuu uudessa ikkunassa) tai lukea kehoteopasta(avautuu uudessa ikkunassa) saadaksesi inspiraatiota.
Yritykset ja startupit eri toimialoilla, kuten luovat työkalut, verkkokauppa ja markkinointiohjelmistot, käyttävät jo GPT Image 1.5:tä. Meillä on ilo jakaa joitakin näistä esimerkeistä alla.
Uusi
Edellinen
“GPT Image 1.5 luo korkealaatuisia kuvia, jotka noudattavat tarkasti kehotteita ja säilyttävät sommittelun, valaistuksen ja hienojakoiset yksityiskohdat Tulokset ovat puhtaita, realistisia ja luotettavia, mikä tukee nopeampaa konseptista tuotantoon -työnkulkua Wixin kaltaisilla alustoilla. Perustuen testeihimme ja pääasiallisiin käyttötapauksiin, joita näemme Wixissä, johdonmukaisuus ja laatu tekevät siitä yhden nykypäivän lippulaivamalleista kuvan luontiin.
– Hila Gat, Wixin tekoälytutkimuksen ja datatieteen johtaja
Uudet ChatGPT Kuvat otetaan käyttöön nyt kaikille ChatGPT‑käyttäjille ja API-käyttäjille maailmanlaajuisesti tänään eri alustoilla. Se toimii kaikissa malleissa, joten sinun ei tarvitse valita mitään käyttääksesi sitä.
Uskomme, että olemme vasta alussa siinä, mitä kuvan luonti voi ottaa käyttöön. Tämän päivän päivitys on merkittävä askel eteenpäin, ja lisää on tulossa: tarkemmista muokkauksista rikkaampiin ja yksityiskohtaisempiin tuloksiin eri kielillä.
Tekijä
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















