Täna avaldame ChatGPT Images uue versiooni, mida toetab meie uus lipulaevast pildigeneratsiooni mudel. Olenemata sellest, kas lood midagi nullist või töötled fotot, saad nüüd tulemuse, mida vaimusilmas ette kujutasite. See redigeerib täpselt, hoides detailid (nagu inimeste välimus) puutumatuna, ja genereerib pilte kuni neli korda kiiremini. Samal ajal tutvustame ChatGPT‑s uut pildifunktsiooni, mis on loodud muutma pildiloome nauditavaks — et inspireerida ja muuta loominguline avastamine pingevabaks.
Uus pildimudel ja -funktsioon muutuvad ChatGPT‑s kõigile kasutajatele kättesaadavaks täna ning API-s nimega GPT‑image‑1.5.
Kui sa palud nüüd üleslaaditud pilti redigeerida, järgib mudel sinu soovi usaldusväärsemalt — kuni pisidetailideni välja —, muutes ainult seda, mida palud, samal ajal kui elemendid nagu valgustus, kompositsioon ja inimeste välimus jäävad sisendite, väljundite ja järgnevate muudatuste lõikes ühtseks.
See tagab tulemused, mis vastavad sinu kavatsusele—kasulikumad fototöötlused, usutavamad riiete ja soengute proovimised, koos stiililiste filtrite ja kontseptuaalsete muudatustega, mis säilitavad algse pildi olemuse. Kokkuvõttes tähendavad need täiustused, et ChatGPT võib toimida kui loominguline stuudio sinu taskus, olles võimeline nii praktilisteks töötlusteks kui ka väljendusrikasteks ümberkujundamisteks.
Mudel on suurepärane erinevat tüüpi töötlustes — sealhulgas lisamine, eemaldamine, kombineerimine, sulandamine ja ümberpaigutamine —, seeläbi saad soovitud muudatused ilma kaotamata seda, mis teeb pildi eriliseks.
Mudeli loovus paistab silma transformatsioonides, mis muudavad ja lisavad elemente—nagu tekst ja paigutus—, et viia ideed ellu, säilitades samal ajal olulised detailid. Need muudatused toimivad nii lihtsate kui ka keerukamate kontseptsioonide puhul ning neid on lihtne proovida, kasutades eelseadistatud stiile ja ideid uues rakenduses ChatGPT Images(avaneb uues aknas)—kirjalikku viipa pole vaja.
Mudel järgib juhiseid usaldusväärsemalt kui meie esialgne versioon. See võimaldab täpsemaid töötlusi ja keerukamaid originaalkompositsioone, kus elementide vahelised suhted säilivad nii, nagu kavandatud.
Uus
Eelmine
Mudel astub sammu edasi teksti renderdamises, olles võimeline käsitlema tihedamat ja väiksemat teksti.
Mudel on parem ka muudes aspektides, mis tagavad koheselt kasutatavad väljundid, näiteks paljude väikeste nägude renderdamine ja tulemuste loomulikkus.
Uus
Eelmine
Lisaks piltide loomisele sõnumi kaudu kirjeldades, tutvustame ChatGPT‑s eraldi kohta piltide(avaneb uues aknas) jaoks (saadaval külgribal mobiilirakenduses ja chatgpt.com-is), et muuta piltide avastamine ja katsetamine kiiremaks ja lihtsamaks. See sisaldab kümneid eelseadistatud filtreid ja viipasid inspiratsiooni käivitamiseks ning seda uuendatakse regulaarselt vastavalt uutele trendidele.
Koos võimaldavad need uuendused luua pilte, mis paremini vastavad su visioonile, alates väikestest muudatustest kuni täielike ümberkujundamisteni.
See mudel lihtsustab äriprotsesse, tagades kiirema pildigeneratsiooni, täpsemad töötlused ja järjepidevad visuaalsed detailid iteratsioonide käigus. Meeskonnad saavad uurida ideid, teha sihitud muudatusi ja visualiseerida keerulisi või „kuivi“ kontseptsioone, toetades kasutusjuhtumeid turunduses, disainis, e-kaubanduses ja sisekommunikatsioonis.
Kordasime paljusid näiteid oma esialgsest piltide genereerimise lansseerimisest, et hinnata mudeli jõudlust. Mudel näitab selget paranemist erinevates olukordades, kuigi tulemused ei ole veel täiuslikud. Kuigi see väljalase tähistab olulist edasiminekut, on tulevastes iteratsioonides veel märkimisväärselt arenguruumi.
Uus
Eelmine
Endiselt esineb teaduslikke ebatäpsusi, kuid tulemus on umbes 70% korrektne ja graafika on palju elavam, vältides enneaegset kärpimist.
API kaudu kättesaadav gpt-image-1.5 toob kaasa kõik samad täiustused, mis on mudelil ChatGPT Images: see on piltide säilitamisel ja redigeerimisel võimekam kui GPT Image 1.
Näed brändilogode ja võtmevisuaalide järjepidevamat säilimist töötluste käigus – see muudab selle hästi sobivaks turundus- ja bränditööks (nagu graafika ja logode loomine) ning e-kaubanduse meeskondadele, kes loovad ühest allikapildist täielikke tootekatalooge (erinevaid variante, stseene ja vaatenurki).
Pildisisendid ja -väljundid on nüüd GPT Image 1.5 puhul 20% odavamad võrreldes GPT Image 1-ga, nii et saad sama eelarvega koosta ja täiustada rohkem pilte.
Saad proovida uut mudelit OpenAI Playgroundis(avaneb uues aknas) või lugeda viipade juhendit(avaneb uues aknas) inspiratsiooni saamiseks.
Ettevõtted ja idufirmad erinevates tööstusharudes, sealhulgas loovtööriistad, e-kaubandus, turundustarkvara ja paljud teised, kasutavad juba GPT Image 1.5 mudelit. Meil on põnev jagada mõningaid neist näidetest allpool.
Uus
Eelmine
„GPT Image 1.5 genereerib kõrge täpsusega pilte, järgides rangelt viipasid ning säilitades kompositsiooni, valgustuse ja peened detailid.“ Tulemused on puhtad, realistlikud ja usaldusväärsed, toetades kiiremaid töövooge kontseptsioonist tootmiseni sellistel platvormidel nagu Wix. Meie testimise ja Wixis nähtud peamiste kasutusjuhtude põhjal konkureerib see mudel oma järjepidevuse ja kvaliteediga tänaste pildigeneratsiooni lipulaevade seas.
— Hila Gat, tehisintellekti uurimis- ja andmeteaduse juht Wixis
Uus ChatGPT Images jõuab alates tänasest järk-järgult kõigi ChatGPT ja API kasutajateni üle maailma ja kõigil platvormidel. See toimib mudeliteüleselt, seega ei pea sa selle kasutamiseks midagi eraldi valima ega seadistama.
Usume, et oleme alles piltide genereerimise võimaluste alguses. Tänane uuendus on tähendusrikas samm edasi, millele järgneb tulevikus veelgi rohkem - alates peenematest redigeerimisvõimalustest kuni rikkamate ja detailsemate väljunditeni erinevates keeltes.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















