Danas objavljujemo novu verziju ChatGPT Images, pokretanu našim novim vodećim modelom za generisanje slika. Sada, bilo da kreirate nešto od nule ili uređujete fotografiju, dobit ćete rezultat koji zamišljate. Izvodi precizne izmjene dok zadržava detalje poput izgleda ljudi netaknutim i generira slike do 4 puta brže. Uz to, uvodimo novu funkciju Slike unutar ChatGPT‑a, osmišljenu da generisanje slika učini ugodnim—da potakne inspiraciju i olakša kreativno istraživanje.
Novi model i funkcija za slike počinju se uvoditi danas u ChatGPT‑u za sve korisnike, a u API-ju kao GPT‑image‑1.5.
Sada, kada zatražite izmjene na otpremljenoj slici, model pouzdanije slijedi vašu namjeru—do najsitnijih detalja—mijenjajući samo ono što tražite, dok elementi poput osvjetljenja, kompozicije i izgleda ljudi ostaju dosljedni kroz unose, izlaze i naknadne izmjene.
Ovo otključava rezultate koji odgovaraju vašoj namjeri—korisnije uređivanje fotografija, uvjerljivije isprobavanje odjeće i frizura, uz stilističke filtere i konceptualne transformacije koje zadržavaju suštinu originalne slike. Zajedno, ova poboljšanja znače da ChatGPT može djelovati kao kreativni studio u vašem džepu, sposoban za praktične izmjene i izražajne preinake.
Model se ističe u različitim vrstama uređivanja—uključujući dodavanje, oduzimanje, kombinovanje, miješanje i transponovanje—tako da dobijete promjene koje želite bez gubitka onoga što čini sliku posebnom.
Kreativnost modela dolazi do izražaja kroz transformacije koje mijenjaju i dodaju elemente—poput teksta i rasporeda—kako bi oživjele ideje, dok istovremeno čuvaju važne detalje. Ove transformacije funkcionišu i za jednostavne i za složenije koncepte, a lako ih je isprobati koristeći unaprijed postavljene stilove i ideje u novoj značajci ChatGPT slike(otvara se u novom prozoru) —nije potreban pisani upit.
Model pouzdanije prati upute nego naša početna verzija. Ovo omogućava preciznije izmjene kao i složenije originalne kompozicije, pri čemu se odnosi između elemenata očuvaju kako je predviđeno.
Novo
Prethodni
Model pravi još jedan korak naprijed u prikazivanju teksta, sposoban je obraditi gušći i manji tekst.
Model, takođe, poboljšava dodatne dimenzije koje se pretvaraju u neposredno upotrebljivije rezultate, kao što je prikazivanje mnogih malih lica i kako prirodno izgledaju rezultati.
Novo
Prethodni
Pored generirati slika opisivanjem onoga što želite vidjeti u poruci, uvodimo posvećeno mjesto za Slike(otvara se u novom prozoru) u ChatGPT‑u—dostupno u bočnoj traci putem mobilne aplikacije i na chatgpt.com—kako bismo učinili istraživanje i isprobavanje slika bržim i lakšim. Sadrži desetine unaprijed postavljenih filtera i upita za pokretanje inspiracije, koji se redovno ažuriraju kako bi odražavali nove trendove.
Zajedno, ova unapređenja omogućavaju vam da kreirate slike koje bolje odgovaraju vašoj viziji, od malih izmjena do potpunih preinaka.
Ovaj model pojednostavljuje poslovne tokove rada bržim generiranjem slika, preciznim uređivanjem i dosljednim vizualnim detaljima kroz iteracije. Timovi mogu istražiti ideje, napraviti ciljane promjene i vizualizirati složene ili suhoparne koncepte, podržavajući slučajeve upotrebe u marketingu, dizajnu, e-trgovini i internim komunikacijama.
Ponovo smo pokrenuli mnoge primjere iz našeg početnog lansiranja generisanja slika kako bismo procijenili učinkovitost. Model pokazuje jasna poboljšanja u širokom spektru slučajeva, iako rezultati ostaju nesavršeni. Iako ovo izdanje predstavlja značajan napredak, još uvijek postoji značajan prostor za poboljšanje u budućim iteracijama.
Novo
Prethodno
Još uvijek postoje neke naučne netačnosti, ali ~70% je tačno i grafika je mnogo živopisnija, izbjegava prerano obrezivanje.
gpt-image-1.5 u API-ju donosi sve iste poboljšanja u ChatGPT slikama: jači je u očuvanju i uređivanju slika nego GPT‑image‑1.
Vidjet ćete dosljednije očuvanje brendiranih logotipa i ključnih vizuala kroz izmjene—što ga čini vrlo pogodnim za marketinški i brend rad poput kreiranja grafika i logotipa, te za ecommerce timove koji generiraju kompletne kataloge slika proizvoda (varijante, scene i uglovi) iz jedne izvorne slike.
Unosi i izlazi slika su sada 20% jeftiniji u GPT Image 1.5 u poređenju sa GPT Image 1, tako da možete generirati i iterirati više slika za isti budžet.
Možete isprobati novi model u OpenAI Playground(otvara se u novom prozoru) ili pročitati vodič za upit(otvara se u novom prozoru) za inspiraciju.
Preduzeća i startupi iz različitih industrija, uključujući kreativne alate, e-trgovinu, marketinški softver i još mnogo toga, već koriste GPT slika 1.5. Uzbuđeni smo što možemo podijeliti neke od ovih primjera u nastavku.
Novo
Prethodno
„GPT Image 1.5 generirati slike visoke vjernosti sa jakim pridržavanjem upita, očuvajući kompoziciju, osvjetljenje i fine detalje Rezultati su čisti, realistični i pouzdani, podržavajući brže tokove rada od koncepta do produkcije na platformama kao što je Wix. Na osnovu našeg testiranja i glavnih slučajeva upotrebe koje vidimo na Wix-u, dosljednost i kvalitet se takmiče da ga učine jednim od vodećih modela za generisanje slika danas.
— Hila Gat, voditeljica odjela za istraživanje umjetne inteligencije i nauku o podacima u Wixu
Nove ChatGPT Slike se uvode sada za sve ChatGPT korisnike i API korisnike globalno danas na svim platformama. Radi na svim modelima, tako da ne trebate ništa odabrati da biste ga koristili.
Vjerujemo da smo još uvijek na početku onoga što generisanje slika može omogućiti. Današnje ažuriranje je značajan korak naprijed, s još više poboljšanja koja dolaze, od preciznijih izmjena do bogatijih i detaljnijih rezultata na različitim jezicima.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















