Danas objavljujemo novu verziju ChatGPT Images, koju pokreće naš novi vodeći model za generiranje slika. Sad, bez obzira stvarate li od nule ili uređujete fotografiju, dobit ćete rezultat kakav ste zamislili. Omogućuje precizne izmjene uz očuvanje detalja, poput izgleda osoba, i generira slike do 4x brže. Uz to uvodimo i novu značajku Images unutar ChatGPT‑a, osmišljenu kako bi generiranje slika bilo sjajno iskustvo koje će potaknuti inspiraciju i učiniti kreativno istraživanje jednostavnim
Novi model Images i nova značajka danas se postupno uvode u ChatGPT za sve korisnike, a u API kao gpt-image-1.5.
Sad, kad zatražite izmjene na prenesenoj slici, model se pouzdanije drži vaše namjere – sve do sitnih detalja – mijenjajući samo ono što tražite, dok elementi poput osvjetljenja, kompozicije i izgleda osoba ostaju dosljedni kroz ulaze, izlaze i naknadne izmjene.
To otvara mogućnost rezultata koji doista odgovaraju vašoj namjeri – korisnijih uređivanja fotografija, uvjerljivijih isprobavanja odjeće i frizura, kao i stilskih filtara i konceptualnih transformacija koje zadržavaju bit izvornog prizora. Zajedno, ova poboljšanja znače da ChatGPT može djelovati kao kreativni studio u vašem džepu, sposoban i za praktične izmjene i za kreativna preoblikovanja.
Model se ističe u različitim vrstama uređivanja – uključujući dodavanje, uklanjanje, kombiniranje, stapanje i premještanje – pa dobivate željene izmjene bez gubitka onoga što sliku čini posebnom.
Kreativnost modela dolazi do izražaja kroz transformacije koje mijenjaju i dodaju elemente – poput teksta i izgleda – kako bi ideje oživjele, dok važni detalji ostaju sačuvani. Ove transformacije djeluju i za jednostavne i za složenije pojmove, a lako ih je isprobati koristeći unaprijed postavljene stilove i ideje u novoj značajci ChatGPT Images(otvara se u novom prozoru) – nije potreban pisani upit.
U odnosu na našu početnu verziju, ovaj model pouzdanije slijedi upute. To omogućuje preciznije uređivanje kao i složenije originalne kompozicije, gdje su odnosi između elemenata očuvani kako je zamišljeno.
Novo
Prethodni model
Model čini još jedan iskorak u prikazu teksta te može pouzdano obrađivati gušći i sitniji tekst.
Model također poboljšava dodatne dimenzije koje rezultiraju neposredno upotrebljivijim ishodima, poput prikaza brojnih manjih lica i prirodnog izgleda rezultata.
Novo
Prethodni model
Uz generiranje slika opisivanjem onoga što želite vidjeti u poruci, uvodimo i posebno mjesto za slike(otvara se u novom prozoru) u ChatGPT‑u – dostupno u bočnoj traci putem mobilne aplikacije i na chatgpt.com – kako bismo istraživanje i isprobavanje slika učinili bržim i jednostavnijim. Uključuje desetke unaprijed postavljenih filtara i upita koji potiču inspiraciju, a redovito se ažuriraju kako bi odražavali nove trendove.
Zajedno vam ova poboljšanja omogućuju da stvorite slike koje bolje odgovaraju vašoj viziji, od malih izmjena do potpunih preinaka.
Ovaj model pojednostavljuje tijekove rada bržim generiranjem slika, preciznim izmjenama i dosljednim vizualnim detaljima kroz više izmjena. Timovi mogu istraživati ideje, uvoditi ciljane promjene i vizualizirati složene ili „suhe“ koncepte, čime se podržavaju slučajevi primjene u marketingu, dizajnu, e-trgovini i internim komunikacijama.
Ponovno smo pokrenuli mnoge primjere iz našeg početnog lansiranja generiranja slika kako bismo procijenili učinkovitost. Model pokazuje jasna poboljšanja u nizu slučajeva, iako rezultati i dalje nisu savršeni. Premda ovo izdanje predstavlja značajan napredak, i dalje ima mnogo prostora za poboljšanja u budućim verzijama.
Novo
Prethodni model
Još uvijek postoje neke znanstvene netočnosti, ali oko 70 % je točno i grafika je znatno živopisnija, uz izbjegavanje prerane obrade ruba slike.
gpt-image-1.5 u API-ju donosi sva ista poboljšanja kao ChatGPT Images: snažniji je u očuvanju slike i uređivanju u odnosu na GPT Image 1.
Tijekom izmjena model dosljedno čuva logotipe i ključne vizualne elemente brendova, što ga čini posebno prikladnim za marketinške potrebe i vizualni identitet, poput izrade grafika i logotipa, kao i za timove u e-trgovini koji iz jedne izvorne slike izrađuju cjelovite kataloge proizvoda s različitim varijantama, scenama i kutovima.
Ulazi i izlazi slika sad su 20 % jeftiniji u GPT Image 1.5 u usporedbi s GPT Image 1, pa za isti budžet možete generirati i doraditi više slika.
Novi model možete isprobati u OpenAI Playgroundu(otvara se u novom prozoru) ili pročitati vodič za upite(otvara se u novom prozoru) kako biste se nadahnuli.
Tvrtke i startupi iz različitih sektora, uključujući kreativne alate, e-trgovinu, marketinški softver i druge, već koriste GPT Image 1.5. U nastavku s veseljem dijelimo neke od tih primjera.
Novo
Prethodni model
„GPT Image 1.5 generira slike visoke vjernosti i vjerno prati zadani opis, pritom čuvajući kompoziciju, osvjetljenje i fine detalje. Rezultati su čisti, realistični i pouzdani te podržavaju brže tijekove rada od koncepta do produkcije na platformama poput Wixa. Na temelju naših testiranja i glavnih slučajeva primjene koje vidimo u Wixu, dosljednost i kvaliteta ističu ga kao jedan od vodećih modela za generiranje slika danas.”
– Hila Gat, voditeljica odjela za istraživanje umjetne inteligencije i podatkovnu znanost, Wix
Novi ChatGPT Images danas se globalno uvodi za sve korisnike ChatGPT‑a i API-ja na svim sučeljima. Radi u svim modelima, pa ne morate ništa posebno odabrati kako biste ga koristili.
Vjerujemo da smo još uvijek na početku onoga što može omogućiti generiranje slika. Današnje ažuriranje je značajan korak naprijed, s još više poboljšanja koja uvodimo – od preciznijih izmjena do bogatijih i detaljnijih rezultata na različitim jezicima.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















