I dag lanserer vi en ny versjon av ChatGPT Bilder, drevet av vår nye flaggskipmodell for bildegenerering. Når du heretter oppretter noe fra bunnen av eller redigerer et bilde, får du det resultatet du ser for deg. Modellen gjør presise redigeringer samtidig som den beholder detaljer som menneskeansikter intakt, og genererer bilder opptil fire ganger raskere. Samtidig introduserer vi en ny bildefunksjon i ChatGPT, designet for å gjøre bildegenerering gøy og inspirere og gjøre kreativ utforskning lekende lett
Den nye bildemodellen og funksjonen rulles ut i dag i ChatGPT til alle brukere, og i API-en som GPT‑image‑1.5.
Når du heretter ber om redigeringer av et opplastet bilde, følger modellen intensjonen din mer pålitelig, helt ned til de minste detaljer, og endrer bare det du ber om. Elementer som belysning, komposisjon og menneskeansikter forblir konsistente uansett inndata, utdata og senere redigeringer.
Dette gir muligheter for resultater som samsvarer med intensjonen din – mer brukbare bilderedigeringer, mer troverdig klesdrakt og hårfrisyrer du kan eksperimentere med, sammen med stilistiske filtre og konseptuelle transformasjoner som bevarer hovedinntrykket av det opprinnelige bildet. Til sammen betyr disse forbedringene at ChatGPT kan fungere som et kreativt studio du får plass til i lommen, i stand til både praktiske redigeringer og uttrykksfulle nytolkninger.
Modellen utmerker seg i ulike typer redigering, som å legge til, trekke fra, kombinere, blande og transponere, slik at du får de endringene du ønsker, uten å miste det som gjør bildet til noe eget.
Modellens kreativitet skinner gjennom transformasjoner som endrer og legger til elementer som tekst og oppsett som gir liv til ideer, samtidig som viktige detaljer bevares. Disse transformasjonene fungerer for både enkle og mer intrikate konsepter, og er lette å prøve ved å bruke forhåndsinnstilte stiler og ideer i den nye ChatGPT Bilder(åpnes i et nytt vindu)-funksjonen – skriftlige meldinger er ikke nødvendig.
Modellen følger instruksjoner mer pålitelig enn vår første versjon. Dette gjør både mer presise redigeringer og mer intrikate originale komposisjoner mulig, der forholdene mellom elementene bevares som tiltenkt.
Ny
Forrige
Modellen tar et nytt skritt fremover innen tekstgjengivelse og er i stand til å håndtere tettere og mindre tekststørrelse.
Modellen er også forbedret på flere områder som gir mer umiddelbart brukbare resultater, som i gjengivelse av mange små ansikter og hvor naturlige resultatene ser ut.
Ny
Forrige
I tillegg til å generere bilder ved å beskrive i en melding hva du ønsker å se, introduserer vi et dedikert hjem for Bilder(åpnes i et nytt vindu) i ChatGPT. Dette er tilgjengelig i sidefeltet i mobilappen og på chatgpt.com, for å gjøre utforsking og prøving av bilder raskere og enklere. Det inneholder massevis av forhåndsinnstilte filtre og meldinger for å kickstarte inspirasjon, som oppdateres regelmessig for å følge med på nye trender.
Sammen gjør disse oppgraderingene det mulig å opprette bilder som bedre samsvarer med visjonen din, fra små justeringer til fullstendige nytolkninger.
Denne modellen effektiviserer bedriftsarbeidsflyter med raskere bildegenerering, presise redigeringer og konsistente visuelle detaljer gjennom flere iterasjoner. Team kan utforske idéer, gjøre målrettede endringer, visualisere komplekse eller tørre konsepter og støtte bruksområder innen markedsføring, design, e-handel og intern kommunikasjon.
Vi kjørte mange av eksemplene fra vår første lansering av bildegenerering på nytt for å evaluere ytelsen. Modellen viser klare forbedringer i en rekke tilfeller, selv om resultatene fortsatt ikke er perfekte. Selv om denne utgivelsen representerer betydelig fremgang, er det fremdeles mye rom for forbedring i fremtidige iterasjoner.
Ny
Forrige
Fremdeles noen vitenskapelige unøyaktigheter, men ca. 70 % korrekt og mye mer livfull grafikk, unngår for tidlig beskjæring.
gpt-image-1.5 i API-en leverer alle de samme forbedringene i ChatGPT Bilder: Den er bedre på å bevare og redigere bilder enn GPT Image 1.
Du vil se at merkevarelogoer og viktige visuelle elementer bevares mer konsekvent gjennom flere redigeringer. Dette gjør verktøyet godt egnet til markedsføring og merkevarearbeid, som grafikk og logoutvikling, og for e-handelsteam som genererer komplette produktkataloger, med bilder i flere varianter, scener og vinkler ut fra ett enkelt kildebilde.
Bildeinndata og -utdata er nå 20 % billigere i GPT Image 1.5 sammenlignet med GPT Image 1, så du kan generere og iterere på flere bilder på samme budsjett.
Du kan prøve den nye modellen i OpenAI Playground(åpnes i et nytt vindu) eller lese meldingsveiledningen(åpnes i et nytt vindu) for å få inspirasjon.
Bedrifter og oppstartsbedrifter i alle slags bransjer, blant annet kreative verktøy, e-handel, markedsføringsprogramvare og mye mer, bruker allerede GPT Image 1.5. Vi deler noen av disse eksemplene nedenfor.
Ny
Forrige
«GPT Image 1.5 genererer bilder med stor nøyaktighet og godt samsvar med meldinger, og bevarer komposisjon, belysning og finkornede detaljer. Resultatene er rene, realistiske og pålitelige og støtter raskere arbeidsflyter fra konsept til produksjon på plattformer som Wix. Basert på vår testing og de viktigste bruksområdene vi ser på Wix, gjør konsistensen og kvaliteten til at dette er en av de ledende bildegenereringsmodellene i dag.»
– leder for KI-forskning og datavitenskap Hila Gat i Wix
Den nye ChatGPT Bilder lanseres i dag til alle ChatGPT‑brukere og API-brukere globalt på alle plattformer. Den fungerer på alle modeller, så du trenger ikke å velge noe for å bruke den.
Vi tror vi fortsatt er i begynnelsen av hva bildegenerering kan gjøre mulig. Dagens oppdatering er et betydningsfullt skritt fremover med mer i vente, fra mer finkornede justeringer til rikere, mer detaljerte resultater på mange språk.
Forfatter
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















