I dag lancerer vi en ny version af ChatGPT Images drevet af vores nye flagskibsmodel til billedgenerering. Uanset om du skaber noget fra bunden eller redigerer et foto, vil du nu få det resultat, du forestiller dig. Den laver præcise redigeringer, mens den bevarer detaljer, som folks udseende, intakte, og genererer billeder op til 4 gange hurtigere. Samtidig introducerer vi en ny funktion til billeder i ChatGPT designet til at gøre billedgenerering sjovt – for at inspirere og gøre kreativ udforskning nemt
Den nye billedmodel- og funktion rulles ud i dag i ChatGPT for alle brugere og i API'en som GPT‑image‑1.5.
Når du beder om redigeringer af et uploadet billede, følger modellen nu din hensigt mere pålideligt—ned til de små detaljer—og ændrer kun det, du beder om, mens den holder elementer som belysning, komposition og folks udseende konsistente i forskelligt input, output og efterfølgende redigeringer.
Dette låser op for resultater, der matcher din hensigt—mere nyttige fotoredigeringer, mere troværdige tøj- og frisureprøver sammen med stilistiske filtre og konceptuelle transformationer, der bevarer essensen af det originale billede. Sammen betyder disse forbedringer, at ChatGPT kan fungere som et kreativt studie i din lomme, der kan udføre praktiske redigeringer og udtryksfulde gengivelser.
Modellen udmærker sig i forskellige typer redigering – herunder tilføjelse, subtraktion, kombination, blanding og transponering – så du får de ændringer, du ønsker, uden at miste det, der gør billedet specielt.
Modellens kreativitet skinner igennem transformationer, der ændrer og tilføjer elementer—som tekst og layout—for at føre idéer ud i livet samtidig med, at vigtige detaljer bevares. Disse transformationer fungerer både for simple og mere indviklede koncepter og er nemme at afprøve ved hjælp af forudindstillede stilarter og ideer i den nye funktion ChatGPT Images(åbner i et nyt vindue)—ingen skriftlig forespørgsel er påkrævet.
Modellen følger instruktioner mere pålideligt end vores første version. Dette muliggør mere præcise redigeringer samt mere indviklede originale kompositioner, hvor forholdene mellem elementerne bevares som tilsigtet.
Ny
Forrige
Modellen tager endnu et skridt fremad inden for tekstgengivelse og kan håndtere tættere og mindre tekst.
Modellen forbedrer også ekstra dimensioner, der fører til mere umiddelbart brugbare resultater, som f.eks. gengivelse af mange små ansigter, og hvordan naturlige resultater ser ud.
Ny
Forrige
Ud over at generere billeder ved at beskrive, hvad du gerne vil se i en besked, introducerer vi en dedikeret sektion for billeder(åbner i et nyt vindue) i ChatGPT—tilgængelig i sidemenuen via mobilappen og på chatgpt.com—for at gøre det hurtigere og nemmere at udforske og afprøve billeder. Det omfatter snesevis af forudindstillede filtre og forespørgsler til at kickstarte inspiration, som regelmæssigt opdateres for at afspejle nye tendenser.
Sammen giver disse opgraderinger dig mulighed for at skabe billeder, der bedre matcher din vision, fra små ændringer til fulde nyfortolkninger.
Denne model strømliner virksomhedsarbejdsgange med hurtigere billedgenerering, præcis redigering og ensartede visuelle detaljer på tværs af iterationer. Teams kan udforske idéer, lave målrettede ændringer og visualisere komplekse eller tørre koncepter, som understøtter brugercases inden for markedsføring, design, e-handel og intern kommunikation.
Vi kørte mange af eksemplerne fra vores første lancering af billedgenerering igen for at evaluere præstationen. Modellen viser tydelige forbedringer af flere forskellige tilfælde, selvom resultaterne stadig er ufuldkomne. Selvom denne udgivelse repræsenterer meningsfulde fremskridt, er der stadig betydelig plads til forbedring i fremtidige iterationer.
Ny
Forrige
Der er stadig nogle videnskabelige unøjagtigheder, men ~70 % er korrekt, og grafikken er meget mere levende, så du undgår for tidlig beskæring.
gpt-image-1.5 i API'en leverer alle de samme forbedringer i ChatGPT Images: Den er bedre til billedbevaring- og redigering end GPT Image 1.
Du vil se en mere konsekvent bevarelse af brandede logoer og vigtige visuelle elementer af flere redigeringer—der gør den velegnet til markedsførings- og brandarbejde som grafik- og logoskabelse samt for e-handelshold, der genererer komplette produktbilledkataloger (varianter, scener og vinkler) fra et enkelt kildebillede.
Billedinput og -output er nu 20 % billigere i GPT Image 1.5 sammenlignet med GPT Image 1, så du kan generere og gentage på flere billeder for det samme budget.
Du kan prøve den nye model i OpenAI Playground(åbner i et nyt vindue) eller læse forespørgselsvejledning(åbner i et nyt vindue) for inspiration.
Virksomheder og startups i flere forskellige brancher, herunder kreative værktøjer, e-handel, markedsføringssoftware m.m., bruger allerede GPT Image 1.5. Vi er spændte på at dele nogle af disse eksempler nedenfor.
Ny
Forrige
“GPT Image 1.5 genererer billeder i høj kvalitet, hvor den overholder forespørgslen og bevarer komposition, belysning og fine detaljer. Resultaterne er rene, realistiske og pålidelige, hvilket understøtter hurtigere koncept-til-produktionsarbejdsgange på platforme som Wix. Baseret på vores test og de vigtigste brugercases, vi ser hos Wix, konkurrerer konsistensen og kvaliteten om at gøre det til en af de førende billedgenereringsmodeller i dag.
— Hila Gat, chef for AI-forskning og datavidenskab hos Wix
Den nye ChatGPT Images udrulles nu til alle ChatGPT‑brugere og API-brugere globalt i dag på flere platforme. Den fungerer i flere modeller, så du behøver ikke vælge noget for at bruge den.
Vi mener, at vi stadig er i begyndelsen af, hvad billedgenerering kan muliggøre. Dagens opdatering er et meningsfuldt skridt fremad med mere i vente fra finere redigeringer til rigere, mere detaljerede output på flere sprog.
Skrevet af
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















