Idag släpper vi en ny version av ChatGPT Images, som drivs av vår nya flaggskeppsmodell för bildgenerering. Nu, oavsett om du skapar något från grunden eller redigerar ett foto, kommer du att få det resultat du föreställer dig. Den gör exakta redigeringar samtidigt som den behåller detaljer som människors utseende intakta och genererar bilder upp till fyra gånger snabbare. Samtidigt presenterar vi en ny bildfunktion i ChatGPT, utformad för att göra bildgenerering till en glädje, väcka inspiration och underlätta kreativ utforskning
Den nya bildmodellen och funktionen lanseras idag i ChatGPT för alla användare, och i API:et som GPT‑image‑1.5.
Nu när du ber om redigeringar av en uppladdad bild följer modellen din avsikt mer pålitligt – ända in i minsta detalj – och ändrar bara det du ber om samtidigt som den håller element som belysning, komposition och människors utseende konsekventa över indata, utdata och efterföljande redigeringar.
Det här ger tillgång till resultat som matchar din avsikt – mer användbara fotoredigeringar, mer trovärdiga provningar av kläder och frisyrer, tillsammans med stilistiska filter och konceptuella omvandlingar som behåller essensen av den ursprungliga bilden. Tillsammans innebär dessa förbättringar att ChatGPT kan fungera som en kreativ studio i din ficka, kapabel till både praktiska redigeringar och uttrycksfulla omarbetningar.
Modellen utmärker sig i olika typer av redigering –inklusive att lägga till, subtrahera, kombinera, blanda och transponera – så att du får de ändringar du önskar utan att förlora det som gör bilden speciell.
Modellens kreativitet lyser igenom i omvandlingar som ändrar och lägger till element – som text och layout – för att blåsa liv i idéer, samtidigt som viktiga detaljer bevaras. Dessa omvandlingar fungerar för både enkla och mer komplexa koncept och är lätta att testa med förinställda stilar och idéer i den nya ChatGPT Images(öppnas i ett nytt fönster)-funktionen – och du slipper skriva promptar.
Modellen följer instruktioner mer tillförlitligt än vår ursprungliga version. Detta möjliggör mer exakta redigeringar samt mer komplexa originalkompositioner, där relationerna mellan elementen bevaras som avsett.
Ny
Föregående
Modellen tar ytterligare ett steg framåt inom textrendering och är kapabel att hantera tätare och mindre text.
Modellen förbättras också på ytterligare dimensioner som ger mer omedelbart användbara utdata, såsom att rendera många små ansikten och hur naturliga utdata ser ut.
Ny
Föregående
Förutom att generera bilder genom att beskriva vad du vill se i ett meddelande, introducerar vi ett speciellt avsnitt för Images(öppnas i ett nytt fönster) i ChatGPT. Det är tillgänglig i sidopanelen via mobilappen och på chatgpt.com för att påskynda och förenkla utforskning och test av bilder. Det innehåller ett tiotal förinställda filter och promptar för att ge dig inspiration, som uppdateras regelbundet för att återspegla nya trender.
Med dessa uppgraderingar kan du skapa bilder som bättre överensstämmer med din vision – från små justeringar till fullständiga omarbetningar.
Denna modell effektiviserar arbetsflöden för företag med snabbare bildgenerering, exakta redigeringar och konsekventa visuella detaljer över ändringar. Team kan utforska idéer, göra riktade förändringar och visualisera komplexa koncept eller DRY-koncept, vilket stöder användningsområden inom marknadsföring, design, e-handel och intern kommunikation.
Vi körde om många av exemplen från vår initiala lansering av bildgenereringsfunktionen för att utvärdera dess prestanda. Modellen visar tydliga förbättringar över ett brett spektrum av fall, även om resultaten fortfarande är ofullkomliga. Även om denna lansering representerar betydande framsteg, finns det fortfarande mycket utrymme för förbättringar i framtida iterationer.
Ny
Föregående
Fortfarande några vetenskapliga felaktigheter, men är ungefär 70 % korrekt, ger mer levande grafik och undviker för tidig beskärning.
gpt-image-1.5 i API:et levererar samma förbättringar i ChatGPT Images: den är bättre på att bevara och redigera bilder än GPT Image 1.
Du kommer att se ett mer konsekvent bevarande av varumärkeslogotyper och viktiga bildelement över redigeringar, vilket gör det väl lämpat för marknadsföring och varumärkesarbete som grafik och logotypdesign, samt för e-handelsteam som genererar kompletta produktbildkataloger (varianter, scener och vinklar) från en enda källbild.
Bildindata och -utdata är nu 20 % billigare i GPT Image 1.5 jämfört med GPT Image 1, så du kan generera och ändra fler bilder för samma budget.
Du kan prova den nya modellen i OpenAI Playground(öppnas i ett nytt fönster) eller läsa promptguiden(öppnas i ett nytt fönster) för inspiration.
Storföretag och startupföretag inom olika branscher, inklusive kreativa verktyg, e-handel, marknadsföringsprogramvara använder redan GPT Image 1.5. Vi är glada att dela med oss av några av dessa exempel nedan.
Ny
Föregående
“GPT Image 1.5 genererar högupplösta bilder med stark följsamhet till prompten, och bevarar komposition, belysning och detaljer på mikronivå. Resultaten är rena, realistiska och tillförlitliga, vilket stöder snabbare arbetsflöden för koncept-till-produktion på plattformar som Wix. Baserat på våra tester och de huvudsakliga användningsfallen vi ser på Wix, tävlar konsistensen och kvaliteten om att göra det till en av de främsta flaggskeppsmodellerna för bildgenerering idag.”
– Hila Gat, chef för AI-forskning och datavetenskap på Wix
Den nya ChatGPT Images rullas nu ut till alla ChatGPT‑användare och API-användare globalt idag på alla plattformar. Det fungerar med alla modeller, så du behöver inte välja något för att använda det.
Vi tror att vi fortfarande är i början av vad bildgenerering kan möjliggöra. Dagens uppdatering är ett betydelsefullt steg framåt med mer att vänta, från finare redigeringar till rikare och mer detaljerade utdata på flera språk.
Författare
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















