Oggi presentiamo una nuova versione di ChatGPT Immagini, alimentata dal nostro modello di punta per la generazione di immagini. Da questo momento, che tu stia creando qualcosa da zero o modificando una foto, otterrai esattamente il risultato che hai in mente. Esegue modifiche precise mantenendo intatti dettagli come l’aspetto delle persone, e genera immagini fino a quattro volte più velocemente. Inoltre, introduciamo anche una nuova funzione Immagini su ChatGPT, pensata per rendere la generazione di immagini più intuitiva, stimolare l’ispirazione e semplificare l’esplorazione creativa.
Il nuovo modello e la funzionalità Immagini sono disponibili da oggi su ChatGPT per tutti gli utenti e nell’API come gpt-image-1.5.
Ora, quando richiedi modifiche a un’immagine caricata, il modello rispetta la tua intenzione in modo più affidabile, intervenendo solo su ciò che chiedi e mantenendo coerenti, fino ai minimi dettagli, elementi come illuminazione, composizione e aspetto delle persone tra input, output e modifiche successive.
Questo consente di ottenere risultati che corrispondono meglio alle tue richieste:modifiche fotografiche più efficaci, prove di abbigliamento e acconciature più credibili, insieme a filtri stilistici e trasformazioni concettuali che preservano l'essenza dell'immagine originale. Nel complesso, questi miglioramenti permettono a ChatGPT di funzionare come uno studio creativo tascabile, capace di offrire sia modifiche pratiche sia reinterpretazioni espressive.
Il modello eccelle in diversi tipi di modifica, come aggiungere, sottrarre, combinare, fondere e trasporre, consentendoti di ottenere le modifiche desiderate senza perdere ciò che rende speciale l’immagine originale.
La creatività del modello si esprime attraverso trasformazioni che modificano e aggiungono elementi, come testo e layout, dando vita alle idee e preservando i dettagli importanti. Queste trasformazioni funzionano sia per concetti semplici sia per quelli più complessi e sono facili da sperimentare utilizzando stili e idee preimpostati nella nuova funzione ChatGPT Immagini(si apre in una nuova finestra), senza bisogno di un prompt scritto.
Il modello segue le istruzioni in modo più affidabile rispetto alla nostra versione iniziale. Questo consente modifiche più precise e composizioni originali più complesse, in cui le relazioni tra gli elementi vengono mantenute come richiesto.
Nuovo
Precedente
Il modello fa un ulteriore passo avanti nel rendering del testo, e ora è in grado di gestire testi più densi e più piccoli.
Il modello migliora anche su altri aspetti che si traducono in output immediatamente utilizzabili, come il rendering di numerosi volti di piccole dimensioni e la maggiore naturalezza dei risultati.
Nuovo
Precedente
Oltre a generare immagini descrivendo ciò che desideri vedere in un messaggio, introduciamo uno spazio dedicato alle Immagini(si apre in una nuova finestra) su ChatGPT, nella barra laterale dell’app mobile e su chatgpt.com, per rendere più facile e veloce l’esplorazione e la prova delle immagini. Include decine di filtri e prompt preimpostati per stimolare l’ispirazione, aggiornati regolarmente per riflettere le tendenze emergenti.
Questi aggiornamenti ti permettono di creare immagini più aderenti alla tua visione, dalle piccole modifiche alle reinterpretazioni complete.
Questo modello semplifica i flussi di lavoro aziendali grazie a una generazione di immagini più rapida, modifiche precise e dettagli visivi coerenti tra un’iterazione e l’altra. I team possono esplorare idee nuove, apportare modifiche mirate e visualizzare concetti complessi o astratti, supportando casi d’uso nel marketing, nel design, nell’e-commerce e nelle comunicazioni interne.
Abbiamo rieseguito molti esempi dal nostro lancio iniziale della funzione di generazione di immagini per valutare le prestazioni. Il modello mostra chiari miglioramenti in una serie di casi, anche se i risultati restano imperfetti. Anche se questo aggiornamento rappresenta un progresso significativo, resta ancora un ampio margine di miglioramento nelle iterazioni future.
Nuovo
Precedente
Permangono alcune imprecisioni scientifiche, ma il risultato è corretto per circa il 70%, con una grafica molto più vivida ed evitando tagli indesiderati dell’immagine.
gpt-image-1.5 nell’API offre gli stessi miglioramenti di ChatGPT Immagini, con prestazioni superiori nella conservazione e nella modifica delle immagini rispetto a GPT Image 1.
Noterai una conservazione più coerente di loghi di brand ed elementi visivi chiave tra le modifiche, che lo rende adatto ad attività di marketing e branding, come la creazione di grafiche e loghi, e ai team e-commerce che generano cataloghi completi di immagini di prodotto a partire da un’unica immagine di origine.
Gli input e output delle immagini sono ora più economici del 20% in GPT Image 1.5 rispetto a GPT Image 1, quindi puoi generare e iterare su più immagini con lo stesso budget.
Puoi provare il nuovo modello nel Playground di OpenAI(si apre in una nuova finestra) o leggere la guida ai prompt(si apre in una nuova finestra) per trarre ispirazione.
Imprese e startup che si occupano di strumenti creativi, e-commerce, software di marketing e altri ambiti utilizzano già GPT Image 1.5. Siamo lieti di condividere alcuni di questi esempi qui sotto.
Nuovo
Precedente
«GPT Image 1.5 genera immagini ad alta fedeltà con una forte aderenza ai prompt, preservando composizione, illuminazione e dettagli. I risultati sono puliti, realistici e affidabili, supportando flussi di lavoro più rapidi dal concetto alla produzione su piattaforme come Wix. In base ai nostri test e ai principali casi d'uso che vediamo su Wix, la coerenza e la qualità lo rendono uno dei modelli di generazione di immagini di punta di oggi».
— Hila Gat, Responsabile di AI Research e Data Science presso Wix
Il nuovo ChatGPT Immagini è oggi in fase di distribuzione a tutti gli utenti di ChatGPT e agli utenti API a livello globale, su tutte le piattaforme. Funziona su tutti i modelli, quindi non è necessario selezionare nulla per usarlo.
Riteniamo di essere ancora all’inizio di ciò che è possibile fare con la generazione di immagini. L’aggiornamento di oggi segna un passo avanti significativo, con ulteriori miglioramenti in arrivo, dalle modifiche più precise ad output più ricchi e dettagliati in tutte le lingue.
Autore
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















