Astăzi, lansăm o nouă versiune a funcției Imagini ChatGPT, bazată pe noul nostru model emblematic de generare de imagini. Acum, fie că creezi ceva de la zero sau editezi o fotografie, vei obține rezultatul pe care ți-l imaginezi. Realizează editări precise păstrând detalii precum aspectul persoanelor intact și generează imagini de până la 4 ori mai rapid. În plus, introducem o nouă funcție Imagini în cadrul ChatGPT, concepută pentru a face generarea de imagini plăcută — pentru a inspira și a simplifica la maximum explorarea creativă.
Noul model și noua funcție Imagini sunt lansate astăzi în ChatGPT pentru toți utilizatorii și în API ca gpt-image-1.5.
Acum, când soliciți modificări la o imagine încărcată, modelul îți respectă intenția mai fiabil — până la cele mai mici detalii — modificând doar ceea ce soliciți, păstrând totodată elemente precum iluminarea, compoziția și aspectul persoanelor consecvente în toate intrările, ieșirile și editările ulterioare.
Acest lucru permite rezultate care corespund intenției tale — editări foto mai utile, probe de haine și coafuri mai credibile, alături de filtre stilistice și transformări conceptuale care păstrează esența imaginii originale. Împreună, aceste îmbunătățiri înseamnă că ChatGPT poate acționa ca un studio creativ la îndemână, capabil atât de editări practice, cât și de reimaginări expresive.
Modelul excelează la diferite tipuri de editare — inclusiv la adăugare, eliminare, combinare, amestecare și transpunere — astfel încât să obții modificările dorite fără a pierde ceea ce face imaginea specială.
Creativitatea modelului se reflectă în transformările care modifică și adaugă elemente, precum textul și aspectul, pentru a transpune ideile în realitate, păstrând totodată și detaliile importante. Aceste transformări funcționează atât pentru concepte simple, cât și pentru concepte mai complexe și sunt ușor de încercat folosind stiluri și idei prestabilite în noua funcție Imagini ChatGPT(se deschide într-o fereastră nouă) — nu este nevoie de nicio solicitare scrisă.
Modelul urmează instrucțiunile mai fiabil decât versiunea noastră inițială. Acest lucru permite editări mai precise, precum și compoziții originale mai complexe, în care relațiile dintre elemente sunt păstrate așa cum au fost concepute.
Nou
Anterior
Modelul face încă un pas înainte în randarea textului, fiind capabil să gestioneze text mai dens și mai mic.
Modelul îmbunătățește și alte dimensiuni care determină ieșiri mai ușor de utilizat, cum ar fi randarea unui număr mare de fețe mici și aspectul natural al ieșirilor.
Nou
Anterior
Pe lângă generarea de imagini prin descrierea a ceea ce vrei să vezi într-un mesaj, lansăm un loc dedicat pentru Imagini(se deschide într-o fereastră nouă) în ChatGPT — disponibil în bara laterală prin aplicația mobilă și pe chatgpt.com — pentru a facilita și accelera explorarea și încercarea imaginilor. Include zeci de filtre prestabilite și sugestii menite să stimuleze inspirația, actualizate periodic pentru a reflecta tendințele emergente.
Împreună, aceste îmbunătățiri îți permit să creezi imagini care se potrivesc mai bine cu viziunea ta, de la mici modificări la reimaginări complete.
Acest model simplifică fluxurile de lucru ale firmelor prin generarea mai rapidă a imaginilor, editări precise și detalii vizuale uniforme în toate iterațiile. Echipele pot explora idei, efectua schimbări țintite și vizualiza concepte complexe sau simple, sprijinind cazuri de utilizare în marketing, design, comerț electronic și comunicări interne.
Am rulat din nou multe dintre exemplele din lansarea inițială a generării de imagini pentru a evalua performanța. Modelul prezintă îmbunătățiri clare într-o gamă largă de cazuri, deși rezultatele rămân imperfecte. Deși această versiune reprezintă un progres semnificativ, în versiunile viitoare mai sunt încă multe aspecte care pot fi îmbunătățite.
Nou
Anterior
Încă mai există unele inexactități științifice, dar ~70% sunt corecte și elementele grafice sunt mult mai vii, ceea ce previne decuparea prematură.
gpt-image-1.5 din API oferă aceleași îmbunătățiri în Imagini ChatGPT: este mai eficient la conservarea și editarea imaginilor decât GPT Image 1.
Vei observa o conservare mai uniformă a siglelor mărcilor și a elementelor vizuale cheie în toate editările, ceea ce face ca acest instrument să fie potrivit pentru activități de marketing și branding, precum crearea de elemente grafice și sigle, precum și pentru echipele de comerț electronic care generează cataloage complete de imagini ale produselor (variante, scene și unghiuri) dintr-o singură imagine sursă.
Intrările și ieșirile de imagini sunt acum cu 20% mai ieftine în GPT Image 1.5 comparativ cu GPT Image 1, așa că poți genera și itera mai multe imagini cu același buget.
Poți încerca noul model în OpenAI Playground(se deschide într-o fereastră nouă) sau poți citi ghidul de solicitări(se deschide într-o fereastră nouă) pentru inspirație.
Întreprinderile și start-upurile din diverse sectoare, inclusiv din domeniul instrumentelor creative, comerțului electronic, software-ului de marketing și altele, utilizează deja GPT Image 1.5. Suntem încântați să împărtășim câteva dintre aceste exemple mai jos.
Nou
Anterior
„GPT Image 1.5 generează imagini de înaltă fidelitate cu respectarea strictă a solicitărilor, păstrând compoziția, iluminarea și detaliile subtile. Rezultatele sunt clare, realiste și fiabile, sprijinind fluxuri de lucru mai rapide de la concept la producție pe platforme precum Wix. Pe baza testelor noastre și a principalelor cazuri de utilizare pe care le observăm la Wix, uniformitatea și calitatea se întrec în a-l face unul dintre modelele de referință pentru generarea de imagini din prezent.”
— Hila Gat, directoarea departamentului de cercetare în domeniul inteligenței artificiale și știința datelor la Wix
Noua funcție Imagini ChatGPT se lansează acum pentru toți utilizatorii ChatGPT și utilizatorii API la nivel global, pe toate platformele. Funcționează pe toate modelele, așa că nu trebuie să selectezi nimic pentru a o folosi.
Considerăm că suntem încă la începutul posibilităților oferite de generarea de imagini. Actualizarea de astăzi este un pas important înainte, urmând să vină și mai multe, de la editări mai fine la ieșiri mai complexe și mai detaliate în diferite limbi.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















