Ngayon, inilalabas namin ang bagong bersyon ng ChatGPT Images, na pinapagana ng aming bagong pangunahing modelo ng image generation. Ngayon, kung ikaw ay gumawa ng isang bagay mula sa simula o nag-e-edit ng larawan, makukuha mo ang resulta na iyong iniisip. Gumagawa ito ng eksaktong pag-edit habang pinapanatili ang mga detalye tulad ng hitsura ng mga tao, at bumubuo ng mga larawan nang hanggang 4x na mas mabilis. Kasabay nito, ipinapakilala namin ang bagong feature na Larawan sa loob ng ChatGPT, na idinisenyo para gawing kasiya-siya ang pagbuo ng larawan—para magbigay ng inspirasyon at gawing madali ang malikhaing paggalugad
Ang bagong modelo at feature na larawan ay inilulunsad ngayon sa ChatGPT para sa lahat ng user, at sa API bilang gpt-image-1.5.
Ngayon, kapag humiling ka ng mga pag-edit sa na-upload na larawan, mas maaasahan ang modelo sa pagsunod sa iyong intensyon—hanggang sa maliliit na detalye—binabago lang ang iyong hinihiling habang pinapanatili ang mga element tulad ng ilaw, komposisyon, at hitsura ng mga tao na pare-pareho sa mga input, output, at sa mga kasunod na pag-edit.
Binubuksan nito ang mga resulta na tumutugma sa iyong intensyon—mas kapaki-pakinabang na pag-edit ng larawan, mas kapanipaniwalang pagsubok ng damit at hairstyle,kasabay ng stylistic na mga filter at konseptwal na mga pagbabago na pinapanatili ang esensya ng orihinal na larawan. Sama-sama, ang mga pagpapahusay na ito ay nangangahulugang puwedeng kumilos ang ChatGPT bilang creative studio sa iyong bulsa, na kayang gumawa ng parehong praktikal na mga pag-edit at malikhaing muling pag-iimagine.
Mahusay ang modelo sa iba't ibang uri ng pag-edit—kabilang ang pagdaragdag, pagbabawas, pagsasama, paghahalo, at paglipat—kaya makukuha mo ang mga pagbabagong gusto mo nang hindi nawawala ang espesyal na katangian ng larawan.
Makikita ang pagkamalikhain ng modelo sa mga transformasyong nagbabago at nagdaragdag ng mga element, gaya ng text at layout, para mabigyang-buhay ang mga ideya habang pinananatili ang mahahalagang detalye. Gumagana ang mga transformasyong ito para sa parehong simple at mas masalimuot na mga konsepto, at madaling subukan gamit ang mga preset na istilo at ideya sa bagong ChatGPT Images(magbubukas sa bagong window) feature—hindi na kailangan ng nakasulat na prompt.
Mas maaasahang sinusunod ng modelo ang mga tagubilin kaysa sa aming unang bersyon. Ini-enable nito ang mas tumpak na mga pag-edit pati na rin ang mas masalimuot na orihinal na komposisyon, kung saan napananatili ang mga ugnayan sa pagitan ng mga element ayon sa intensyon.
Bago
Nakaraan
Sumusulong pa ang modelo sa text rendering, na may kakayahang humawak ng mas siksik at mas maliliit na text.
Pinapabuti rin ng modelo ang karagdagang mga dimensyon na nagreresulta sa mas agarang magagamit na mga output, tulad ng pag-render ng maraming maliliit na mukha at kung gaano ka-natural ang hitsura ng mga output.
Bago
Nakaraan
Bilang karagdagan sa pagbubuo ng mga larawan sa pamamagitan ng paglalarawan ng gusto mong makita sa mensahe, ipinapakilala namin ang dedikadong lugar para sa Mga Larawan(magbubukas sa bagong window) sa ChatGPT—magagamit sa sidebar sa pamamagitan ng mobile app at sa chatgpt.com—upang gawing mas mabilis at mas madali ang paggalugad at pagsubok ng mga larawan. Kasama nito ang dose-dosenang mga preset na filter at prompt para pasimulan ang inspirasyon, na regular na ina-update para ipakita ang mga umuusbong na trend.
Kapag pinagsama-sama, ang mga pag-upgrade na ito ay nagbibigay-daan sa iyong gumawa ng mga larawang mas tumutugma sa iyong pananaw, mula sa maliliit na pag-edit hanggang sa mga kumpletong pagbabago.
Pinapadali ng modelong ito ang mga daloy ng trabaho sa negosyo gamit ang mas mabilis na pagbuo ng imahe, tumpak na mga pag-edit, at pare-parehong mga detalyeng biswal sa iba't ibang mga pag-ulit. Maaaring galugarin ng mga team ang mga ideya, gumawa ng mga tiyak na pagbabago, at biswal na ipakita ang mga kumplikado o dry na konsepto, na sumusuporta sa mga use case sa marketing, disenyo, e-commerce, at panloob na komunikasyon.
Muli naming ginawa ang maraming halimbawa mula sa aming unang paglulunsad ng pagbuo ng larawan para suriin ang pagganap. Ipinapakita ng modelo ang malinaw na mga pagpapabuti sa iba't ibang kaso, kahit na nananatiling hindi perpekto ang mga resulta. Bagaman ang paglabas na ito ay kumakatawan sa makabuluhang pag-unlad, may malaki pang puwang para sa pagpapabuti sa mga susunod na bersyon.
Bago
Nakaraan
Mayroon pa ring ilang kamalian sa agham, ngunit dahil halos 70% tama at mas matingkad ang mga graphics, naiiwasan nito ang maagang pag-crop.
ang gpt-image-1.5 sa API ay naghahatid ng lahat ng parehong mga pagpapabuti sa ChatGPT Images: mas mahusay ito sa pagpepreserba ng mga larawan at pag-edit ng mga larawan kaysa sa GPT Image 1.
Makikita mo ang mas pare-parehong pagpapanatili ng mga branded na logo at mahahalagang visual sa mga pag-edit—na ginagawang angkop ito para sa marketing at gawaing may kinalaman sa brand tulad ng paglikha ng graphics at logo, at para sa mga team ng ecommerce na bumuo ng kumpletong katalogo ng larawan ng produkto (mga variant, eksena, at anggulo) mula sa isang solong pinagmulan na larawan.
Mas mura na ng 20% ang image input at output sa GPT Image 1.5 kumpara sa GPT Image 1, kaya mas marami kang magagawang at maiuulit na imahe sa parehong badyet..
Pwede mong subukan ang bagong modelo sa OpenAI Playground(magbubukas sa bagong window) o basahin ang gabay sa prompt(magbubukas sa bagong window) para sa inspirasyon.
Gumagamit na ng GPT Image 1.5 ang mga negosyo at startup sa iba't ibang industriya kabilang ang mga malikhaing tool, e-commerce, marketing software, at marami pang iba. Nasasabik kaming ibahagi ang ilan sa mga halimbawang ito sa ibaba.
Bago
Nakaraan
“Mas mura na ngayon ng 20% ang image input at output sa GPT Image 1.5 kumpara sa GPT Image 1, kaya maaari kang bumuo at mag-iterate ng mas maraming imahe gamit ang parehong budget. Ang mga resulta ay malinis, makatotohanan, at maaasahan, na sumusuporta sa mas mabilis na daloy ng trabaho mula konsepto hanggang produksyon sa mga platform tulad ng Wix. Batay sa aming pagsubok at sa mga pangunahing kaso ng paggamit na nakikita namin sa Wix, ang pagkakapare-pareho at kalidad ay nagtatagisan upang gawin itong isa sa mga pangunahing modelo ng pagbuo ng larawan ngayon.
— Hila Gat, Head ng AI Research at Data Science sa Wix
Ang bagong ChatGPT Images ay inilulunsad na ngayon sa lahat ng mga user ng ChatGPT at mga user ng API sa buong mundo sa iba't ibang mga surface. Gumagana ito sa iba't ibang mga modelo, kaya hindi mo kailangang pumili ng kahit ano para magamit ito.
Naniniwala kami na nasa simula pa lang kami ng kung ano ang maaaring i-enable ng image generation. Muling umusad ang modelo sa text rendering, na may kakayahang humawak ng mas siksik at mas maliliit na text.
May-akda
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















