Денес објавуваме нова верзија на ChatGPT слики, овозможена од нашиот нов водечки модел за генерирање слики. Сега, без разлика дали креираш нешто од нула или уредуваш фотографија, ќе го добиеш резултатот што го замислуваш. Прави прецизни уредувања задржувајќи ги непроменети деталите, како изгледот на луѓето, и генерира слики до 4 пати побрзо. Покрај тоа, воведуваме нова функција за слики во ChatGPT, дизајнирана да го направи генерирањето слики пријатно—да поттикне инспирација и да го направи креативното истражување без напор
Новиот модел и функција за слики се воведуваат денес во ChatGPT за сите корисници, и во API како gpt-image-1.5.
Сега, кога бараш да изврши измени на поставена слика, моделот поверодостојно ја следи твојата намера—до најмалите детали—менувајќи го само она што го бараш, задржувајќи ги елементите, како осветлувањето, композиција и изгледот на луѓето конзистентни со сите внесени информации, резултати и последователни измени.
Ова отклучува резултати што одговараат на твојата намера—покорисни уредувања, пробувања на поверодостојна облека и фризури, заедно со стилистички филтри и концептуални трансформации кои ја задржуваат суштината на оригиналната слика. Заедно, овие подобрувања значат дека ChatGPT може да делува како креативно студио во твојот џеб, способно за практични уредувања и експресивни осмислувања.
Моделот се истакнува во различни видови на уредување—вклучувајќи додавање, одземање, комбинирање, мешање и транспонирање—така што добиваш промени што ги сакаш без да го изгубиш она што ја прави сликата посебна.
Креативноста на моделот блеска преку трансформации кои менуваат и додаваат елементи—како текст и распоред—за да ги оживеат идеите, додека ги зачувуваат важните детали. Овие трансформации функционираат и за едноставни и за покомплексни концепти, и лесно се испробуваат користејќи претходно поставени стилови и идеи во новата функција ChatGPT слики(се отвора во нов прозорец) — не е потребен пишан промпт.
Моделот ги следи инструкциите поверно од нашата почетна верзија. Ова овозможува попрецизни уредувања, како и покомплексни оригинални композиции, каде што односите помеѓу елементите се зачувани како што е замислено.
Ново
Претходно
Моделот прави уште еден чекор напред во рендерирањето на текст, способен да обработува погуст и помал текст.
Моделот исто така е подобрен во дополнителни димензии кои водат до понепосредно употребливи резултати, како што е прикажувањето на многу мали лица и природниот изглед на субјектите.
Ново
Претходно
Покрај генерирањето слики со опишување на тоа што сакаш да видиш во порака, воведуваме посебно место за Слики(се отвора во нов прозорец) во ChatGPT—достапно во страничната лента преку мобилната апликација и на chatgpt.com—за да биде истражувањето и пробувањето на слики побрзо и полесно. Вклучува десетици однапред поставени филтри и промпти за да ја поттикнат инспирацијата, редовно ажурирани за да ги одразуваат новите трендови.
Заедно, овие надградби ти овозможуваат да креираш слики кои подобро одговараат на твојата визија, од мали измени до целосни преосмислувања.
Овој модел ги поедноставува работните текови со побрзо генерирање на слики, прецизни уредувања и конзистентни визуелни детали низ итерациите. Тимовите можат да истражуваат идеи, да прават насочени промени и да визуализираат сложени или сувопарни концепти, поддржувајќи случаи на користење во маркетинг, дизајн, е-трговија и внатрешни комуникации.
Повторно ги репродуциравме многу од примерите од нашето првично лансирање на моделот за генерирање слики за да ги оцениме перформансите. Моделот покажува јасни подобрувања во различни случаи, иако резултатите сепак се несовршени. Иако ова издание претставува значаен напредок, сè уште има значителен простор за подобрување во идните итерации.
Ново
Претходно
Сè уште има некои научни неточности, но ~70% е точно и графиките се многу повпечатливи, избегнува прерано отсекување.
gpt-image-1.5 во API ги носи сите исти подобрувања во ChatGPT слики: појак е во зачувување и уредување на слики отколку GPT Image 1.
Ќе видите поконзистентно зачувување на брендирани логоа и клучни визуелни елементи низ уредувањата—што го прави добро прилагоден за маркетинг и работа со брендови, како креирање графики и логоа, и за тимовите за е-трговија кои генерираат целосни каталози на слики на производи (варијанти, сцени и агли) од една изворна слика.
Внесувањата и резултатите на слики сега се 20 % поевтини во GPT Image 1.5 во споредба со GPT Image 1, така што можеш да генерираш и итерираш повеќе слики за истиот буџет.
Можеш да го пробаш новиот модел во OpenAI Playground(се отвора во нов прозорец) или да го прочиташ водичот за промпти(се отвора во нов прозорец) за инспирација.
Претпријатија и стартапи од различни индустрии, вклучувајќи креативни алатки, е-трговија, маркетинг софтвер и повеќе, веќе го користат GPT Image 1.5. Со задоволство споделуваме некои од овие примери подолу.
Ново
Претходно
„GPT Image 1.5 генерира слики со висока верност, силна усогласеност со промптот, зачувувајќи ја композицијата, осветлувањето и фините детали.“ Резултатите се чисти, реалистични и доверливи, поддржувајќи побрзи работни текови од концепт до производство на платформи како Wix. Врз основа на нашето тестирање и главните случаи на употреба што ги гледаме на Wix, конзистентноста и квалитетот се тука за да го направат еден од водечките модели за генерирање слики денес.
— Хила Гат, Раководител на истражување на вештачка интелигенција и наука за податоци во Wix
Новиот ChatGPT слики денес се воведува сега за сите корисници на ChatGPT и API корисници глобално на сите платформи. Работи на сите модели, така што не мора да избереш ништо за да го користиш.
Сметаме дека сè уште сме на почетокот од тоа што може да се овозможи со генерирањето слики. Денешното ажурирање е значаен чекор напред, а уште повеќе следува, од пофини уредувања до побогати и подетални резултати на различни јазици.
Автор
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















