Sot, po qarkullojmë një version të ri të ChatGPT Images, i fuqizuar nga modeli ynë kryesor për gjenerimin e imazheve. Tani, qoftë kur po krijon diçka nga e para apo po redakton një foto, do të marrësh rezultatin që po imagjinon. Ai bën modifikime të sakta duke i ruajtur detajet, si pamja e njerëzve, të paprekura dhe gjeneruar imazhe deri në 4 herë më shpejt. Përveç kësaj, po prezantojmë një veçori të re të Images brenda ChatGPT, e cila është projektuar për ta bërë gjenerimin e imazheve të këndshëm — për të ngjallur frymëzim dhe për ta bërë eksplorimin krijues pa mundim.
Modeli dhe veçoria e re e Images po prezantohen sot në ChatGPT për të gjithë përdoruesit, dhe në API si gpt-image-1.5.
Tani, kur kërkon ndryshime në një imazh të ngarkuar, modeli i përmbahet qëllimit tënd më me besueshmëri — deri në detajet e vogla — duke ndryshuar vetëm atë që kërkon, ndërsa mban elemente si ndriçimi, kompozicioni dhe pamja e njerëzve të qëndrueshme në hyrje, dalje dhe redaktimet pasuese.
Kjo mundëson rezultate që përputhen me qëllimin tënd — redaktime fotografish më të dobishme, prova më të besueshme të veshjeve dhe të stilit të flokëve, së bashku me filtra stilistikë dhe transformime konceptuale që ruajnë thelbin e imazhit origjinal. Së bashku, këto përmirësime bëjnë që ChatGPT të veprojë si një studio krijuese në xhepin tënd, e aftë për redaktime praktike dhe rikrijime shprehëse.
Modeli shkëlqen në lloje të ndryshme redaktimi — duke përfshirë shtimin, heqjen, kombinimin, përzierjen dhe transpozimin — kështu që ti merr ndryshimet që dëshiron pa humbur atë që e bën imazhin të veçantë.
Krijimtaria e modelit shkëlqen përmes transformimeve që ndryshojnë dhe shtojnë elemente — si teksti dhe paraqitja — për të sjellë idetë në jetë, duke ruajtur detajet e rëndësishme. Këto transformime funksionojnë si për konceptet e thjeshta ashtu edhe për ato më të ndërlikuara, dhe janë të lehta për t'u provuar duke përdorur stile dhe ide të paracaktuara në veçorinë e re ChatGPT Images(hapet në një dritare të re) — pa qenë nevoja për kërkesë të shkruar.
Modeli ndjek udhëzimet më me besueshmëri sesa versioni ynë fillestar. Kjo mundëson redaktime më të sakta si dhe kompozime origjinale më të ndërlikuara, ku marrëdhëniet midis elementeve ruhen siç janë menduar.
E reja
E mëparshmja
Modeli bën një hap tjetër përpara në paraqitjen e tekstit, me aftësi përpunimi teksti më të dendur dhe më të vogël.
Modeli gjithashtu përmirësohet në dimensione shtesë që përkthehen në rezultate më të përdorshme menjëherë, siç është paraqitja e shumë fytyrave të vogla dhe si duken rezultatet natyrale.
E reja
E mëparshmja
Përveç gjenerimit të imazheve duke përshkruar atë që dëshiron të shohësh në një mesazh, ne po prezantojmë një vend të dedikuar për Images(hapet në një dritare të re) në ChatGPT—të disponueshme në shiritin anësor përmes aplikacionit celular dhe në chatgpt.com—për të bërë eksplorimin dhe provën e imazheve më të shpejtë dhe më të lehtë. Ai përfshin dhjetëra filtra të paracaktuar dhe kërkesa për të nisur frymëzimin, të cilat përditësohen rregullisht për të pasqyruar tendencat e reja.
Së bashku, këto përmirësime të mundësojnë të krijosh imazhe që përputhen më mirë me vizionin tënd, nga redaktimet e vogla deri te rikonceptimet e plota.
Ky model thjeshton ciklet e punës të biznesit me gjenerimin më të shpejtë të imazheve, redaktime të sakta dhe detaje vizuale të qëndrueshme në të gjitha iteracionet. Ekipet mund të eksplorojnë ide, të bëjnë ndryshime të lokalizuara dhe të vizualizojnë koncepte komplekse ose të fillestare, duke mbështetur rastet e përdorimit në marketing, dizajn, tregti elektronike dhe komunikime të brendshme.
Ne riprovuam shumë nga shembujt nga qarkullimi ynë fillestar i gjenerimit të imazheve për të vlerësuar performancën. Modeli tregon përmirësime të qarta në një sërë rastesh, megjithatë rezultatet mbeten të papërsosura. Ndërsa ky qarkullim përbën një përparim kuptimplotë, ka ende hapësirë të konsiderueshme për përmirësim në iteracionet e ardhshme.
E reja
E mëparshmja
Ende disa pasaktësi shkencore, por ~70% e saktë dhe grafika shumë më të gjalla, shmang prerjen e parakohshme.
gpt-image-1.5 në API ofron të gjitha përmirësimet e njëjta si ChatGPT Images: është më i fortë në ruajtjen dhe redaktimin e imazhit sesa GPT Image 1.
Do të shohësh një ruajtje më të qëndrueshme të logove të markës dhe elementeve vizuale kryesore nëpër redaktime — duke e bërë të përshtatshëm për punë marketingu dhe marke si krijimi i grafikëve dhe logove, dhe për ekipet e tregtisë elektronike që gjenerojnë katalogë të plotë të imazheve të produkteve (variante, skena dhe kënde) nga një imazh i vetëm burimor.
Inputet dhe outputet e imazheve tani janë 20% më ekonomike në GPT Image 1.5 krahasuar me GPT Image 1, ndaj mund të gjenerosh dhe iterosh më shumë imazhe për të njëjtin buxhet.
Mund të provosh modelin e ri në OpenAI Playground(hapet në një dritare të re) ose të lexosh udhëzuesin e kërkesës(hapet në një dritare të re) për frymëzim.
Ndërmarrjet dhe startup-et në sektorë të ndryshëm, duke përfshirë mjetet krijuese, tregtinë elektronike, softuerin e marketingut dhe më shumë, tashmë po përdorin GPT Image 1.5. Kemi kënaqësinë të ndajmë disa nga këta shembuj më poshtë.
E reja
E mëparshmja
“GPT Image 1.5 gjeneron imazhe me besnikëri të lartë me përputhje të fortë me kërkesën, duke ruajtur kompozimin, ndriçimin dhe detajet e imta Rezultatet janë të pastra, realiste dhe të besueshme, duke mbështetur cikle pune më të shpejta nga koncepti në produksion në platforma si Wix. Bazuar në testimet tona dhe rastet kryesore të përdorimit që shohim te Wix, konsistenca dhe cilësia konkurrojnë për ta bërë një nga modelet kryesore të gjenerimit të imazheve sot.
— Hila Gat, drejtues i kërkimeve për AI dhe shkencën e të dhënave në Wix
Versioni i ri i ChatGPT Images po qarkullon tani për të gjithë përdoruesit e ChatGPT dhe përdoruesit e API në rang bote nga sot në të gjitha platformat. Funksionon në të gjitha modelet, kështu që nuk ke nevojë të zgjedhësh asgjë për ta përdorur.
Ne besojmë se jemi ende në fillim të asaj që gjenerimi i imazheve do të mundësojë. Përditësimi i sotëm është një hap domethënës përpara me shumë të tjerë në vijim, nga redaktimet më të imta deri te rezultatet më të pasura dhe më të hollësishme në të gjitha gjuhët.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















