Leo, tunatoa toleo jipya la ChatGPT Images, linaloendeshwa na muundo wetu mkuu mpya wa uundaji wa picha. Sasa, iwapo mnaunda kitu kutoka mwanzo au kuhariri picha, mtapata matokeo mnayoyafikiria. Inafanya marekebisho sahihi huku ikihifadhi maelezo kama vile mwonekano wa watu, na inazalisha picha hadi mara 4 kwa kasi zaidi. Pamoja na hayo, tunatanguliza kipengele kipya cha Picha ndani ya ChatGPT, kilichoundwa ili kufanya uundaji wa picha uwe wa kufurahisha—kuchochea msukumo na kufanya uchunguzi wa ubunifu uwe rahisi.
Muundo mpya wa Picha na kipengele kinazinduliwa leo katika ChatGPT kwa watumiaji wote, na katika API kama GPT‑image‑1.5.
Sasa, unapouliza mabadiliko kwa picha iliyopakuliwa, muundo unafuata nia yako kwa uaminifu zaidi—hadi maelezo madogo—ukibadilisha tu kile unachoomba huku ukihifadhi vipengele kama mwanga, mpangilio, na mwonekano wa watu kuwa thabiti katika Ingizo, matokeo, na mabadiliko yanayofuata.
Hii inafungua matokeo yanayolingana na nia yako—mabadiliko ya picha yanayofaa zaidi, majaribio ya mavazi na mitindo ya nywele yanayoaminika zaidi, pamoja na vichujio vya kistaili na mabadiliko ya dhana yanayohifadhi kiini cha picha ya asili. Pamoja, maboresho haya yanamaanisha ChatGPT inaweza kufanya kazi kama studio ya ubunifu mfukoni mwako, yenye uwezo wa kufanya marekebisho ya vitendo na ubunifu wa kuelezea upya.
Muundo unafanya vizuri katika aina tofauti za uhariri—ikiwa ni pamoja na kuongeza, kutoa, kuunganisha, kuchanganya, na kubadilisha—hivyo unapata mabadiliko unayotaka bila kupoteza kile kinachofanya picha kuwa maalum.
Ubunifu wa muundo hujitokeza kupitia mabadiliko yanayobadilisha na kuongeza vipengele—kama vile maandishi na mpangilio—ili kuleta mawazo katika uhalisia, huku ukihifadhi maelezo muhimu. Mabadiliko haya yanafanya kazi kwa dhana rahisi na ngumu zaidi, na ni rahisi kujaribu kwa kutumia mitindo na mawazo yaliyowekwa tayari katika kipengele kipya cha Picha za ChatGPT(fungua katika dirisha jipya) —hakuna dokezo la maandishi linalohitajika.
Muundo hufuata maagizo kwa uaminifu zaidi kuliko toleo letu la kwanza. Hii inawasha uhariri sahihi zaidi pamoja na utunzi wa asili wa kina zaidi, ambapo mahusiano kati ya vipengele yanahifadhiwa kama ilivyokusudiwa.
Mpya
Awali
Muundo unachukua hatua nyingine mbele katika utoaji wa maandishi, ukiwa na uwezo wa kushughulikia maandishi yenye msongamano na madogo zaidi.
Muundo pia unaboreshwa katika vipengele vya ziada vinavyotafsiriwa kuwa matokeo yanayoweza kutumika mara moja, kama vile kutoa sura ndogo ndogo nyingi na jinsi matokeo ya asili yanavyoonekana.
Mpya
Awali
Mbali na kuzalisha picha kwa kuelezea unachotaka kuona katika ujumbe, tunaleta sehemu maalum ya Picha(fungua katika dirisha jipya) ndani ya ChatGPT—inapatikana kwenye upau wa upande kupitia programu ya simu na kwenye chatgpt.com—ili fanya kugundua na kujaribu picha kuwa haraka na rahisi zaidi. Inajumuisha vichujio vya awali kadhaa na dokeza ili kuanzisha msukumo, ambavyo husasishwa mara kwa mara ili kuakisi mitindo inayoibuka.
Pamoja, maboresho haya yanakuwezesha kuunda picha zinazolingana vyema na maono yako, kuanzia marekebisho madogo hadi ubunifu kamili.
Muundo huu unarahisisha michakato ya Business kwa uzalishaji wa picha wa haraka, uhariri sahihi, na maelezo ya kuona thabiti katika kila mzunguko. Timu zinaweza kugundua mawazo, kufanya mabadiliko yaliyolengwa, na kuonyesha dhana changamani au kavu, zikisaidia matumizi katika masoko, muundo, biashara ya mtandaoni, na mawasiliano ya ndani.
Tulirudia mifano mingi kutoka kwa uzinduzi wetu wa awali wa uundaji wa picha ili kutathmini utendaji. Muundo unaonyesha maboresho dhahiri katika aina mbalimbali za kesi, ingawa matokeo yanabaki kuwa si kamilifu. Ingawa toleo hili linawakilisha maendeleo yenye maana, bado kuna nafasi kubwa ya kuboreshwa katika matoleo ya baadaye.
Mpya
Awali
Bado kuna dosari za kisayansi, lakini ~70% ni sahihi na michoro ni angavu zaidi, huepuka kukatwa mapema.
gpt-image-1.5 katika API inatoa maboresho yote sawa katika Picha za ChatGPT: ni bora zaidi katika kuhifadhi na kuhariri picha kuliko GPT Picha 1.
Utaona uhifadhi thabiti zaidi wa nembo za chapa na taswira kuu katika uhariri—hii inafanya iwe bora kwa kazi za uuzaji na chapa kama vile uundaji wa michoro na nembo, na kwa timu za biashara mtandaoni zinazozalisha katalogi kamili za picha za bidhaa (tofauti, mandhari, na pembe) kutoka kwa picha moja ya chanzo.
Viingizo na vitoleo vya picha sasa ni 20% nafuu zaidi katika GPT Image 1.5 ikilinganishwa na GPT Image 1, hivyo unaweza kuzalisha na kurudia picha zaidi kwa bajeti ile ile.
Unaweza kujaribu muundo mpya katika OpenAI Playground(fungua katika dirisha jipya) au usome mwongozo wa dokezo(fungua katika dirisha jipya) ili kuvutiwa.
Mashirika na kampuni changa katika sekta mbalimbali ikiwa ni pamoja na zana za ubunifu, biashara mtandaoni, programu za masoko, na zaidi tayari zinatumia GPT Picha 1.5. Tunafurahi kushiriki baadhi ya mifano hapa chini.
Mpya
Awali
“GPT Image 1.5 inazalisha picha za uaminifu wa juu kwa kufuata dokeza kwa umakini, ikihifadhi muundo, mwangaza, na maelezo ya kina. Matokeo ni safi, halisi, na ya kuaminika, yakisaidia mtiririko wa kazi wa haraka kutoka dhana hadi uzalishaji kwenye majukwaa kama Wix. Kulingana na majaribio yetu na matumizi makuu tunayoyaona katika Wix, uthabiti na ubora vinashindana kuufanya kuwa mmoja wa miundo ya kizazi cha picha bora leo.
— Hila Gat, Mkuu wa Utafiti wa AI na Sayansi ya Data katika Wix
Picha mpya za ChatGPT zinatolewa sasa kwa watumiaji wote wa ChatGPT na watumiaji wa API duniani kote leo katika majukwaa mbalimbali. Inafanya kazi katika miundo yote, kwa hivyo huhitaji kuchagua chochote ili kuitumia.
Tunaamini bado tuko mwanzoni mwa kile uundaji wa picha unaweza kuwasha. Sasisho la leo ni hatua muhimu mbele na kuna mengi zaidi yanayokuja, kutoka kwa uhariri wa kina zaidi hadi matokeo tajiri zaidi na ya kina katika lugha mbalimbali.
Mwandishi
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















