Hari ini, kami merilis versi baru dari ChatGPT Images, yang didukung oleh model pembuatan gambar unggulan terbaru kami. Kini, baik membuat sesuatu dari nol maupun mengedit foto, Anda akan mendapatkan hasil sesuai dengan yang Anda bayangkan. Fitur ini membuat pengeditan yang presisi sambil menjaga detail seperti penampilan orang yang tetap utuh, dan menghasilkan gambar hingga 4x lebih cepat. Bersamaan dengan itu, kami memperkenalkan fitur Images terbaru dalam ChatGPT, yang dirancang untuk membuat pembuatan gambar menjadi menyenangkan—untuk memunculkan inspirasi dan membuat eksplorasi kreatif menjadi mudah
Model dan fitur Images terbaru diluncurkan hari ini di ChatGPT untuk semua pengguna, dan di API sebagai GPT‑image‑1.5.
Kini, saat Anda meminta pengeditan pada gambar yang diunggah, model akan mengikuti maksud Anda dengan lebih andal—hingga ke detail kecil—hanya mengubah apa yang Anda minta sambil menjaga elemen seperti pencahayaan, komposisi, dan penampilan orang tetap konsisten di seluruh input, output, dan pengeditan selanjutnya.
Hal ini memungkinkan hasil yang sesuai dengan maksud Anda— edit foto yang lebih berguna, coba pakaian dan gaya rambut yang lebih realistis, serta gaya filter dan transformasi konseptual yang mempertahankan esensi gambar asli. Dengan berbagai peningkatan ini, ChatGPT kini dapat berperan sebagai studio kreatif di genggaman Anda, mampu menangani pengeditan praktis sekaligus penciptaan ulang gambar yang ekspresif.
Model ini unggul dalam berbagai jenis pengeditan—termasuk menambah, mengurangi, menggabungkan, mencampur, dan mentransposisi—sehingga Anda mendapatkan perubahan yang diinginkan tanpa kehilangan apa yang membuat gambar tersebut istimewa.
Kreativitas model tercermin dalam transformasi yang mengubah dan menambahkan elemen—seperti teks dan tata letak—untuk menghidupkan ide-ide, sambil mempertahankan detail penting. Transformasi ini berfungsi untuk konsep sederhana maupun rumit, dan mudah untuk dicoba dengan gaya dan ide siap pakai di fitur baru ChatGPT Images(terbuka di jendela baru) —tanpa memerlukan prompt tertulis.
Model tersebut mengikuti instruksi dengan lebih andal dibandingkan versi awal kami. Hal ini memungkinkan pengeditan yang lebih presisi serta komposisi asli yang lebih rumit, di mana hubungan antara elemen dipertahankan sesuai maksud.
Baru
Sebelumnya
Model ini melangkah lebih maju dalam rendering teks, mampu menangani teks yang lebih padat dan lebih kecil.
Model ini juga meningkatkan dimensi tambahan yang menghasilkan output yang lebih cepat dapat digunakan, seperti merender banyak wajah kecil dan bagaimana output terlihat lebih alami.
Baru
Sebelumnya
Selain dapat menghasilkan gambar dengan mendeskripsikan apa yang ingin Anda lihat dalam sebuah pesan, kami memperkenalkan halaman khusus untuk Images(terbuka di jendela baru) di ChatGPT—tersedia di sidebar melalui aplikasi seluler dan di chatgpt.com—untuk membuat penjelajahan dan percobaan gambar menjadi lebih cepat dan lebih mudah. Ini mencakup lusinan filter dan prompt siap pakai untuk memunculkan inspirasi, yang diperbarui secara berkala untuk mencerminkan tren yang sedang berkembang.
Dengan semua peningkatan ini, Anda dapat membuat gambar yang lebih sesuai dengan visi Anda, mulai dari pengeditan kecil hingga penciptaan ulang gambar secara keseluruhan.
Model ini mempermudah alur kerja bisnis dengan pembuatan gambar yang lebih cepat, pengeditan yang presisi, serta konsistensi detail visual di setiap iterasi. Tim dapat mengeksplorasi ide, melakukan perubahan terarah, dan memvisualisasikan konsep yang kompleks atau membosankan, mendukung berbagai penggunaan di bidang pemasaran, desain, e-commerce, dan komunikasi internal.
Kami menjalankan ulang banyak contoh dari peluncuran awal pembuatan gambar kami untuk mengevaluasi kinerja. Model menunjukkan peningkatan yang jelas di berbagai kasus, meskipun hasilnya tetap tidak sempurna. Meskipun rilis ini menunjukkan kemajuan yang berarti, masih ada ruang yang signifikan untuk perbaikan dalam iterasi mendatang.
Baru
Sebelumnya
Masih ada beberapa ketidakakuratan ilmiah, tetapi ~70% benar dan grafik yang lebih hidup, menghindari pemotongan gambar sebelum waktunya.
gpt-image-1.5 di API menghadirkan semua peningkatan yang sama seperti pada ChatGPT Images: versi ini lebih unggul dalam mempertahankan dan mengedit gambar dibandingkan GPT Image 1.
Anda akan melihat konsistensi yang lebih baik dalam mempertahankan logo merek dan elemen visual utama di berbagai pengeditan—membuatnya sangat cocok untuk pekerjaan pemasaran dan merek seperti pembuatan grafis dan logo, serta untuk tim e-commerce yang menghasilkan katalog gambar produk lengkap (varian, adegan, dan sudut) dari satu gambar sumber.
Input dan output gambar sekarang 20% lebih murah di GPT Image 1.5 dibandingkan dengan GPT Image 1, sehingga Anda dapat membuat dan mengiterasi lebih banyak gambar dengan anggaran yang sama.
Anda dapat mencoba model baru di OpenAI Playground(terbuka di jendela baru) atau membaca panduan prompt(terbuka di jendela baru) untuk mendapatkan inspirasi.
Perusahaan dan startup di berbagai industri, termasuk alat kreatif, e-commerce, perangkat lunak pemasaran, dan lainnya, sudah menggunakan GPT Image 1.5. Kami senang untuk membagikan beberapa contoh ini di bawah.
Baru
Sebelumnya
“GPT Image 1.5 menghasilkan gambar dengan fidelitas tinggi dan kepatuhan yang kuat terhadap prompt, menjaga komposisi, pencahayaan, dan detail yang halus. Hasilnya bersih, realistis, dan dapat diandalkan, mendukung alur kerja dari konsep ke produksi yang lebih cepat pada platform seperti Wix. Berdasarkan pengujian kami dan kasus penggunaan utama yang kami lihat di Wix, konsistensi dan kualitas bersaing untuk menjadikannya salah satu model pembuatan gambar unggulan saat ini."
— Hila Gat, Kepala Riset AI dan Ilmu Data di Wix
ChatGPT Images terbaru sedang diluncurkan sekarang untuk semua pengguna ChatGPT dan pengguna API secara global hari ini di berbagai platform. Fitur ini berfungsi di seluruh model, jadi Anda tidak perlu memilih apa pun untuk menggunakannya.
Kami yakin bahwa kita masih berada di awal dari potensi yang dapat diwujudkan oleh pembuatan gambar. Pembaruan hari ini merupakan langkah maju yang signifikan dengan lebih banyak lagi yang akan datang, mulai dari pengeditan yang lebih terperinci hingga output yang lebih kaya dan mendetail dalam berbagai bahasa.
Penulis
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















