Bỏ qua nội dung chính
OpenAI

ChatGPT ảnh mới đã có mặt.

Đang tải…

Hôm nay, chúng tôi ra mắt phiên bản mới của ChatGPT Images, được hỗ trợ bởi mô hình tạo sinh ảnh hàng đầu mới. Bây giờ, dù bạn đang tạo một cái gì đó từ đầu hay chỉnh sửa một bức ảnh, bạn sẽ có được kết quả như bạn hình dung. Nó thực hiện các chỉnh sửa chính xác trong khi giữ nguyên các chi tiết như diện mạo của con người và tạo ảnh nhanh hơn gấp 4 lần. Bên cạnh đó, chúng tôi còn giới thiệu một tính năng ảnh mới trong ChatGPT, được thiết kế để quá trình tạo sinh ảnh trở nên thú vị—để khơi nguồn cảm hứng và giúp việc khám phá sáng tạo trở nên dễ dàng.

Mô hình và tính năng ảnh mới đang được triển khai hôm nay trong ChatGPT cho tất cả người dùng, và trong API dưới dạng gpt-image-1.5.

Chỉnh sửa chính xác để giữ lại những gì quan trọng

Hiện tại, khi bạn yêu cầu chỉnh sửa một hình ảnh đã tải lên, mô hình tuân thủ ý định của bạn một cách đáng tin cậy hơn—đến từng chi tiết nhỏ—chỉ thay đổi những gì bạn yêu cầu trong khi giữ các yếu tố như ánh sáng, bố cục và diện mạo của mọi người nhất quán giữa đầu vào, đầu ra và các chỉnh sửa tiếp theo.

Tinh năng này mở khóa các kết quả phù hợp với ý định của bạn—các chỉnh sửahữu ích hơn, các thử nghiệm trang phục và kiểu tóc đáng tin cậy hơn, cùng với các bộ lọc phong cách và chuyển đổi khái niệm giữ nguyên bản chất của hình ảnh gốc. Những cải tiến này đồng nghĩa với việc ChatGPT có thể hoạt động như một studio sáng tạo trong túi của bạn, có khả năng thực hiện cả chỉnh sửa thực tế và tái hiện sáng tạo.

Chỉnh sửa

Mô hình vượt trội trong các loại chỉnh sửa khác nhau—bao gồm thêm, bớt, kết hợp, pha trộn và hoán đổi—giúp bạn có được những thay đổi mong muốn mà không làm mất đi điều gì làm cho hình ảnh trở nên đặc biệt.

chatgpt-images-example-1-input-2chatgpt-images-example-1-input-1chatgpt-images-example-1-input-2

Combine the two men and the dog in a 2000s film camera-style photo of them looking bored at a kids birthday party.

chatgpt-images-example-1-output-1

Add chaotic kids in the background throwing things and screaming.

chatgpt-images-example-1-output-2

Change the man on the left to a hand-drawn retro anime style, the dog to plushie style, keep the man on the right and background scenery the way they are.

chatgpt-images-example-1-output-3
Screenshot 2025-12-12 at 10.23.01 AM

Put them all in OpenAI sweaters that look like this.

chatgpt-images-example-1-output-4

Now remove the two men, just keep the dog, and put them in an OpenAI livestream that looks like the attached image.

chatgpt-images-example-1-output-5

Những chuyển đổi sáng tạo

Tính sáng tạo của mô hình tỏa sáng qua những biến đổi thay đổi và thêm các yếu tố—như văn bản và bố cục—để hiện thực hóa ý tưởng, đồng thời bảo tồn các chi tiết quan trọng. Những chuyển đổi này hoạt động cho cả các khái niệm đơn giản và phức tạp hơn, và dễ dàng thử nghiệm bằng cách sử dụng các phong cách và ý tưởng có sẵn trong tính năng ChatGPT Ảnh(mở trong cửa sổ mới) mới—không cần lời nhắc viết.

chatgpt-images-example-3-output-1

Make an old school golden age hollywood movie poster of a movie called 'codex' from the image of these two men. feel free to change their costumes to fit the times

Change the names of the actors to Wojciech Zaremba (left) and Greg Brockman (right) 

Directed by Sam Altman, produced by Fidji Simo. A Feel the AGI Pictures Production.

chatgpt-images-example-3-output-2

Thực hiện theo hướng dẫn

Mô hình tuân theo hướng dẫn đáng tin cậy hơn so với phiên bản ban đầu của chúng tôi. Điều này cho phép thực hiện các chỉnh sửa chính xác hơn cũng như tạo ra các tác phẩm gốc phức tạp hơn, nơi mà mối quan hệ giữa các yếu tố được giữ nguyên như dự định.

Mới

draw a 6x6 grid

Make a 6 (columns) by 6 (rows) grid grid of:

Row 1: the Greek letter beta, a beach ball, a lemon, a robot, a fish tank, a frog

Row 2: a praying mantis, an expensive watch, a baththub, a pair of sunglasses, a colorful butterfly, an envelope

Row 3: a stamp, a picture frame, a steaming dumpling, the word "miracle", a pair of skis, the letter Z

Row 4: a toilet, a subway token, a mute icon, a bottle of perfume, a dragonfly, a skateboard helmet

Row 5: a Bluetooth icon, the number 13, a green heart, a rubik's cube, a Canada goose, a soldier's helmet

Row 6: a white dog, a life jacket, a knot, a keyboard, a tissue box, the number 14

chatgpt-images-instruction-following-new

Trước đó

draw a 6x6 grid

Make a 6 (columns) by 6 (rows) grid grid of:

Row 1: the Greek letter beta, a beach ball, a lemon, a robot, a fish tank, a frog

Row 2: a praying mantis, an expensive watch, a baththub, a pair of sunglasses, a colorful butterfly, an envelope

Row 3: a stamp, a picture frame, a steaming dumpling, the word "miracle", a pair of skis, the letter Z

Row 4: a toilet, a subway token, a mute icon, a bottle of perfume, a dragonfly, a skateboard helmet

Row 5: a Bluetooth icon, the number 13, a green heart, a rubik's cube, a Canada goose, a soldier's helmet

Row 6: a white dog, a life jacket, a knot, a keyboard, a tissue box, the number 14

chatgpt-images-instruction-following-old

Kết xuất văn bản

Mô hình tiến thêm một bước trong việc kết xuất văn bản, có khả năng xử lý văn bản dày đặc và nhỏ hơn.

There is a newspaper on a desk. The newspaper shows the markdown below laid out as a **natural** newspaper article. Preserve all content, formatting, and numbers exactly. The image should be tall.

# Introducing GPT‑5.2

### *The most advanced frontier model for professional work and long-running agents*

**December 11, 2025**

---

We are introducing **GPT‑5.2**, the most capable model series yet for professional knowledge work.

Already, the average ChatGPT Enterprise user says AI saves them 40–60 minutes a day, and heavy users say it saves them more than 10 hours a week. We designed GPT‑5.2 to unlock even more economic value for people; it’s better at creating spreadsheets, building presentations, writing code, perceiving images, understanding long contexts, using tools, and handling complex, multi-step projects.

GPT‑5.2 sets a new state of the art across many benchmarks, including GDPval, where it outperforms industry professionals at well-specified knowledge work tasks spanning 44 occupations.

---

## Benchmark highlights

| Benchmark | Domain | GPT‑5.2 Thinking | GPT‑5.1 Thinking |

|---|---|---:|---:|

| GDPval (wins or ties) | Knowledge work tasks | **70.9%** | 38.8% (GPT‑5) |

| SWE-Bench Pro (public) | Software engineering | **55.6%** | 50.8% |

| SWE-bench Verified | Software engineering | **80.0%** | 76.3% |

| GPQA Diamond (no tools) | Science questions | **92.4%** | 88.1% |

| CharXiv Reasoning (w/ Python) | Scientific figure questions | **88.7%** | 80.3% |

| AIME 2025 (no tools) | Competition math | **100.0%** | 94.0% |

| FrontierMath (Tier 1–3) | Advanced mathematics | **40.3%** | 31.0% |

| FrontierMath (Tier 4) | Advanced mathematics | **14.6%** | 12.5% |

| ARC-AGI-1 (Verified) | Abstract reasoning | **86.2%** | 72.8% |

| ARC-AGI-2 (Verified) | Abstract reasoning | **52.9%** | 17.6% |

---

Notion, Box, Shopify, Harvey, and Zoom observed that GPT‑5.2 demonstrates state-of-the-art long-horizon reasoning and tool-calling performance. Databricks, Hex, and Triple Whale found GPT‑5.2 to be exceptional at agentic data science and document analysis tasks. Cognition, Warp, Charlie Labs, JetBrains, and Augment Code report that GPT‑5.2 delivers state-of-the-art agentic coding performance, with measurable improvements in areas such as interactive coding, code reviews, and bug finding.

In ChatGPT, GPT‑5.2 Instant, Thinking, and Pro will begin rolling out today, starting with paid plans. In the API, they are available now to all developers.

Overall, GPT‑5.2 brings significant improvements in general intelligence, long-context understanding, agentic tool-calling, and vision—making it better at executing complex, real-world tasks end-to-end than any previous model.

chatgpt-images-text-rendering-2

Now change the article to the markdown below:

# Introducing GPT‑Image‑1.5

### *The new and improved ChatGPT Images*

**December 16, 2025**

---

Today, we’re introducing a new and improved version of ChatGPT Images, powered by our best image generation model yet. With stronger instruction following and more precise editing, ChatGPT Images delivers the changes you ask for while keeping important details like facial likeness consistent across edits—now with generation speeds up to **4× faster**, making it easier to iterate and explore ideas with less waiting.

This is our most capable general-purpose text-to-image model to date, with more expressive transformations, improved dense text rendering, and more natural-looking results. Whether you’re making a tiny fix or a total reinvention, you can simply say what you want—or choose from preset styles and ideas in the new Images experience—and ChatGPT handles the rest, delivering results that are both useful and compelling, and better match your intent.

The new Images model and experience is beginning to roll out today in ChatGPT for all users, and in the API as **GPT‑Image‑1.5**.

---

## Results that match your intent

The model now follows instructions more reliably—down to the small details—changing what you ask for while able to keep elements like lighting, composition, and likeness consistent across inputs, outputs, and subsequent edits.

This unlocks results that match your intent—more useful photo edits, more believable clothing and hairstyle try-ons, alongside stylistic filters and conceptual transformations that retain the essence of the original image. Together, these improvements mean ChatGPT can act as a creative studio in your pocket, capable of both practical edits and expressive reimaginings.

### Editing

The model excels at different types of editing so you get the changes you want without losing what makes the image special.

### Creative Transformations

The model’s creativity shines with creative transformations, changing and adding elements—like text and layout—that help the concept come to life while maintaining important details.

### Instruction Following

The model is able to better follow instructions versus GPT Image 1.0.

### Text Rendering

The model takes another step ahead in text rendering, capable of handling denser and smaller text.

---

## A new creation space

In addition to asking for images through ChatGPT by describing what you’d like to see, we’re also introducing a dedicated Images experience in the ChatGPT sidebar to make exploring and trying images easier and quicker. This includes preset filters and trending prompts to jump-start inspiration, as well as a one-time likeness upload so you can reuse your appearance across future creations without the need to go through your camera roll again.

Together, these upgrades let you create images that better match your vision, from small edits to full reimaginings. Images now render up to four times faster, and you can continue generating new images while others are still in progress—so you can explore more ideas without waiting.

chatgpt-images-text-rendering-3

Những cải tiến chất lượng bổ sung

Mô hình cũng cải thiện trên các khía cạnh bổ sung để tạo ra các kết quả có thể sử dụng ngay lập tức, như việc hiển thị nhiều khuôn mặt nhỏ và cách mà các kết quả tự nhiên trông.

Mới

make a scene in chelsea, london in the 1970s, photorealistic, everything in focus, with tons of people, and a bus with an advertisement for "ImageGen 1.5" with the OpenAI logo and subtitle "Create what you imagine". Hyper-realistic amateur photography, iPhone snapshot quality…

chatgpt-images-quality-1

Trước đó

make a scene in chelsea, london in the 1970s, photorealistic, everything in focus, with tons of people, and a bus with an advertisement for "ImageGen 1.5" with the OpenAI logo and subtitle "Create what you imagine". Hyper-realistic amateur photography, iPhone snapshot quality…

chatgpt-images-quality-2

Một không gian sáng tạo mới

Ngoài việc tạo ảnh bằng cách mô tả những gì bạn muốn thấy trong một tin nhắn, chúng tôi đang giới thiệu một nơi dành riêng cho Ảnh(mở trong cửa sổ mới) trong ChatGPT—có sẵn trong thanh bên thông qua ứng dụng di động và trên chatgpt.com—để làm cho việc khám phá và thử nghiệm hình ảnh nhanh hơn và dễ dàng hơn. Nó bao gồm hàng chục bộ lọc và lời nhắc được cài đặt sẵn để khơi nguồn cảm hứng, được cập nhật thường xuyên để phản ánh các xu hướng mới nổi.

Những nâng cấp này cho phép bạn tạo ra những hình ảnh phù hợp hơn với tầm nhìn của mình, từ những chỉnh sửa nhỏ đến những sự tái hiện hoàn toàn.

Hình ảnh ChatGPT cho công việc

Mô hình này tối ưu hóa quy trình làm việc Business với việc tạo sinh ảnh nhanh hơn, chỉnh sửa chính xác và chi tiết hình ảnh đồng nhất qua các lần lặp lại. Các nhóm có thể khám phá ý tưởng, thực hiện các thay đổi có mục tiêu và hình dung các khái niệm phức tạp hoặc khô khan, hỗ trợ các trường hợp sử dụng trong tiếp thị, thiết kế, thương mại điện tử và truyền thông nội bộ.

Cải tiến và hạn chế

Chúng tôi đã chạy lại nhiều ví dụ từ lần ra mắt tạo sinh ảnh ban đầu của chúng tôi để đánh giá hiệu suất. Mô hình cho thấy sự cải thiện rõ rệt trên nhiều trường hợp, mặc dù kết quả vẫn chưa hoàn hảo. Mặc dù bản phát hành này thể hiện tiến bộ đáng kể, vẫn còn nhiều cơ hội để cải thiện trong các phiên bản tương lai.

Mới

create a poster of deep sea creatures at different depths, with a vertical ocean cutaway, styled in a beautiful japanese detailed anime style

chatgpt-images-output-1

Trước đó

create a poster of deep sea creatures at different depths, with a vertical ocean cutaway, styled in a beautiful japanese detailed anime style

chatgpt-images-output-2

Vẫn còn một số sai sót khoa học, nhưng khoảng 70% là chính xác và đồ họa sống động hơn nhiều, tránh cắt xén sớm.

GPT ảnh 1.5 trong API

gpt-image-1.5 trong API mang lại tất cả các cải tiến tương tự trong ChatGPT ảnh: nó mạnh hơn trong việc bảo tồn và chỉnh sửa ảnh so với GPT Image 1.

Bạn sẽ thấy các logo thương hiệu và hình ảnh chính được giữ lại nhất quán hơn qua các chỉnh sửa—khiến nó phù hợp với công việc tiếp thị và thương hiệu như tạo đồ họa và logo, và cho các nhóm thương mại điện tử tạo ra toàn bộ danh mục ảnh sản phẩm (các biến thể, cảnh và góc độ) từ một ảnh nguồn duy nhất.

Đầu vào và đầu ra ảnh hiện nay rẻ hơn 20% trong GPT Image 1.5 so với GPT Image 1, vì vậy bạn có thể tạo và lặp lại nhiều ảnh hơn với cùng một ngân sách.

Bạn có thể thử mô hình mới trong
OpenAI Playground(mở trong cửa sổ mới) hoặc đọc hướng dẫn lời nhắc(mở trong cửa sổ mới) để lấy cảm hứng.

Các doanh nghiệp và công ty khởi nghiệp trong nhiều ngành, bao gồm công cụ sáng tạo, thương mại điện tử, phần mềm tiếp thị, và nhiều lĩnh vực khác, đã và đang sử dụng GPT ảnh 1.5. Chúng tôi rất hào hứng được chia sẻ một số ví dụ dưới đây.

Mới

chatgpt-images-API-output-1

Trước đó

chatgpt-images-API-output-2

“GPT Ảnh 1.5 tạo ra các ảnh có độ trung thực cao với sự tuân thủ chặt chẽ lời nhắc, bảo toàn bố cục, ánh sáng và chi tiết tinh xảo. Kết quả rõ ràng, thực tế và đáng tin cậy, hỗ trợ quy trình từ ý tưởng đến sản xuất nhanh hơn trên các nền tảng như Wix. Dựa trên thử nghiệm của chúng tôi và các trường hợp sử dụng chính mà chúng tôi thấy tại Wix, sự nhất quán và chất lượng cạnh tranh để biến nó thành một trong những mô hình tạo sinh ảnh hàng đầu hiện nay.

— Hila Gat, Trưởng bộ phận Nghiên cứu AI và Khoa học Dữ liệu tại Wix

Tình trạng khả dụng

ChatGPT Ảnh mới đang được triển khai ngay bây giờ cho tất cả người dùng ChatGPT và người dùng API trên toàn cầu hôm nay trên mọi nền tảng. Nó hoạt động trên các mô hình, vì vậy bạn không cần phải chọn bất cứ điều gì để sử dụng nó.

Chúng tôi tin rằng chúng tôi vẫn đang ở giai đoạn đầu của những gì tạo sinh ảnh có thể cho phép. Bản cập nhật hôm nay là một bước tiến có ý nghĩa với nhiều điều hơn nữa sẽ đến, từ các chỉnh sửa chi tiết hơn đến các kết quả phong phú và chi tiết hơn trên nhiều ngôn ngữ.

Tác giả

OpenAI

Contributors

Project Leadership

Gabriel Goh — Research Lead

Adele Li — Product Lead

Bill Peebles — Sora Lead 

Aditya Ramesh — World Simulation Lead

Mark Chen — Chief Research Officer

Prafulla Dhariwal — Multimodal Lead

Core Team 

Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang

Research Contributors

Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang

Core Inference

Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan

Research Collaborators

Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin

Inference Collaborators

Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng

Data & Evaluation

Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian

Applied

Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li

Safety, Safety Systems, Integrity, Policy & Trust

Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll

Product Operations, Program Management and Governance

Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan

Legal

Ally Bennett, Tony Song, Tyce Walters

Communications, Marketing, Community, Design & Creative

Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman

Special Thanks

Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou

Exec

Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry