Giới thiệu tính năng Tạo sinh ảnh 4o
Mở khóa khả năng tạo sinh ảnh hữu ích và có giá trị với một mô hình đa phương thức tự nhiên có khả năng tạo ra kết quả chính xác, chi tiết và chân thực như ảnh chụp.
Tại OpenAI, từ lâu chúng tôi tin rằng tạo sinh ảnh nên là một khả năng chính trong các mô hình ngôn ngữ của chúng tôi. Đó là lý do tại sao chúng tôi đã tích hợp trình tạo hình ảnh tiên tiến nhất của mình vào GPT‑4o. Kết quả là—tạo sinh ảnh không chỉ đẹp mà còn hữu ích.
Từ những bức tranh hang động đầu tiên đến các đồ họa thông tin hiện đại, con người đã sử dụng hình ảnh trực quan để giao tiếp, thuyết phục và phân tích—không chỉ để trang trí. Các mô hình tạo sinh ngày nay có thể tạo ra những cảnh tượng siêu thực, ngoạn mục, nhưng lại gặp khó khăn với những hình ảnh thông dụng mà con người sử dụng để chia sẻ và tạo thông tin. Từ logo đến sơ đồ, hình ảnh có thể truyền tải ý nghĩa chính xác khi được bổ sung với các biểu tượng liên quan đến ngôn ngữ và trải nghiệm chung.
Tính năng tạo sinh ảnh của GPT‑4o xuất sắc trong việc tái hiện chính xác văn bản, tuân thủ chặt chẽ các lời nhắc, và tận dụng cơ sở kiến thức cùng ngữ cảnh trò chuyện vốn có của 4o—bao gồm cả việc biến đổi các hình ảnh đã tải lên hoặc sử dụng chúng làm nguồn cảm hứng hình ảnh. Những khả năng này giúp dễ dàng hơn trong việc tạo ra chính xác hình ảnh mà bạn hình dung, giúp bạn giao tiếp hiệu quả hơn qua hình ảnh và đưa việc tạo sinh ảnh trở thành một công cụ thực tiễn với độ chính xác và mạnh mẽ.
Chúng tôi huấn luyện các mô hình của mình trên phân bố kết hợp giữa hình ảnh và văn bản trực tuyến, học không chỉ cách các hình ảnh liên quan đến ngôn ngữ, mà còn cách chúng liên quan đến nhau. Kết hợp với quá trình huấn luyện bổ sung mạnh mẽ, mô hình kết quả có độ lưu loát thị giác đáng ngạc nhiên, có khả năng tạo ra những hình ảnh hữu ích, nhất quán và nhận biết ngữ cảnh.
Một bức tranh đáng giá ngàn lời nói, nhưng đôi khi việc tạo ra vài từ đúng chỗ có thể nâng cao ý nghĩa của một bức ảnh. Khả năng của 4o trong việc kết hợp các ký hiệu chính xác với hình ảnh biến việc tạo sinh ảnh thành một công cụ giao tiếp trực quan.
Vì tạo sinh ảnh hiện đã được tích hợp vào GPT‑4o, bạn có thể tinh chỉnh ảnh thông qua trò chuyện tự nhiên. GPT‑4o có thể xây dựng dựa trên ảnh và văn bản trong ngữ cảnh chat, đảm bảo tính nhất quán xuyên suốt. Ví dụ, nếu bạn đang thiết kế một ký tự trong trò chơi điện tử, ngoại hình của ký tự sẽ vẫn nhất quán qua nhiều lần lặp lại khi bạn tinh chỉnh và thử nghiệm.
Việc tạo sinh ảnh của GPT‑4o tuân theo các lời nhắc chi tiết với sự chú ý đến từng chi tiết. Trong khi các hệ thống khác gặp khó khăn với khoảng 5-8 đối tượng, GPT‑4o có thể xử lý lên đến 10-20 đối tượng khác nhau. Việc liên kết chặt chẽ hơn giữa các đối tượng với các thuộc tính và mối quan hệ của chúng cho phép kiểm soát tốt hơn.
GPT‑4o có thể phân tích và học hỏi từ các hình ảnh do người dùng tải lên, tích hợp liền mạch các chi tiết của chúng vào ngữ cảnh để hỗ trợ việc tạo sinh ảnh.
Tính năng tạo sinh ảnh gốc cho phép 4o liên kết kiến thức giữa văn bản và hình ảnh, tạo ra một mô hình có vẻ thông minh hơn và hiệu quả hơn.
Việc huấn luyện trên các hình ảnh phản ánh nhiều phong cách hình ảnh khác nhau cho phép mô hình tạo hoặc chuyển đổi hình ảnh một cách thuyết phục.
Mô hình của chúng tôi không hoàn hảo. Chúng tôi nhận thức được nhiều hạn chế hiện tại mà chúng tôi sẽ làm việc để khắc phục thông qua việc cải thiện mô hình sau khi ra mắt ban đầu.

Chúng tôi nhận thấy GPT‑4o đôi khi có thể cắt ảnh dài hơn, như áp phích, quá chặt, đặc biệt là gần phía dưới.
Trên cơ sở tuân theo Đặc tả mô hình của chúng tôi, chúng tôi hướng tới việc tối đa hóa sự tự do sáng tạo bằng cách hỗ trợ các trường hợp sử dụng có giá trị như phát triển trò chơi, khám phá lịch sử và giáo dục—mà vẫn duy trì các tiêu chuẩn an toàn nghiêm ngặt. Đồng thời, việc ngăn chặn các yêu cầu vi phạm các tiêu chuẩn này vẫn là ưu tiên hàng đầu. Dưới đây là các đánh giá về các lĩnh vực rủi ro bổ sung mà chúng tôi đang làm việc để cho phép nội dung an toàn, có tính ứng dụng cao và hỗ trợ biểu đạt sáng tạo rộng rãi hơn cho người dùng.
Khả năng truy nguyên qua C2PA và tìm kiếm đảo ngược nội bộ
Tất cả các hình ảnh được tạo ra đều đi kèm với siêu dữ liệu C2PA, giúp xác định hình ảnh là từ GPT‑4o, nhằm cung cấp sự minh bạch. Chúng tôi cũng đã phát triển một công cụ tìm kiếm nội bộ sử dụng các thuộc tính kỹ thuật của các thế hệ để hỗ trợ xác minh xem nội dung có xuất phát từ mô hình của chúng tôi hay không.
Chặn nội dung xấu
Chúng tôi đang tiếp tục chặn các yêu cầu tạo ảnh có thể vi phạm chính sách nội dung của chúng tôi, chẳng hạn như tài liệu lạm dụng tình dục trẻ em và deepfake tình dục. Khi hình ảnh của người thật nằm trong ngữ cảnh, chúng tôi áp dụng các hạn chế nghiêm ngặt hơn về loại hình ảnh có thể được tạo ra, với các biện pháp bảo vệ đặc biệt mạnh mẽ đối với khỏa thân và bạo lực đồ họa. Giống như bất kỳ lần ra mắt nào, an toàn không bao giờ hoàn tất mà là một lĩnh vực đầu tư liên tục. Khi chúng tôi tìm hiểu thêm về việc sử dụng thực tế của mô hình này, chúng tôi sẽ điều chỉnh các chính sách của mình cho phù hợp.
Để biết thêm về phương pháp của chúng tôi, hãy truy cập phụ lục của thẻ hệ thống GPT‑4o về tạo sinh ảnh.
Sử dụng khả năng lập luận để tăng cường an toàn
Tương tự như công việc điều chỉnh có suy xét của chúng tôi, chúng tôi đã huấn luyện một mô hình ngôn ngữ lớn (LLM) biết lập luận để làm việc trực tiếp từ các đặc tả an toàn do con người viết và có thể diễn giải. Chúng tôi đã sử dụng mô hình ngôn ngữ lớn (LLM) biết lập luận này trong quá trình phát triển để giúp chúng tôi xác định và giải quyết những điểm mơ hồ trong các chính sách của mình. Cùng với những tiến bộ đa phương thức và các kỹ thuật an toàn hiện có được phát triển cho ChatGPT và Sora, điều này cho phép chúng tôi kiểm duyệt cả văn bản đầu vào và hình ảnh đầu ra theo các chính sách của chúng tôi.
4o image generation rolls out starting today to Plus, Pro, Team, and Free users as the default image generator in ChatGPT, with access coming soon to Enterprise and Edu. It’s also available to use in Sora. For those who hold a special place in their hearts for DALL·E, it can still be accessed through a dedicated DALL·E GPT.
Developers will soon be able to generate images with GPT‑4o via the API, with access rolling out in the next few weeks.
Creating and customizing images is as simple as chatting using GPT‑4o - just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. Because this model creates more detailed pictures, images take longer to render, often up to one minute.
Tác giả
Lãnh đạo
Gabriel Goh: Tạo sinh ảnh
Jackie Shannon: Sản phẩm ChatGPT
Mengchao Zhong, Wayne Chang: Kỹ thuật ChatGPT
Rohan Sahai: Sản phẩm và Kỹ thuật Sora
Brendan Quinn, Tomer Kaftan: Suy luận
Prafulla Dhariwal: Tổ chức Đa phương thức
Nghiên cứu
Nghiên cứu Nền tảng
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Nghiên cứu Cốt lõi
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Người đóng góp nghiên cứu
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Hành vi Mô hình
Laurentia Romaniuk
Tổ chức Đa phương thức
Andrew Gibiansky, Yang Lu
Dữ liệu
Trưởng nhóm Dữ liệu
Gildas Chabot, James Park Lennon
Dữ liệu
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Người điều hành
Hazel Byrne, Jennifer Luckenbill, Mariano López
Human Data Advisors
Long Ouyang
Mở rộng quy mô
Trưởng nhóm Suy luận
Brendan Quinn, Tomer Kaftan
Suy luận
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Ứng dụng
Trưởng nhóm Sản phẩm ChatGPT
Jackie Shannon
Trưởng nhóm Kỹ thuật ChatGPT
Mengchao Zhong, Wayne Chang
Trưởng nhóm Thiết kế Sản phẩm
Matt Chan
Khoa học Dữ liệu
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora Product Leads
Rohan Sahai, Wesam Manassra
Sản phẩm và Kỹ thuật Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
An toàn
Trưởng nhóm An toàn
Somay Jain
An toàn
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Chiến lược
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Tiếp thị & Truyền thông
Trưởng nhóm Truyền thông và Tiếp thị
Minnia Feng, Natalie Summers, Taya Christianson
Truyền thông
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Thiết kế & Sáng tạo
Trưởng nhóm
Kendra Rimbach, Veit Moeller
Thiết kế
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Lời cảm ơn đặc biệt
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






