Prezentăm generarea de imagini 4o
Deblocarea generării de imagini utile și valoroase cu un model nativ multimodal capabil de ieșiri precise, exacte și fotorealiste.
La OpenAI, am crezut de mult timp că generarea de imagini ar trebui să fie o capacitate principală a modelelor noastre lingvistice. De aceea, am integrat în GPT‑4o cel mai avansat generator de imagini de până acum. Rezultatul — generarea de imagini care nu este doar frumoasă, ci și utilă.
De la primele picturi rupestre până la infograficele moderne, oamenii au folosit imagini vizuale pentru a comunica, a convinge și a analiza - nu doar pentru a decora. Modelele generative de astăzi pot evoca scene suprarealiste, uluitoare, dar întâmpină dificultăți cu imaginile de bază pe care oamenii le folosesc pentru a partaja și a crea informații. De la logo-uri la diagrame, imaginile pot transmite un sens precis atunci când sunt îmbogățite cu simboluri care fac referire la un limbaj și o experiență comune.
Generarea de imagini GPT‑4o excelează la redarea precisă a textului, urmărirea exactă a solicitărilor și valorificarea bazei de cunoștințe intrinsece a 4o și a contextului din discuție – inclusiv transformarea imaginilor încărcate sau utilizarea lor ca inspirație vizuală. Aceste capabilități facilitează crearea exactă a imaginii pe care ți-o imaginezi, ajutându-te să comunici mai eficient prin imagini și să transformi generarea de imagini într-un instrument practic cu precizie și putere.
Am antrenat modelele noastre pe distribuția comună a imaginilor și textului online, învățând nu doar cum se raportează imaginile la limbaj, ci și cum se raportează între ele. Combinat cu un antrenament post-instruire agresiv, modelul rezultat are o fluență vizuală surprinzătoare, capabil să genereze imagini utile, consecvente și conștiente de context.
O imagine valorează o mie de cuvinte, dar uneori generarea câtorva cuvinte în locul potrivit poate amplifica semnificația unei imagini. Capacitatea 4o de a îmbina simboluri precise cu imagini transformă generarea de imagini într-un instrument de comunicare vizuală.
Deoarece generarea de imagini este acum nativă în GPT‑4o, poți rafina imaginile prin conversație naturală. GPT‑4o poate construi pe baza imaginilor și textului în contextul discuției, asigurând consecvența pe tot parcursul. De exemplu, dacă proiectezi un caracter pentru un joc video, aspectul caracterului rămâne coerent de-a lungul mai multor iterații, pe măsură ce îl rafinezi și experimentezi cu el.
Generarea de imagini de către GPT‑4o urmează solicitări detaliate, acordând atenție detaliilor. În timp ce alte sisteme întâmpină dificultăți cu aproximativ 5-8 obiecte, GPT‑4o poate gestiona până la 10-20 de obiecte diferite. Legarea mai strânsă a obiectelor de trăsăturile și relațiile lor permite un control mai bun.
GPT‑4o poate analiza și învăța din imaginile încărcate de utilizatori, integrând fără probleme detaliile acestora în contextul său pentru a sprijini generarea imaginilor.
Generarea de imagini native activează 4o să facă legătura între cunoștințele sale și imagini, rezultând un model care pare mai inteligent și mai eficient.
Instruirea pe imagini care reflectă o varietate vastă de stiluri de imagine permite modelului să creeze sau să transforme imagini convingător.
Modelul nostru nu este perfect. Suntem conștienți de mai multe limitări în acest moment, pe care le vom aborda prin îmbunătățiri ale modelului după lansarea inițială.

Am observat că GPT‑4o poate decupa uneori imagini mai lungi, cum ar fi posterele, prea strâns, în special în partea de jos.
În conformitate cu Specificațiile Modelului nostru, ne propunem să maximizăm libertatea creativă prin susținerea unor cazuri de utilizare valoroase precum dezvoltarea de jocuri, explorarea istorică și educația, menținând în același timp standarde stricte de siguranță. În același timp, rămâne la fel de important ca întotdeauna să blocăm cererile care încalcă acele standarde. Mai jos sunt evaluările unor domenii de risc suplimentare în care lucrăm pentru a activa conținut sigur și de înaltă utilitate și pentru a accepta o exprimare creativă mai largă pentru utilizatori.
Proveniență prin C2PA și căutare internă reversibilă
Toate imaginile generate sunt însoțite de metadate C2PA, care vor identifica o imagine ca provenind din GPT‑4o, pentru a asigura transparență. Am construit și un instrument intern de căutare care folosește atribute tehnice ale generărilor pentru a verifica dacă un conținut provine din modelul nostru.
Blocarea lucrurilor rele
Continuăm să blocăm solicitările de imagini generate care pot încălca politicile noastre privind conținutul, cum ar fi materialele de abuz sexual asupra copiilor și deepfake-urile sexuale. Când imaginile cu persoane reale sunt în context, avem restricții sporite cu privire la tipul de imagini care pot fi create, cu măsuri de protecție deosebit de robuste în jurul nudității și violenței grafice. Ca în cazul oricărei lansări, siguranța nu se termină niciodată și este mai degrabă un domeniu de investiții continue. Pe măsură ce aflăm mai multe despre utilizarea acestui model în lumea reală, vom ajusta politicile noastre în consecință.
Pentru mai multe informații despre abordarea noastră, vizitează anexa la cardul de sistem GPT‑4o pentru generarea de imagini.
Folosirea raționamentului pentru a îmbunătăți siguranța
Similar cu munca noastră de aliniere deliberativă, am antrenat un LLM de raționament să lucreze direct pe baza specificațiilor de siguranță scrise și ușor de înțeles de către oameni. Am folosit acest model de raționament LLM în timpul dezvoltării pentru a ne ajuta să identificăm și să rezolvăm ambiguitățile din politicile noastre. Împreună cu progresele noastre multimodale și tehnicile de siguranță existente dezvoltate pentru ChatGPT și Sora, acest lucru ne permite să moderăm atât textul de intrare, cât și imaginile de ieșire conform politicilor noastre.
Generarea de imagini 4o se lansează de astăzi pentru utilizatorii Plus, Pro, Team și Free ca generator de imagini implicit în ChatGPT, cu acces disponibil în curând pentru Enterprise și Edu. Este disponibil și pentru utilizare în Sora. Pentru cei care au un loc special în inimile lor pentru DALL·E, acesta poate fi accesat în continuare printr-un DALL·E GPT dedicat.
Dezvoltatorii vor putea în curând să genereze imagini cu GPT‑4o prin API, accesul urmând să fie disponibil în săptămânile următoare.
Crearea și personalizarea imaginilor este la fel de simplă ca o discuție folosind GPT‑4o - trebuie doar să descrii de ce ai nevoie, inclusiv orice specific, cum ar fi raportul de aspect, culorile exacte folosind coduri hexadecimale sau un fundal transparent. Pentru că acest model creează imagini mai detaliate, redarea acestora durează mai mult, adesea până la un minut.
Autor
Conducere
Gabriel Goh: Generare de imagini
Jackie Shannon: Produs ChatGPT
Mengchao Zhong, Wayne Chang: Inginerie ChatGPT
Rohan Sahai: Produs și inginerie Sora
Brendan Quinn, Tomer Kaftan: Inferență
Prafulla Dhariwal: Organizare multimodală
Cercetare
Cercetare fundamente
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Cercetare de bază
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Contribuitori cercetare
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Comportament model
Laurentia Romaniuk
Organizare multimodală
Andrew Gibiansky, Yang Lu
Date
Lideri date
Gildas Chabot, James Park Lennon
Date
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatori
Hazel Byrne, Jennifer Luckenbill, Mariano López
Consultanți date umane
Long Ouyang
Scalare
Lideri inferență
Brendan Quinn, Tomer Kaftan
Inferență
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Aplicat
Lider produs ChatGPT
Jackie Shannon
Lideri inginerie ChatGPT
Mengchao Zhong, Wayne Chang
Lider design produs
Matt Chan
Știință date
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Lideri produse Sora
Rohan Sahai, Wesam Manassra
Produs și inginerie Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Siguranță
Lider siguranță
Somay Jain
Siguranță
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategie
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketing & comunicații
Lideri comunicare și marketing
Minnia Feng, Natalie Summers, Taya Christianson
Comunicații
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Design & creativ
Lideri
Kendra Rimbach, Veit Moeller
Design
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Mulțumiri speciale
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






