Predstavljamo 4o generisanje slika
Otključavanje korisnog i vrijednog generiranja slika s izvorno multimodalnim modelom sposobnim za precizne, tačne, fotorealistične izlaze.
U OpenAI-u, dugo smo vjerovali da generiranje slika treba biti primarna sposobnost naših jezičnih modela. Zato smo u GPT‑4o ugradili naš najnapredniji generator slika do sada. Rezultat—generisanje slika koje nisu samo lijepe, već i korisne.
Od prvih pećinskih crteža do modernih infografika, ljudi su koristili vizualne slike za komunikaciju, uvjeravanje i analizu—ne samo za ukrašavanje. Današnji generativni modeli mogu dočarati nadrealne, zadivljujuće scene, ali se bore s osnovnim slikama koje ljudi koriste za dijeljenje i kreirati informacije. Od logotipa do dijagrama, slike mogu prenijeti precizno značenje kada se dopune simbolima koji se odnose na zajednički jezik i iskustvo.
GPT‑4o generisanje slika se ističe u preciznom prikazivanju teksta, tačnom praćenju upita i korištenju 4o-ove inherentne baze znanja i konteksta chata – uključujući transformaciju otpremljenih slika ili njihovo korištenje kao vizualne inspiracije. Ove mogućnosti olakšavaju kreirati upravo onu sliku koju zamislite, pomažući Vam da efikasnije komunicirate putem vizuala i unapređujući generisanje slika u praktičan alat s preciznošću i snagom.
Obučili smo naše modele na zajedničkoj distribuciji online slika i teksta, učeći ne samo kako se slike odnose prema jeziku, već i kako se međusobno odnose. U kombinaciji s agresivnom post-obukom, rezultirajući model ima iznenađujuću vizualnu fluentnost, sposoban generirati slike koje su korisne, konzistentne i svjesne konteksta.
Slika vrijedi hiljadu riječi, ali ponekad generirati nekoliko riječi na pravom mjestu može uzdići značenje slike. 4o-ova sposobnost da spoji precizne simbole sa slikama pretvara generisanje slika u alat za vizualnu komunikaciju.
Budući da je generisanje slika sada izvorno u GPT‑4o, slike možete poboljšati kroz prirodan razgovor. GPT‑4o može graditi na slikama i tekstu u kontekstu chata, osiguravajući dosljednost kroz cijeli proces. Na primjer, ako dizajnirate karakter iz videoigre, izgled karaktera ostaje dosljedan kroz više iteracija dok usavršavate i eksperimentirate.
Generiranje slika GPT‑4o slijedi detaljne upite s pažnjom na detalje. Dok drugi sistemi imaju problema sa ~5-8 objekata, GPT‑4o može obraditi do 10-20 različitih objekata. Čvršće povezivanje objekata s njihovim osobinama i odnosima omogućava bolju kontrolu.
GPT‑4o može analizirati i učiti iz slika koje su otpremili korisnici, neprimjetno integrirajući njihove detalje u svoj kontekst kako bi informirao generisanje slika.
Izvorno generiranje slika omogućava 4o da uspostavi poveznicu između svog znanja iz teksta i slika, što rezultira modelom koji djeluje pametnije i efikasnije.
Obuka na slikama koje odražavaju širok spektar stilova omogućava modelu da uvjerljivo kreira ili transformiše slike.
Naš model nije savršen. Svjesni smo višestrukih ograničenja u ovom trenutku koje ćemo nastojati riješiti kroz poboljšanja modela nakon početnog lansiranja.

Primijetili smo da GPT‑4o povremeno može preusko izrezati duže slike, poput postera, naročito pri dnu.
U skladu s našim specifikacijama modela, cilj nam je maksimizirati kreativnu slobodu podržavajući vrijedne slučajeve upotrebe poput razvoja igara, istraživanja historije i obrazovanja—dok održavamo visoke sigurnosne standarde. Istovremeno, ostaje jednako važno kao i uvijek blokirati zahtjeve koji prekrše te standarde. U nastavku su procjene dodatnih rizičnih područja u kojima radimo na omogućavanju sigurnog, visoko korisnog sadržaja i podršci širem kreativnom izražavanju za korisnike.
Porijeklo putem C2PA i interne reverzibilne pretrage
Sve generirane slike dolaze s C2PA metadata, koji će identificirati sliku kao da dolazi iz GPT‑4o, radi osiguranja transparentnosti. Također smo izgradili interni alat za pretraživanje koji koristi tehničke atribute generacija kako bi pomogao potvrditi da li sadržaj potiče iz našeg modela.
Blokiranje loših stvari
Nastavljamo blokirati zahtjeve za generirane slike koje mogu prekršiti naše politike sadržaja, kao što su materijali o seksualnom zlostavljanju djece i seksualni deepfakeovi. Kada su slike stvarnih ljudi u kontekstu, imamo pojačana ograničenja u pogledu vrste slika koje se mogu kreirati, s posebno snažnim zaštitnim mjerama oko golotinje i grafičkog nasilja. Kao i kod svakog lansiranja, sigurnost nikad nije završena i predstavlja područje stalnog ulaganja. Kako budemo saznavali više o stvarnoj upotrebi ovog modela, prilagodit ćemo naše politike u skladu s tim.
Za više informacija o našem pristupu, posjetite dodatak o generiranju slika za sistemsku karticu GPT‑4o.
Korištenje rezonovanja za jačanje sigurnosti
Slično našem radu na promišljenom usklađivanju, obučili smo LLM za rezonovanje da radi direktno na osnovu sigurnosnih specifikacija koje su napisali ljudi i koje je moguće interpretirati. Tokom razvoja koristili smo ovaj LLM model rezonovanja kako bismo identificirali i riješili nejasnoće u našim politikama. Zajedno s našim multimodalnim napretkom i postojećim sigurnosnim tehnikama razvijenim za ChatGPT i Sora, ovo nam omogućava da umjereno i unos teksta i izlazne slike u skladu s našim pravilima.
4o generiranje slika počinje danas za korisnike Plus, Pro, Team i Free kao predodređeni generator slika u ChatGPT‑u, a uskoro će biti dostupan i korisnicima Enterprise i Edu. Također je dostupan za korištenje u Sora. Za one koji imaju posebno mjesto u svojim srcima za DALL·E, još uvijek mu se može pristupiti putem namjenskog DALL·E GPT‑a.
Programeri će uskoro moći generirati slike pomoću GPT‑4o putem API-ja, a pristup će biti dostupan u sljedećih nekoliko sedmica.
Kreirati i prilagođavati slike je jednostavno kao chat pomoću GPT‑4o - samo opišite što vam je potrebno, uključujući sve specifičnosti poput omjera stranica, tačnih boja pomoću heksadecimalnih kodova ili prozirne pozadine. Budući da ovaj model kreira detaljnije slike, slikama je potrebno više vremena za renderiranje, često i do jedne minute.
Autor
Liderstvo
Gabriel Goh: Generisanje slika
Jackie Shannon: ChatGPT proizvod
Mengchao Zhong, Wayne Chang: ChatGPT Inženjering
Rohan Sahai: Sora - proizvod i inženjering
Brendan Quinn, Tomer Kaftan: Inferenca
Prafulla Dhariwal: Multimodalna organizacija
Istraživanje
Temeljna istraživanja
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Osnovna istraživanja
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Istraživački saradnici
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Ponašanje modela
Laurentia Romaniuk
Višemodalna organizacija
Andrew Gibiansky, Yang Lu
Podaci
Voditelji za podatke
Gildas Chabot, James Park Lennon
Podaci
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatori
Hazel Byrne, Jennifer Luckenbill, Mariano López
Savjetnici za ljudske podatke
Long Ouyang
Širenje
Vodeći za inferencu
Brendan Quinn, Tomer Kaftan
Inferenca
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Primijenjeno
ChatGPT voditelj proizvoda
Jackie Shannon
ChatGPT inženjerski voditelji
Mengchao Zhong, Wayne Chang
Voditelj dizajna proizvoda
Matt Chan
Nauka o podacima
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Voditelji za Sora proizvod
Rohan Sahai, Wesam Manassra
Sora - proizvod i inženjering
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Sigurnost
Voditelj sigurnosti
Somay Jain
Sigurnost
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategija
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketingi& komunikacije
Voditelji komunikacija i marketinga
Minnia Feng, Natalie Summers, Taya Christianson
Komunikacije
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Dizajn i kreativnost
Voditelji
Kendra Rimbach, Veit Moeller
Dizajn
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Posebna zahvala
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






