Predstavljamo generiranje slika 4o
Otključavamo korisno i vrijedno generiranje slika s nativno multimodalnim modelom sposobnim za precizne, točne i fotorealistične izlaze.
U OpenAI-ju dugo vjerujemo da bi generiranje slika trebalo biti primarna sposobnost naših jezičnih modela. Zato smo u GPT‑4o ugradili naš dosad najnapredniji generator slika. Rezultat – generiranje slika koje nije samo lijepo, već i korisno.
Od prvih špiljskih crteža do modernih infografika, ljudi su koristili vizualne prikaze za komunikaciju, uvjeravanje i analizu – ne samo za ukrašavanje. Današnji generativni modeli mogu dočarati nadrealne, zapanjujuće scene, ali se bore s uobičajenim slikama koje ljudi upotrebljavaju za dijeljenje i davanje informacija. Od logotipa do dijagrama, slike mogu prenijeti precizno značenje kada se nadopune simbolima koji se odnose na zajednički jezik i iskustvo.
Generiranje slika pomoću GPT‑4o ističe se u preciznom prikazivanju teksta, točnom praćenju odzivnika i upotrebi inherentne baze znanja i konteksta čavrljanja GPT‑4o – uključujući transformaciju učitanih slika ili njihovu upotrebu kao vizualne inspiracije. Te mogućnosti olakšavaju točno stvaranje slike koju zamišljate, pomažući vam da učinkovitije komunicirate putem vizualnih elemenata i unaprjeđujući generiranje slika u praktičan, precizan i snažan alat.
Obučili smo naše modele na zajedničkoj distribuciji mrežnih slika i teksta, učeći ne samo kako se slike odnose na jezik, već i kako se odnose jedna na drugu. U kombinaciji s agresivnom naknadnom obukom, rezultirajući model ima iznenađujuću vizualnu fluentnost, sposoban smisliti slike koje su korisne, dosljedne i svjesne konteksta.
Slika vrijedi tisuću riječi, ali ponekad smisliti nekoliko riječi na pravom mjestu može uzdići značenje slike. Sposobnost modela 4o u spajanju preciznih simbola sa slikama pretvara generiranje slika u alat za vizualnu komunikaciju.
Budući da je generiranje slika sada nativno modelu GPT‑4o, možete poboljšati slike kroz prirodan razgovor. GPT‑4o može se nadovezati na slike i tekst u kontekstu čavrljanja, osiguravajući dosljednost tijekom cijelog procesa. Na primjer, u dizajnu lika za videoigru, izgled lika ostaje koherentan kroz više iteracija dok ga usavršavate i eksperimentirate.
Generiranje slika u GPT‑4o slijedi detaljne odzivnike s pažnjom prema detaljima. Dok se drugi sustavi muče s ~ 5 – 8 objekata, GPT‑4o može obraditi do 10 – 20 različitih objekata. Čvršće povezivanje objekata s njihovim osobinama i odnosima omogućuje bolju kontrolu.
GPT‑4o može analizirati i učiti iz slika koje su korisnici učitali, besprijekorno integrirajući njihove detalje u svoj kontekst kako bi informirao generiranje slika.
Izvorno generiranje slika omogućuje 4o povezivanje znanja između teksta i slika, što rezultira modelom koji djeluje pametnije i učinkovitije.
Obuka na slikama koje odražavaju širok raspon stilova omogućuje modelu uvjerljivo stvaranje ili transformaciju slika.
Naš model nije savršen. Svjesni smo višestrukih ograničenja u ovom trenutku koje ćemo nastojati riješiti poboljšanjima modela nakon početnog objavljivanja.

Primijetili smo da GPT‑4o povremeno može preusko obrezati duže slike, poput postera, osobito pri dnu.
U skladu s našim specifikacijama modela, cilj nam je maksimirati kreativnu slobodu podržavajući vrijedne slučajeve upotrebe poput razvoja igara, povijesnog istraživanja i obrazovanja – održavajući visoke sigurnosne standarde. Istovremeno, ostaje jednako važno kao i uvijek blokirati zahtjeve koji krše te standarde. U nastavku su procjene dodatnih rizičnih područja na kojima radimo kako bismo omogućili siguran, visokokvalitetan sadržaj i podržali šire kreativno izražavanje za korisnike.
Podrijetlo putem C2PA i internog reverzibilnog pretraživanja
Sve smišljene slike dolaze s C2PA metapodacima, koji će identificirati sliku kao dolazeću iz GPT‑4o radi osiguranja transparentnosti. Izradili smo i interni alat za pretraživanje koji upotrebljava tehničke atribute generiranja i pomaže u provjeri valjanosti dolaska sadržaja iz našeg modela.
Blokiranje loših stvari
Nastavljamo blokirati zahtjeve za smišljenim slikama koje mogu prekršiti naš pravilnik o sadržaju, kao što su materijali o seksualnom zlostavljanju djece i deepfake seksualni materijali. Kada su slike stvarnih ljudi u kontekstu, imamo pojačana ograničenja u pogledu vrste slika koje se mogu stvoriti, s posebno snažnim zaštitnim mjerama oko golotinje i grafičkog nasilja. Kao i kod svakog lansiranja, sigurnost nikad nije potpuna i predstavlja područje kontinuiranog ulaganja. Kako saznajemo više o stvarnoj upotrebi ovog modela, prilagođavat ćemo svoja pravila.
Za više informacija o našem pristupu, posjetite dodatak za generiranje slika uz sustavnu karticu GPT‑4o.
Upotreba rasuđivanja za pokretanje sigurnosti
Slično našem radu na proizvoljnom usklađivanju, obučili smo LLM za prosuđivanje izravno iz sigurnosnih specifikacija koje su napisali ljudi i koje se mogu protumačiti. Tijekom razvoja koristili smo taj LLM model prosuđivanja kako bismo identificirali i riješili nejasnoće u našim pravilima. Uz naš multimodalni napredak i postojeće sigurnosne tehnike razvijene za modele ChatGPT i Sora, to nam omogućuje moderiranje upisnog teksta i izlaznih slika prema našim pravilima.
Generiranje slika 4o uvodi se danas za korisnike modela Plus, Pro, Team i Free kao zadani generator slika u ChatGPT‑ju, a pristup će uskoro biti dostupan korisnicima modela Enterprise i Edu. Dostupno je i za upotrebu u modelu Sora. Za one koji imaju posebno mjesto u srcu za DALL·E, još uvijek mu se može pristupiti putem namjenskog DALL·E GPT‑ja.
Razvojni inženjeri uskoro će moći smisliti slike uz GPT‑4o putem API-ja, s pristupom koji će se uvesti u sljedećih nekoliko tjedana.
Stvaranje i prilagodba slika jednostavna je čavrljanje putem GPT‑4o – samo opišite što vam treba, uključujući specifičnosti poput omjera slike, točnih boja pomoću heksadecimalnih kodova ili prozirne pozadine. Budući da taj model stvara detaljnije slike, potrebno je više vremena za njihovo renderiranje, često i do jedne minute.
Autor
Vodstvo
Gabriel Goh: generiranje slika
Jackie Shannon: proizvod za model ChatGPT
Mengchao Zhong, Wayne Chang: inženjerstvo za model ChatGPT
Rohan Sahai: proizvod i inženjerstvo za model Sora
Brendan Quinn, Tomer Kaftan: inferencija
Prafulla Dhariwal: multimodalna organizacija
Istraživanje
Osnovna istraživanja
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Temeljno istraživanje
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Istraživački suradnici
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Ponašanje modela
Laurentia Romaniuk
Multimodalna organizacija
Andrew Gibiansky, Yang Lu
Podaci
Voditelji podataka
Gildas Chabot, James Park Lennon
Podaci
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatori
Hazel Byrne, Jennifer Luckenbill, Mariano López
Savjetnici za ljudske podatke
Long Ouyang
Skaliranje
Voditelji inferencije
Brendan Quinn, Tomer Kaftan
Inferencija
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Primijenjeno
Voditeljica proizvoda modela ChatGPT
Jackie Shannon
Voditelji inženjeringa modela ChatGPT
Mengchao Zhong, Wayne Chang
Voditelj dizajna proizvoda
Matt Chan
Znanost o podacima
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Voditelji proizvoda za model Sora
Rohan Sahai, Wesam Manassra
Proizvod i inženjering za model Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Sigurnost
Voditelj sigurnosti
Somay Jain
Sigurnost
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategija
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketing i komunikacije
Voditelji komunikacija i marketinga
Minnia Feng, Natalie Summers, Taya Christianson
Komunikacije
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Dizajn i kreativnost
Voditelji
Kendra Rimbach, Veit Moeller
Dizajn
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Posebne zahvale
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






