Prezantojmë gjenerimin e imazhit 4o
Ofrojmë gjenerim të dobishëm dhe të vlefshëm të imazheve me një model me mbështetje të brendshme multimodale, të aftë për rezultate precize, të sakta dhe fotorealiste.
Në OpenAI kemi besuar prej kohësh se gjenerimi i imazheve duhet të jetë një aftësi kryesore e modeleve tona gjuhësore. Prandaj kemi ndërtuar gjeneratorin tonë më të avancuar të imazheve deri më tani në GPT‑4o. Rezultati—i gjenerimit të imazheve që është jo vetëm i bukur, por edhe i dobishëm.
Që nga pikturat e para në shpella e deri te infografikat moderne, njerëzit kanë përdorur imazhe vizuale për të komunikuar, bindur dhe analizuar—jo vetëm për të dekoruar. Modelet e sotme gjeneruese mund të krijojnë skena surreale dhe mahnitëse, por kanë vështirësi me imazhet e zakonshme që njerëzit përdorin për të ndarë dhe krijuar informacion. Nga logot te diagramet, imazhet mund të përcjellin kuptim të saktë kur plotësohen me simbole që i referohen gjuhës dhe përvojës së përbashkët.
Gjenerimi i imazheve GPT‑4o shkëlqen në paraqitjen e saktë të tekstit, ndjekjen e saktë të kërkesave dhe shfrytëzimin e bazës së njohurive të 4o dhe kontekstit të bisedës, duke përfshirë transformimin e imazheve të ngarkuara ose përdorimin e tyre si frymëzim vizual. Këto aftësi e bëjnë më të lehtë krijimin e imazhit që imagjinon, duke të ndihmuar të komunikosh më efektivisht përmes pamjeve vizuale dhe duke avancuar gjenerimin e imazhit në një mjet praktik me saktësi dhe fuqi.
Ne trajnuam modelet tona mbi shpërndarjen e përbashkët të imazheve dhe tekstit online, duke mësuar jo vetëm se si imazhet lidhen me gjuhën, por edhe se si lidhen me njëra-tjetrën. I kombinuar me post-trajnim agresiv, modeli që rezulton ka një rrjedhshmëri vizuale befasuese, i aftë të përftojë imazhe që janë të dobishme, të qëndrueshme dhe të vetëdijshme për kontekstin.
Një fotografi vlen sa njëmijë fjalë, por ndonjëherë gjenerimi i disa fjalëve në vendin e duhur mund të ngrejë kuptimin e një imazhi. Aftësia e 4o për të kombinuar simbole të sakta me imazhe e shndërron gjenerimin e imazheve në një mjet për komunikim vizual.
Për shkak se gjenerimi i imazheve tani është i integruar në GPT‑4o, mund të përmirësosh imazhet përmes bisedës natyrore. GPT‑4o mund të ndërtojë mbi imazhe dhe tekst në kontekstin e bisedës, duke siguruar qëndrueshmëri gjatë gjithë kohës. Për shembull, nëse po dizenjon një karakter video-loje, pamja e karakterit mbetet koherente në përsëritje të shumta ndërsa e përmirëson dhe eksperimenton.
Gjenerimi i imazheve të GPT‑4o ndjek kërkesa të hollësishme me kujdes ndaj detajeve. Ndërsa sistemet e tjera kanë vështirësi me ~5-8 objekte, GPT‑4o mund të trajtojë deri në 10-20 objekte të ndryshme. Lidhja më e ngushtë e objekteve me tiparet dhe marrëdhëniet e tyre mundëson një kontroll më të mirë.
GPT‑4o mund të analizojë dhe mësojë nga imazhet e ngarkuara nga përdoruesit, duke integruar pa probleme detajet e tyre në kontekstin e vet për të informuar gjenerimin e imazheve.
Gjenerimi i imazheve native aktivizon 4o të bëjë lidhje midis njohurive të tij dhe imazheve, duke rezultuar në një model që duket më i zgjuar dhe më efikas.
Trajnim për imazhet që pasqyrojnë një shumëllojshmëri të madhe stilesh imazhi i mundëson modelit të krijojë ose transformojë imazhe në mënyrë bindëse.
Modeli ynë nuk është i përsosur. Jemi të vetëdijshëm për kufizime të shumta për momentin, të cilat do të punojmë për t'i adresuar përmes përmirësimeve të modelit pas prezantimit fillestar.

Kemi vënë re se GPT‑4o ndonjëherë mund të presë imazhe më të gjata, si posterat, shumë ngushtë, veçanërisht afër pjesës së poshtme.
Në përputhje me specifikimet tona të modelit, synojmë të maksimizojmë lirinë krijuese duke mbështetur raste të vlefshme përdorimi si zhvillimi i lojërave, eksplorimi historik dhe edukimi—duke ruajtur standarde të forta sigurie. Në të njëjtën kohë, mbetet po aq e rëndësishme sa gjithmonë të bllokohen kërkesat që shkelin ato standarde. Më poshtë janë vlerësimet e fushave shtesë të rrezikut ku po punojmë për të aktivizuar përmbajtje të sigurt, me përdorim të lartë dhe për të mbështetur shprehjen më të gjerë krijuese për përdoruesit.
Origjina përmes C2PA dhe kërkimit të brendshëm të kthyeshëm
Të gjitha imazhet e gjeneruara vijnë me të dhënat meta C2PA, të cilat do të identifikojnë një imazh si të ardhur nga GPT‑4o, për të ofruar transparencë. Ne gjithashtu kemi ndërtuar një mjet kërkimi të brendshëm që përdor atributet teknike të gjeneratave për të ndihmuar në verifikimin nëse përmbajtja ka ardhur nga modeli ynë.
Bllokimi i gjërave të këqija
Ne vazhdojmë të bllokojmë kërkesat për imazhe të gjeneruara që mund të shkelin politikat tona të përmbajtjes, si materialet e abuzimit seksual të fëmijëve dhe falsifikimet e mëdha me natyrë seksuale. Kur imazhet e njerëzve të vërtetë janë në kontekst, kemi kufizime të shtuara për llojin e imazheve që mund të krijohen, me mbrojtje veçanërisht të forta për lakuriqësinë dhe dhunën grafike. Ashtu si çdo fillim, siguria nuk përfundon kurrë dhe është më tepër një fushë investimi e vazhdueshme. Ndërsa mësojmë më shumë rreth përdorimit të këtij modeli në botën reale, do t'i përshtatim politikat tona në përputhje me rrethanat.
Për më shumë mbi qasjen tonë, vizitoni shtojcën e gjenerimit të imazheve në kartën e sistemit GPT‑4o.
Përdorimi i arsyetimit për të fuqizuar sigurinë
Ngjashëm me punën tonë të përputhjes reflektuese, kemi trajnuar një LLM arsyetimi për të punuar drejtpërdrejt nga specifikimet e sigurisë të shkruara nga njerëzit dhe të interpretuara lehtësisht. Ne e përdorëm këtë LLM për arsyetim gjatë zhvillimit, për të na ndihmuar të identifikojmë dhe të zgjidhim paqartësitë në politikat tona. Së bashku me përparimet tona multimodale dhe teknikat ekzistuese të sigurisë të zhvilluara për ChatGPT dhe Sora, kjo na lejon të moderojmë si tekstin hyrës ashtu edhe imazhet dalëse kundrejt politikave tona.
Gjenerimi i imazheve 4o fillon të shpërndahet sot për përdoruesit Plus, Pro, Team dhe Free si gjeneratori i parazgjedhur i imazheve në ChatGPT, me qasje që do të vijë së shpejti për Enterprise dhe Edu. Është gjithashtu e disponueshme për t'u përdorur në Sora. Për ata që kanë një vend të veçantë në zemrat e tyre për DALL·E, mund të aksesohet ende përmes një DALL·E GPT të dedikuar.
Zhvilluesit së shpejti do të jenë në gjendje të gjenerojnë imazhe me GPT‑4o përmes API-së, me qasje që do të shpërndahet në javët para.
Krijimi dhe personalizimi i imazheve është po aq i thjeshtë sa të përdorësh bisedë duke përdorur GPT‑4o - thjesht përshkruaj atë që të nevojitet, duke përfshirë çdo specifikë si raporti i pamjes, ngjyrat e sakta duke përdorur kode hekzadecimale ose një sfond transparent. Për shkak se ky model krijon imazhe më të detajuara, imazhet marrin më shumë kohë për t'u renderuar, shpesh deri në një minutë.
Autor
Drejtimi
Gabriel Goh: Gjenerimi i imazhit
Jackie Shannon: Produkti ChatGPT
Mengchao Zhong, Wayne Chang: Inxhinieria e ChatGPT
Rohan Sahai: Produkti dhe inxhinieria e Sora
Brendan Quinn, Tomer Kaftan: Inferencë
Prafulla Dhariwal: Organizata multimodale
Kërkime
Kërkimi themelor
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Kërkimi bazë
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Kontribuesit e kërkimit
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Sjellja e modelit
Laurentia Romaniuk
Organizata multimodale
Andrew Gibiansky, Yang Lu
Të dhënat
Drejtuesit e të dhënave
Gildas Chabot, James Park Lennon
Të dhënat
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderatorë
Hazel Byrne, Jennifer Luckenbill, Mariano López
Këshilltarë për të dhënat njerëzore
Long Ouyang
Shkallëzimi
Drejtuesit e inferencës
Brendan Quinn, Tomer Kaftan
Inferencë
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Aplikuar
Drejtues produkti i ChatGPT
Jackie Shannon
Drejtues inxhinierikë të ChatGPT
Mengchao Zhong, Wayne Chang
Drejtues i Dizajnit të Produktit
Matt Chan
Shkencë të dhënash
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Drejtues produkti Sora
Rohan Sahai, Wesam Manassra
Produkti dhe inxhinieria Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Siguria në përdorim
Drejtues për sigurinë
Somay Jain
Siguria në përdorim
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strategji
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketing dhe Komunikime
Drejtues të Komunikimit dhe Marketingut
Minnia Feng, Natalie Summers, Taya Christianson
Komunikime
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Dizajn & Krijimtari
Drejtues
Kendra Rimbach, Veit Moeller
Dizajn
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Falënderime të veçanta
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






