Tutvustame 4o pildigenereerimist
Kasuliku ja väärtusliku pildigeneratsiooni avamine looduslikult multimodaalse mudeli abil, mis suudab anda täpseid, korrektseid ja fotorealistlikke väljundeid.
OpenAI-s oleme juba ammu uskunud, et piltide genereerimine peaks olema meie keelemudelite peamine võimekus. Seepärast oleme GPT‑4o‑sse ehitanud oma seni kõige arenenuma pildigeneraatori. Tulemus—piltide genereerimine, mis pole mitte ainult ilus, vaid ka kasulik.
Alates esimestest koopamaalidest kuni tänapäevaste infograafikuteni on inimesed kasutanud visuaalseid kujundeid suhtlemiseks, veenmiseks ja analüüsimiseks – mitte ainult kaunistamiseks. Tänapäeva generatiivsed mudelid võivad esile kutsuda sürrealistlikke, hingematvaid stseene, kuid neil on raskusi igapäevaste kujunditega, mida inimesed kasutavad teabe jagamiseks ja loomiseks. Logodest diagrammideni – pildid võivad edastada täpset tähendust, kui neid täiendada sümbolitega, mis viitavad jagatud keelele ja kogemusele.
GPT‑4o piltide genereerimine paistab silma teksti täpse renderdamise, viipade täpse järgimise ning GPT‑4o loomupärase teadmistebaasi ja vestluskonteksti kasutamisega – sealhulgas üleslaaditud piltide teisendamisel või nende kasutamisel visuaalse inspiratsioonina. Need võimalused muudavad täpselt sellise pildi loomise lihtsamaks, nagu sa ette kujutad, aidates sul visuaalide kaudu tõhusamalt suhelda ja arendades piltide genereerimist praktiliseks tööriistaks, mis on täpne ja võimas.
Me koolitasime oma mudeleid veebipiltide ja tekstide ühise jaotuse alusel, õppides mitte ainult seda, kuidas pildid on keelega seotud, vaid ka seda, kuidas need omavahel seotud on. Koos intensiive järelkoolitusega on saadud mudelil üllatav visuaalne sujuvus, mis on võimeline koostama pilte, mis on kasulikud, järjepidevad ja kontekstitundlikud.
Pilt on väärt tuhat sõna, kuid mõnikord võib mõne sõna õigesse kohta koostamine tõsta pildi tähendust. 4o võime täpseid sümboleid piltidega siduda muudab piltide genereerimise visuaalseks suhtlusvahendiks.
Kuna piltide genereerimine on nüüd GPT‑4o loomulik osa, saad pilte täiustada loomuliku vestluse kaudu. GPT‑4o võib tugineda vestluse kontekstis olevatele piltidele ja tekstile, tagades kogu järjepidevuse. Näiteks kui kujundate videomängu tähemärki, jääb tähemärgi välimus täpsustamise ja katsetamise ajal mitmes iteratsioonis ühtseks.
GPT‑4o piltide genereerimine järgib üksikasjalikke viipide ja pöörab detailidele suurt tähelepanu. Kui teised süsteemid on hädas ~5–8 objektiga, siis GPT‑4o saab hakkama kuni 10–20 erineva objektiga. Objektide tihedam sidumine nende omaduste ja suhetega võimaldab paremat kontrolli.
GPT‑4o saab analüüsida ja õppida kasutaja laetud üles piltidest, integreerides nende üksikasjad sujuvalt oma konteksti, et toetada piltide genereerimist.
Looduslik pildigeneratsioon lubab 4o-l linkida oma teadmine teksti ja piltide vahel, mille tulemuseks on mudel, mis tundub nutikam ja tõhusam.
Erinevaid pildistiile kajastavate piltide alusel toimuv koolitus võimaldab mudelil luua või muuta pilte veenvalt.
Meie mudel ei ole täiuslik. Oleme teadlikud mitmest piirangust, mida hetkel esineb, ja tegeleme nende lahendamisega mudeli täiustamise kaudu pärast esialgset turuletoomist.

Oleme märganud, et GPT‑4o kärbib aeg-ajalt pikemaid pilte, näiteks plakateid, liiga tihedalt, eriti alumise osa lähedal.
Kooskõlas meie mudeli spetsifikatsiooniga püüame maksimeerida loomingulist vabadust, toetades väärtuslikke kasutusjuhtumeid, nagu mängude arendamine, ajaloo uurimine ja haridus, säilitades samal ajal tugevad ohutusstandardid. Samal ajal on sama oluline kui kunagi varem blokeerida taotlused, mis rikuvad neid standardeid. Allpool on hinnangud täiendavatele riskivaldkondadele, kus töötame selle nimel, et lubada turvalist ja kõrge kasutusväärtusega sisu ning pakkuda kasutajate laiemat loomingulist väljendust tugina.
Päritolu C2PA ja sisemise pöörduva otsingu kaudu
Kõigil koostatud piltidel on kaasas C2PA metaandmed, mis tuvastavad pildi GPT‑4o‑st pärinevana, et tagada läbipaistvus. Oleme loonud ka sisemise otsingutööriista, mis kasutab generatsioonide tehnilisi atribuute, et kinnita, kas sisu pärineb meie mudelist.
Halbade asjade blokeerimine
Jätkame koostatud piltide taotluste blokeerimist, mis võivad rikkuda meie sisupõhimõtteid, näiteks laste seksuaalse kuritarvitamise materjalid ja seksuaalsed süvavõltsingud. Kui päris inimeste piltide pildid on kontekstis, kehtestame rangemad piirangud loodavate piltide tüüpidele, eriti rangete kaitsemeetmetega alastuse ja graafilise vägivalla osas. Nagu iga käivitamise puhul, ei ole ohutus kunagi lõppenud ja on pigem pidev investeerimisvaldkond. Kui me selle mudeli tegeliku kasutamise kohta rohkem teada saame, kohandame oma poliitikaid vastavalt.
Lisateabe saamiseks meie lähenemisviisi kohta külastage GPT‑4o süsteemikaardi piltide genereerimise lisandit.
Mõtlemise kasutamine ohutuse tagamiseks
Sarnaselt meie arutlevale joondamise tööle oleme koolitanud arutleva LLM-i töötama otse inimese kirjutatud ja tõlgendatavate ohutusspetsifikatsioonide põhjal. Kasutasime seda arutlusvõimekust LLM-i arendamise ajal, et aidata meil tuvastada ja lahendada ebaselgusi meie põhimõtetes. Koos meie multimodaalsete edusammude ja olemasolevate ChatGPT ja Sora jaoks välja töötatud ohutustehnikatega võimaldab see meil mõõdukas nii sisendteksti kui ka väljundpilte meie põhimõtete alusel.
4. pildi genereerimine jõuab alates tänasest ChatGPT vaikimisi pildigeneraatorina Plus, Pro, Team ja Free kasutajatele, juurdepääs on peagi saadaval Enterprise ja Edu kasutajatele. Seda saab kasutada ka Soras. Neile, kelle südames on DALL·E jaoks eriline koht, pääseb sellele endiselt ligi spetsiaalse DALL·E GPT kaudu.
Arendajad saavad peagi API kaudu GPT‑4o abil pilte koostada, juurdepääs hakkab järgmise paari nädala jooksul laienema.
Piltide loomine ja kohandamine on sama lihtne kui GPT‑4o abil vestlus – kirjelda lihtsalt, mida vajad, sealhulgas eripärad nagu kuvasuhe, täpsed värvid hex-koodidega või läbipaistev taust. Kuna see mudel loob detailsemaid pilte, võtab piltide renderdamine kauem aega, sageli kuni üks minut.
Autor
Juhtimine
Gabriel Goh: pildi genereerimine
Jackie Shannon: ChatGPT toode
Mengchao Zhong, Wayne Chang: ChatGPT inseneritöö
Rohan Sahai: Sora tootejuhtimine ja insenerlus
Brendan Quinn, Tomer Kaftan: tuletamine
Prafulla Dhariwal: multimodaalne organisatsioon
Teadustöö
Alusuuringud
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Põhiuuringud
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Teadustöö panustajad
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Mudeli käitumine
Laurentia Romaniuk
Multimodaalne organisatsioon
Andrew Gibiansky, Yang Lu
Andmed
Andmejuhid
Gildas Chabot, James Park Lennon
Andmed
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderaatorid
Hazel Byrne, Jennifer Luckenbill, Mariano López
Human Data Advisors
Long Ouyang
Skaleerimine
Tuletamise juhid
Brendan Quinn, Tomer Kaftan
Tuletamine
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Kohaldatud
ChatGPT tootejuht
Jackie Shannon
ChatGPT juhtivad insenerid
Mengchao Zhong, Wayne Chang
Tootedisaini juht
Matt Chan
Andmeteadus
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Sora tootejuhid
Rohan Sahai, Wesam Manassra
Sora tootejuhtimine ja insenerlus
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Ohutus
Ohutusjuht
Somay Jain
Ohutus
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strateegia
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Turundus ja kommunikatsioon
Kommunikatsiooni- ja turundusjuhid
Minnia Feng, Natalie Summers, Taya Christianson
Kommunikatsioon
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Disain ja Loovus
Juhid
Kendra Rimbach, Veit Moeller
Disain
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Suur tänu
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






