Introduzzjoni għal Ġenerazzjoni tal-Immaġnijiet 4o
Niftħu l-bieb għal ġenerazzjoni ta’ immaġnijiet utli u ta’ valur b’mudell multimodali nattiv kapaċi jagħti outputs preċiżi, eżatti u fotorealistiċi.
F’OpenAI, ilna nemmnu li l-ġenerazzjoni tal-immaġnijiet għandha tkun kapaċità primarja tal-mudelli tal-lingwa tagħna. Għalhekk bnejna l-aktar ġeneratur tal-immaġnijiet avvanzat tagħna s’issa ġewwa GPT‑4o. Ir-riżultat—ġenerazzjoni tal-immaġnijiet li mhijiex biss sabiħa, iżda utli.
Mill-ewwel pitturi tal-għerien sal-infografiċi moderni, il-bnedmin użaw xbihat viżwali biex jikkomunikaw, jipperswadu u janalizzaw—mhux biss biex iżejnu. Il-mudelli ġenerattivi tal-lum jistgħu joħolqu xeni surreali u tal-għaġeb, iżda jsibu diffikultà bix-xbihat prattiċi li n-nies jużaw biex jaqsmu u joħolqu l-informazzjoni. Mil-logos sad-dijagrammi, l-immaġnijiet jistgħu jwasslu tifsira preċiża meta jiġu msaħħa b’simboli li jirreferu għal lingwa u esperjenza komuni.
Il-ġenerazzjoni tal-immaġnijiet GPT‑4o tispikka fir-rendering eżatt tat-test, fis-segwitu preċiż tal-prompts, u fl-użu tal-bażi ta’ għarfien inerenti ta’ 4o u tal-kuntest taċ-chat—inkluż it-trasformar ta’ immaġnijiet imtellgħin jew l-użu tagħhom bħala ispirazzjoni viżwali. Dawn il-kapaċitajiet jagħmluha aktar faċli li toħloq eżatt l-immaġni li timmaġina, jgħinuk tikkomunika b’mod aktar effettiv permezz tal-viżwali u javvanzaw il-ġenerazzjoni tal-immaġnijiet f’għodda prattika bi preċiżjoni u qawwa.
Ħarriġna l-mudelli tagħna fuq id-distribuzzjoni konġunta ta’ immaġnijiet u test online, u tgħallmu mhux biss kif l-immaġnijiet jirrelataw mal-lingwa, iżda kif jirrelataw ma’ xulxin. Flimkien ma’ post-training aggressiv, il-mudell li jirriżulta għandu fluwidità viżwali sorprendenti, kapaċi jiġġenera immaġnijiet li huma utli, konsistenti u konxji mill-kuntest.
Stampa tiswa elf kelma, iżda xi drabi l-ġenerazzjoni ta’ ftit kliem fil-post it-tajjeb tista’ tgħolli t-tifsira ta’ immaġni. Il-kapaċità ta’ 4o li jgħaqqad simboli preċiżi ma’ xbihat tbiddel il-ġenerazzjoni tal-immaġnijiet f’għodda għall-komunikazzjoni viżwali.
Minħabba li l-ġenerazzjoni tal-immaġnijiet issa hija nattiva għal GPT‑4o, tista’ tirfina l-immaġnijiet permezz ta’ konversazzjoni naturali. GPT‑4o jista’ jibni fuq immaġnijiet u test fil-kuntest taċ-chat, u jiżgura konsistenza tul il-proċess kollu. Pereżempju, jekk qed tiddisinja karattru għal video game, id-dehra tal-karattru tibqa’ koerenti matul iterazzjonijiet multipli hekk kif tirfina u tesperimenta.
Il-ġenerazzjoni tal-immaġnijiet ta’ GPT‑4o ssegwi prompts dettaljati b’attenzjoni għad-dettall. Filwaqt li sistemi oħra jsibu diffikultà b’madwar 5-8 oġġetti, GPT‑4o jista’ jimmaniġġja sa 10-20 oġġett differenti. Ir-rabta aktar stretta bejn l-oġġetti u l-karatteristiċi u r-relazzjonijiet tagħhom tippermetti kontroll aħjar.
GPT‑4o jista’ janalizza u jitgħallem minn immaġnijiet imtellgħin mill-utenti, billi jintegra bla xkiel id-dettalji tagħhom fil-kuntest tiegħu biex jinforma l-ġenerazzjoni tal-immaġnijiet.
Il-ġenerazzjoni nattiva tal-immaġnijiet tippermetti lil 4o jorbot l-għarfien tiegħu bejn it-test u l-immaġnijiet, u dan iwassal għal mudell li jidher aktar intelliġenti u aktar effiċjenti.
It-taħriġ fuq immaġnijiet li jirriflettu varjetà kbira ta’ stili ta’ immaġni jippermetti lill-mudell joħloq jew jittrasforma immaġnijiet b’mod konvinċenti.
Il-mudell tagħna mhuwiex perfett. Aħna konxji minn bosta limitazzjonijiet bħalissa li se naħdmu biex nindirizzawhom permezz ta’ titjib fil-mudell wara t-tnedija inizjali.

Innutajna li GPT‑4o xi kultant jista’ jaqta’ wisq mill-qrib immaġnijiet itwal, bħal posters, speċjalment lejn in-naħa t’isfel.
F’konformità mal-ispeċifikazzjoni tal-mudell tagħna, aħna nimmiraw li nimmassimizzaw il-libertà kreattiva billi nappoġġjaw każijiet ta’ użu ta’ valur bħall-iżvilupp tal-logħob, l-esplorazzjoni storika u l-edukazzjoni—filwaqt li nżommu standards qawwija ta’ sigurtà. Fl-istess ħin, jibqa’ importanti daqs qatt qabel li nimblukkaw talbiet li jiksru dawk l-istandards. Hawn taħt hemm evalwazzjonijiet ta’ oqsma addizzjonali ta’ riskju fejn qed naħdmu biex nippermettu kontenut sigur u ta’ utilità għolja u nappoġġjaw espressjoni kreattiva usa’ għall-utenti.
Provenjenza permezz ta’ C2PA u tfittxija interna riversibbli
L-immaġnijiet iġġenerati kollha jiġu b’metadata C2PA, li tidentifika immaġni bħala li ġejja minn GPT‑4o, biex tipprovdi trasparenza. Bnejna wkoll għodda interna ta’ tfittxija li tuża attributi tekniċi tal-ġenerazzjonijiet biex tgħin tivverifika jekk il-kontenut ġiex mill-mudell tagħna.
Nibblukkaw l-affarijiet ħżiena
Qed inkomplu nimblukkaw talbiet għal immaġnijiet iġġenerati li jistgħu jiksru l-politiki tal-kontenut tagħna, bħal materjal ta’ abbuż sesswali tat-tfal u deepfakes sesswali. Meta immaġnijiet ta’ nies reali jkunu fil-kuntest, ikollna restrizzjonijiet aktar stretti dwar x’tip ta’ xbihat jistgħu jinħolqu, b’salvagwardji partikolarment robusti madwar in-nudità u l-vjolenza grafika. Bħal kull tnedija, is-sigurtà qatt ma tkun lesta u pjuttost tibqa’ qasam kontinwu ta’ investiment. Hekk kif nitgħallmu aktar dwar l-użu ta’ dan il-mudell fid-dinja reali, aħna naġġustaw il-politiki tagħna kif xieraq.
Għal aktar dwar l-approċċ tagħna, żur l-addendum għall-kard tas-sistema GPT‑4o tal-ġenerazzjoni tal-immaġnijiet.
Nużaw ir-raġunament biex insaħħu s-sigurtà
Simili għax-xogħol tagħna dwar allinjament deliberattiv, ħarriġna LLM ta’ raġunament biex jaħdem direttament minn speċifikazzjonijiet ta’ sigurtà miktuba mill-bnedmin u interpretabbli. Użajna dan l-LLM ta’ raġunament waqt l-iżvilupp biex jgħinna nidentifikaw u nindirizzaw ambigwitajiet fil-politiki tagħna. Flimkien mal-avvanzi multimodali tagħna u t-tekniki eżistenti ta’ sigurtà żviluppati għal ChatGPT u Sora, dan jippermettilna nimmoderaw kemm it-test tal-input kif ukoll l-immaġnijiet tal-output skont il-politiki tagħna.
Il-ġenerazzjoni tal-immaġnijiet 4o qed tibda titnieda mil-lum għall-utenti ta’ Plus, Pro, Team u Free bħala l-ġeneratur default tal-immaġnijiet f’ChatGPT, bl-aċċess għal Enterprise u Edu jasal dalwaqt. Hija disponibbli wkoll għall-użu f’Sora. Għal dawk li għandhom post speċjali f’qalbhom għal DALL·E, xorta tista’ tintuża permezz ta’ GPT dedikat ta’ DALL·E.
L-iżviluppaturi dalwaqt se jkunu jistgħu jiġġeneraw immaġnijiet b’GPT‑4o permezz tal-API, bl-aċċess jibda jitnieda fil-ġimgħat li ġejjin.
Il-ħolqien u l-personalizzazzjoni tal-immaġnijiet huma sempliċi daqs li tiċċettja billi tuża GPT‑4o - iddeskrivi biss dak li għandek bżonn, inklużi kwalunkwe dettalji speċifiċi bħall-proporzjon tal-aspett, kuluri eżatti billi tuża kodiċijiet hex, jew sfond trasparenti. Minħabba li dan il-mudell joħloq stampi aktar dettaljati, l-immaġnijiet jieħdu aktar żmien biex jidhru, spiss sa minuta waħda.
Awtur
Tmexxija
Gabriel Goh: Ġenerazzjoni tal-immaġnijiet
Jackie Shannon: Prodott ChatGPT
Mengchao Zhong, Wayne Chang: Inġinerija ChatGPT
Rohan Sahai: Prodott u Inġinerija Sora
Brendan Quinn, Tomer Kaftan: Inferenza
Prafulla Dhariwal: Organizzazzjoni multimodali
Riċerka
Riċerka Fundamentali
Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal
Riċerka Ewlenija
Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra
Kontributuri għar-Riċerka
Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song
Imġiba tal-Mudell
Laurentia Romaniuk
Organizzazzjoni Multimodali
Andrew Gibiansky, Yang Lu
Data
Mexxejja tad-Data
Gildas Chabot, James Park Lennon
Data
Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian
Moderaturi
Hazel Byrne, Jennifer Luckenbill, Mariano López
Konsulenti tad-Data Umana
Long Ouyang
Skalar
Mexxejja tal-Inferenza
Brendan Quinn, Tomer Kaftan
Inferenza
Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh
Applikat
Mexxej tal-Prodott ChatGPT
Jackie Shannon
Mexxejja tal-Inġinerija ChatGPT
Mengchao Zhong, Wayne Chang
Mexxej tad-Disinn tal-Prodott
Matt Chan
Xjenza tad-Data
Xiaolin Hao
ChatGPT
Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian
Sora
Mexxejja tal-Prodott Sora
Rohan Sahai, Wesam Manassra
Prodott u Inġinerija Sora
Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra
Sigurtà
Mexxej tas-Sigurtà
Somay Jain
Sigurtà
Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson
Strateġija
Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll
Marketing u Komunikazzjoni
Mexxejja tal-Komunikazzjoni u l-Marketing
Minnia Feng, Natalie Summers, Taya Christianson
Komunikazzjoni
Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor
Disinn u Kreattività
Mexxejja
Kendra Rimbach, Veit Moeller
Disinn
Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz
Ringrazzjamenti Speċjali
Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






