Ներկայացնում ենք 4o Պատկերի գեներացումը
Օգտակար և արժեքավոր պատկերների գեներացիա՝ օգտագործելով բնիկ մուլտիմոդալ մոդել, որը կարող է ստանալ ճշգրիտ, հստակ և ֆոտոռեալիստական արդյունքներ։
OpenAI-ում մենք վաղուց հավատացել ենք, որ պատկերների գեներացումը պետք է լինի մեր լեզվի մոդելների հիմնական ունակություններից մեկը։ Ահա թե ինչու մենք GPT‑4o-ում ներդրել ենք մեր ամենաառաջադեմ պատկերի գեներատորը։ Արդյունքը՝ պատկերների գեներացում, որը ոչ միայն գեղեցիկ է, այլև օգտակար։
Առաջին քարանձավային նկարներից մինչև ժամանակակից ինֆոգրաֆիկան, մարդիկ տեսողական պատկերներն օգտագործել են հաղորդակցվելու, համոզելու և վերլուծելու համար, այլ ոչ թե միայն զարդարելու համար։ Այսօրվա գեներատիվ մոդելները կարող են ստեղծել անիրական, ապշեցուցիչ տեսարաններ, բայց դժվարանում են այն պատկերների հետ, որոնք մարդիկ օգտագործում են տեղեկատվություն կիսելու և ստեղծելու համար։ Լոգոներից մինչև դիագրամներ, պատկերները կարող են փոխանցել ճշգրիտ իմաստ, երբ լրացվում են համընդհանուր լեզվին և փորձին վերաբերող խորհրդանիշերով։
GPT‑4o պատկերների գեներացումը գերազանցում է տեքստի ճշգրիտ ներկայացումը, հարցումներին ճշգրիտ հետևելը և 4o-ի բնածին տեղեկությունների բազան և զրույցի համատեքստը օգտագործելը՝ ներառյալ վերբեռնված պատկերների վերափոխումը կամ դրանք որպես տեսողական ոգեշնչում օգտագործելը։ Այս հնարավորությունները հեշտացնում են ձեր պատկերացրած պատկերն ստեղծելը՝ օգնելով ձեզ ավելի արդյունավետ հաղորդակցվել վիզուալների միջոցով և պատկերների գեներացիան դարձնել գործնական գործիք՝ ճշգրտությամբ և հզորությամբ։
Մենք մեր մոդելները սովորեցրեցինք առցանց պատկերների և տեքստերի համատեղ բաշխման վրա՝ սովորելով ոչ միայն, թե ինչպես են պատկերները կապված լեզվի հետ, այլև ինչպես են դրանք կապված միմյանց հետ։ Ագրեսիվ հետուսուցման հետ միասին, արդյունքում ստացված մոդելն ունի զարմանալի տեսողական սահունություն, որը կարող է գեներացնել օգտակար, հետևողական և համատեքստին համապատասխան պատկերներ։
Մեկ նկարը հազար բառ արժե, բայց երբեմն մի քանի բառ ճիշտ տեղում գրելը կարող է բարձրացնել պատկերի իմաստը։ 4o-ի ճշգրիտ խորհրդանիշները պատկերների հետ խառնելու ունակությունը պատկերների գեներացումը վերածում է տեսողական հաղորդակցության գործիքի։
Քանի որ պատկերների գեներացումն այժմ բնիկ է GPT‑4o‑ի համար, դուք կարող եք կատարելագործել պատկերները բնական խոսակցության միջոցով։ Օրինակ, եթե դուք նախագծում եք տեսախաղի կերպար, կերպարի տեսքը մնում է համահունչ բազմաթիվ իտերացիաների ընթացքում, քանի որ դուք կատարելագործում և փորձարկում եք այն։ Օրինակ, եթե դուք նախագծում եք տեսախաղի կերպար, կերպարի տեսքը մնում է համահունչ բազմաթիվ իտերացիաների ընթացքում, քանի որ դուք կատարելագործում և փորձարկում եք այն։
GPT‑4o-ի պատկերների գեներացիան հետևում է մանրամասն հարցումներին՝ ուշադրություն դարձնելով մանրամասներին։ Մինչ մյուս համակարգերը դժվարանում են մշակել մոտ 5-8 օբյեկտ, GPT‑4o‑ն կարող է մշակել մինչև 10-20 տարբեր օբյեկտներ։ Օբյեկտների ավելի սերտ կապը իրենց հատկանիշների և հարաբերությունների հետ թույլ է տալիս ավելի լավ վերահսկողություն։
GPT‑4o‑ն կարող է վերլուծել և սովորել օգտատերերի կողմից վերբեռնված պատկերներից՝ անխափան ինտեգրելով դրանց մանրամասները իր համատեքստում՝ պատկերների ստեղծմանը նպաստելու համար։
Բնիկ պատկերների գեներացումը հնարավորություն է տալիս 4o-ին իր տեղեկությունները տեքստի և պատկերների միջև հղել, ինչի արդյունքում ստացվում է մոդել, որը ավելի խելացի և արդյունավետ է թվում։
Տարբեր ոճերի պատկերներ արտացոլող պատկերների ուսուցումը թույլ է տալիս մոդելին համոզիչ կերպով ստեղծել կամ փոխակերպել պատկերներ։
Մեր մոդելը կատարյալ չէ։ Մենք տեղյակ ենք այս պահին առկա բազմաթիվ սահմանափակումների մասին, որոնք կաշխատենք լուծել մոդելի բարելավումների միջոցով՝ սկզբնական թողարկումից հետո։

Մենք նկատել ենք, որ GPT‑4o‑ն երբեմն կարող է չափազանց խիտ կտրել երկար պատկերները, ինչպիսիք են պաստառները, հատկապես ներքևի մասում։
Մեր մոդելի սպեցիֆիկացիային համապատասխան՝ մենք նպատակ ունենք առավելագույնի հասցնել ստեղծագործական ազատությունը՝ աջակցելով արժեքավոր կիրառման դեպքերին, ինչպիսիք են խաղերի մշակումը, պատմական ուսումնասիրությունը և կրթությունը՝ միաժամանակ պահպանելով անվտանգության խիստ չափանիշները։ Միևնույն ժամանակ, նույնքան կարևոր է, որքան միշտ, արգելափակել այն հարցումները, որոնք խախտում են այդ չափանիշները։ Ստորև ներկայացված են լրացուցիչ ռիսկային ոլորտների գնահատականները, որտեղ մենք աշխատում ենք միացնել անվտանգ, բարձր օգտակար բովանդակություն և ապահովել օգտատերերի համար ավելի լայն ստեղծագործական արտահայտության աջակցում։
C2PA-ի և ներքին հետադարձելի որոնման միջոցով ծագում
Բոլոր գեներացված պատկերները պարունակում են C2PA մետատվյալներ, որոնք կնույնականացնեն պատկերը որպես GPT‑4o‑ից ստացված՝ թափանցիկություն ապահովելու համար։ Մենք նաև ստեղծել ենք ներքին որոնման գործիք, որը օգտագործում է սերունդների տեխնիկական հատկանիշները՝ հաստատելու համար, թե արդյոք բովանդակությունը մեր մոդելից է։
Վատ բաների արգելափակում
Մենք շարունակում ենք արգելափակել գեներացված պատկերների հարցումները, որոնք կարող են խախտել մեր բովանդակությանը վերաբերող կանոնները, ինչպիսիք են երեխաների սեռական բռնության նյութերը և սեռական խորը կեղծիքները։ Երբ իրական մարդկանց պատկերները համատեքստում են, մենք խստացրել ենք սահմանափակումները՝ կապված այն բանի հետ, թե ինչ տեսակի պատկերներ կարելի է ստեղծել, հատկապես՝ մերկության և գրաֆիկական բռնության շուրջ խիստ պաշտպանիչ միջոցներով։ Ինչպես ցանկացած գործարկման դեպքում, անվտանգությունը երբեք ավարտված չէ և ավելի շուտ շարունակական ներդրումների ոլորտ է։ Քանի որ մենք ավելի շատ տեղեկություններ ենք ստանում այս մոդելի իրական աշխարհում օգտագործման մասին, մենք համապատասխանաբար կհարմարեցնենք մեր քաղաքականությունները։
Մեր մոտեցման մասին ավելին իմանալու համար այցելեք GPT‑4o համակարգի քարտի հավելվածը պատկերների ստեղծման վերաբերյալ։
Հիմնավորման օգտագործումը անվտանգությունը խթանելու համար
Նման մեր գիտակցական հավասարեցման աշխատանքին, մենք վարժեցրել ենք հիմնավորման LLM-ին աշխատել անմիջապես մարդու կողմից գրված և մեկնաբանվող անվտանգության բնութագրերից: Մենք օգտագործեցինք այս հիմնավորումը LLM-ը մշակման ընթացքում՝ մեր քաղաքականություններում առկա երկիմաստությունները բացահայտելու և լուծելու համար: Մեր բազմամոդալ առաջընթացների և ChatGPT‑ի ու Sora-ի համար մշակված առկա անվտանգության տեխնիկայի հետ միասին, սա թույլ է տալիս մեզ մոդերացնել ինչպես մուտքագրման տեքստը, այնպես էլ արտածման պատկերները՝ մեր քաղաքականությանը համապատասխան։
4o պատկերների գեներացումը սկսվում է այսօրվանից Plus, Pro, Team և Free օգտատերերի համար՝ որպես ChatGPT‑ի կանխադրված պատկերների գեներատոր, իսկ շուտով հասանելի կլինի նաև Enterprise և Edu օգտատերերին։ Այն նույնպես հասանելի է Sora-ում օգտագործելու համար։ Նրանց համար, ովքեր DALL·E-ի համար առանձնահատուկ տեղ ունեն իրենց սրտում, այն դեռևս հասանելի է DALL·E GPT‑ի միջոցով։
Ծրագրավորողները շուտով կկարողանան գեներացնել պատկերներ GPT‑4o‑ի միջոցով API-ով, և հասանելիությունը կսկսի տարածվել հաջորդ մի քանի շաբաթների ընթացքում։
Պատկերների ստեղծումն ու անհատականացումը նույնքան պարզ է, որքան GPT‑4o‑ի միջոցով զրուցելը. պարզապես նկարագրեք, թե ինչ է ձեզ անհրաժեշտ, ներառյալ ցանկացած մանրամասնություն, ինչպիսիք են կողմերի հարաբերակցությունը, ճշգրիտ գույները՝ օգտագործելով տասնվեցական կոդեր կամ թափանցիկ ֆոն: Քանի որ այս մոդելը ստեղծում է ավելի մանրամասն պատկերներ, պատկերները ավելի երկար են մշակվում, հաճախ մինչև մեկ րոպե։
Հեղինակ
Առաջնորդություն
Գաբրիել Գոհ․ Պատկերի գեներացում
Ջեքի Շենոն: ChatGPT պրոդուկտ
Մենգչաո Չժոնգ, Ուեյն Չանգ. ChatGPT ճարտարագիտություն
Ռոհան Սահայ. Sora պրոդուկտ և ճարտարագիտություն
Բրենդան Քուին, Թոմեր Կաֆթան. Ինֆերենցիա
Պրաֆուլա Դարիվալ. Բազմամոդալ կազմակերպություն
Հետազոտություններ
Հիմնարար հետազոտություն
Ալան Ջաբրի, Դեյվիդ Մեդինա, Գաբրիել Գոհ, Քենջի Հաթա, Լու Լյու, Պրաֆուլլա Դարիվալ
Հիմնական հետազոտություն
Ադիտյա Ռամեշ, Ալեքս Նիկոլ, Քեյսի Չու, Չենգ Լու, Դիան Անգ Յապ, Հիու Ջուն, Ջեյմս Բետկեր, Ցզյանֆեն Վանգ, Լոնգ Օույան, Լի Ջինգ, Վեսամ Մանասրա
Հետազոտության մասնակիցներ
Էյդեն Լոու, Բրենդոն ՄակՔինզի, Չարլի Նեշ, Հյուվեն Չանգ, Իշաան Գուլրաջանի, Ջեյմի Կիրոս, Ջի Լին, Քշիթիջ Գուպտա, Յանգ Սոնգ
Մոդելի վարքագիծ
Լավրենտիա Ռոմանյուկ
Բազմամոդալ կազմակերպություն
Էնդրյու Գիբիանսկի, Յանգ Լու
Տվյալներ
Տվյալների ղեկավարներ
Գիլդաս Չաբոտ, Ջեյմս Պարկ Լենոն
Տվյալներ
Արշի Բհաթնագար, Դրագոս Օպրիկա, Ռոհան Քշիրսագար, Սպենսեր Պապայ, Սզի-չիե Յու, Վեսամ Մանասրա, Յիլեյ Քյան
Մոդերատորներ
Հեյզել Բիրն, Ջենիֆեր Լաքենբիլ, Մարիանո Լոպես
Մարդկային տվյալների խորհրդատուներ
Լոնգ Օույանգ
Մասշտաբավորում
Եզրակացության ղեկավարներ
Բրենդան Քուին, Տոմեր Կաֆթան
Եզրակացություն
Ալիսա Հուանգ, Յակոբ Մենիկ, Նիկ Ստատաս, Ռուսլան Վասիլև, Սթենլի Հսիեհ
Կիրառական
ChatGPT պրոդուկտի ղեկավար
Ջեքի Շենոն
ChatGPT ինժեներական ղեկավարներ
Մենգչաո Չժոնգ, Ուեյն Չանգ
Ապրանքի դիզայնի ղեկավար
Մեթ Չան
Տվյալների գիտություն
Սյաոլին Հաո
ChatGPT
Էնդրյու Սիմա, Էննի Չենգ, Բենջամին Գոհ, Բոյանգ Նիու, Դիան Անգ Յապ, Դուկ Տրան, Էդեդե Օյվոհ, Էրիկ Չժանգ, Իթան Չանգ, Ջեֆրի Դանհեմ, Ջեյ Չեն, Կան Վու, Կարեն Լի, Քելլի Սթիրման, Մենգյուան Սյու, Միշել Ցին, Օլա Օկելոլա, Պեդրո Ագիլար, Ռոքի Սմիթ, Ռոհիտ Ռամչանդանի, Սառա Քուլվեր, Շոն Ֆիցջերալդ, Վլադ Ֆոմենկո, Վանինգ Ցզյան, Վեսամ Մանասրա, Սյաոլին Հաո, Յիլեյ Ցյան
Sora
Sora-ի պրոդուկտի ղեկավարներ
Ռոհան Սահաի, Վեսամ Մանասրա
Sora պրոդուկտ և ճարտարագիտություն
Բոյանգ Նյու, Դեյվիդ Շնուր, Գիլման Տոլլե, Ջո Թեյլոր, Ջոի Ֆլին, Մայք Սթար, Ռաջիվ Նայակ, Ռոհան Սահայ, Ուեսամ Մանասրա
Անվտանգություն
Անվտանգության պատասխանատու
Սոմայ Ջեյն
Անվտանգություն
Ալեքս Բոյթել, Անդրեա Վալոնե, Բոտաո Հաո, Բրենդան Քուին, Քեմերոն Ռեյմոնդ, Չոնգ Չժան, Դեյվիդ Ռոբինսոն, Էրիկ Ուոլաս, Ֆիլիպո Ռասո, Հուիվեն Չանգ, Յան Կիվլիչան, Իրինա Քոֆման, Քերեն Գու-Լեմբերգ, Քրիստեն Յինգ, Մադլեն Բոյդ, Մեգհան Ռո Շահվե Սահայ, Ռոդրիգո Ռիազա Պերես, Սեմ Թոյզեր, Սանդինի Ագարվալ, Թրոյ Պետերսոն
Ռազմավարություն
Ադամ Քոհեն, Ադամ Ուելս, Ալի Բենեթ, Էշլի Պանտուլիանո, Կարոլինա Պազ, Կլաուդիա Ֆիշեր, Դեկլան Գրաբ, Գաբի Սակրամոնե-Լուց, Լորեն Ջոնաս, Ռայան Բեյերմայստեր, Շիաո Լի, Թոմ Ստասի, Թայս Ուոլթերս, Զիադ Ռեսլան, Զոի Ստոլ
Մարքեթինգ և կոմմունիկացիա
Հաղորդակցության և մարքեթինգի ղեկավարներ
Մինիա Ֆենգ, Նատալի Սամերս, Թայա Քրիստիանսոն
Հաղորդակցություն
Ալեքս Բեյքեր-Ուիթքոմբ, Էշլի Թայրա, Բեյլի Ռիչարդսոն, Գաբի Ռայլա, Մարսելուս Քեյթոն, Սքոթ Էթերսմիթ, Սուկի Մանսուր
Դիզայն և ստեղծագործականություն
Ղեկավարներներ
Կենդրա Ռիմբախ, Ֆեյթ Մյոլլեր
Դիզայն
Ադամ Բրենդոն, Ադամ Կոպել, Անժելա Բեկ, Քերի Հադսոն, Դանա Պալմի, Ֆրեդի Սուլիտ, Ջեֆրի Սաբին Մացումոտո, Լեյան Լո, Մեթ Նիկոլս, Թոմաս Դեգրի, Վանեսա Անտոնիա Շեֆկե, Յարա Խակբազ
Հատուկ շնորհակալություն
Ադիտյա Ռամեշ, Էյդան Քլարկ, Ալեքս Բոյթել, Բեն Նյուհաուս, Բեն Ռոսսեն, Չե Չանգ, Գրեգ Բրոքման, Հաննա Վոնգ, Իշաան Սինգալ, Ջեյսոն Կվոն, Ջյաչեն Ֆենգ, Ջիահուի Յու, Ջոան Ջանգ, Յոհաննես Հայդեկե, Քևին Վեյլ, Մարկ Չեն, Միա Գլեյզ, Նիք Թերլի, Ռաուլ Պուրի, Ռեյիչիրո Նականո, Ռուի Շու, Սեմ Ալթման, Շուչաո Բի, Վիննի Մոնակո

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






