معرفی قابلیت تولید تصویر 4o
ایجاد تصویر مفید و ارزشمند با یک مدل چندوجهی بومی که قادر به خروجیهای دقیق، صحیح و واقعگرایانه است.
در OpenAI، ما مدتهاست که معتقدیم تولید تصویر باید قابلیت اصلی مدلهای زبانی ما باشد. به همین دلیل ما پیشرفتهترین مولد تصویرمان را تاکنون در GPT‑4o ساختهایم. نتیجه—تولید تصویری که نه تنها زیباست، بلکه مفید هم هست.
از اولین نقاشیهای غار تا اینفوگرافیکهای مدرن، انسانها از تصاویر بصری برای برقراری ارتباط، ترغیب و تحلیل استفاده کردهاند - نه فقط برای تزئین. مدلهای مولد امروزی میتوانند صحنههای سورئال و نفسگیر را خلق کنند، اما در استفاده از تصاویر کاربردی که مردم برای به اشتراکگذاری و ایجاد اطلاعات استفاده میکنند، با مشکل مواجه هستند. از لوگوها تا نمودارها، تصاویر میتوانند معنای دقیقی را منتقل کنند وقتی با نمادهایی که به زبان و تجربه مشترک اشاره دارند، تقویت شوند.
تولید تصویر GPT‑4o در رندر دقیق متن، پیروی دقیق از دستورات و بهرهگیری از پایگاه دانش ذاتی 4o و زمینه گفتگو - از جمله تبدیل تصاویر آپلود شده یا استفاده از آنها به عنوان الهام بصری - به خوبی عمل میکند. این قابلیتها ایجاد تصویری که دقیقاً در ذهن داری را آسانتر میکنند و به تو کمک میکنند تا از طریق تصاویر، ارتباط مؤثرتری برقرار کنی و تولید تصویر را به ابزاری کاربردی با دقت و قدرت تبدیل کنی.
ما مدلهای خود را بر اساس توزیع مشترک تصاویر و متن آنلاین آموزش دادیم و نه تنها ارتباط تصاویر با زبان، بلکه ارتباط آنها با یکدیگر را نیز آموختیم. در ترکیب با آموزش پس از آموزش تهاجمی، مدل حاصل دارای روانی بصری شگفتانگیزی است و میتواند تصاویری تولید کند که مفید، سازگار و آگاه از زمینه هستند.
یک تصویر به اندازه هزار کلمه ارزش دارد، اما گاهی اوقات تولید چند کلمه در جای مناسب میتواند معنای یک تصویر را ارتقا دهد. توانایی 4o در ترکیب نمادهای دقیق با تصاویر، تولید تصویر را به ابزاری برای ارتباط بصری تبدیل میکند.
از آنجا که تولید تصویر اکنون بومی GPT‑4o است، می توانید تصاویر را از طریق مکالمه طبیعی اصلاح کنید. GPT‑4o میتواند بر اساس تصاویر و متن در زمینه گفتگو توسعه یابد و ثبات را در کل تضمین کند. برای مثال، اگر در حال طراحی یک شخصیت بازی ویدیویی هستی، ظاهر شخصیت در طول چندین بار تکرار، همزمان با اصلاح و آزمایش، منسجم باقی میماند.
تولید تصویر GPT‑4o با دقت به جزئیات، دستورالعملهای دقیقی را دنبال میکند. در حالی که سایر سیستم ها با ~5-8 شی دست و پنجه نرم می کنند، GPT‑4o می تواند تا 10-20 شی مختلف را مدیریت کند. پیوند محکمتر اشیاء به ویژگیها و روابطشان، کنترل بهتری را ممکن میسازد.
GPT‑4o میتواند تصاویر آپلود شده توسط کاربر را تجزیه و تحلیل کرده و از آنها یاد بگیرد و جزئیات آنها را به طور یکپارچه در متن خود ادغام کند تا از تولید تصویر مطلع شود.
تولید تصویر بومی به 4o امکان میدهد تا دانش خود را بین متن و تصاویر پیوند دهد و در نتیجه مدلی ایجاد کند که هوشمندتر و کارآمدتر به نظر برسد.
آموزش با تصاویری که طیف گستردهای از سبکهای تصویری را منعکس میکنند، به مدل امکان میدهد تا تصاویر را بهطور قانعکنندهای ایجاد یا تغییر دهد.
مدل ما بینقص نیست. ما در حال حاضر از محدودیتهای متعددی آگاهیم که پس از عرضه اولیه، با بهبود مدل، برای رفع آنها تلاش خواهیم کرد.

ما متوجه شدهایم که GPT‑4o گاهی اوقات میتواند تصاویر بلندتر، مانند پوسترها، را بیش از حد نزدیک به لبه برش دهد، به ویژه در قسمت پایین.
مطابق با مشخصات مدل ما، هدف ما به حداکثر رساندن آزادی خلاقانه با پشتیبانی از موارد استفاده ارزشمند مانند توسعه بازی، کاوش تاریخی و آموزش است - در عین حال که استانداردهای ایمنی قوی را حفظ میکنیم. در عین حال، مسدود کردن درخواستهایی که این استانداردها را نقض میکنند، همچنان به همان اندازه مهم باقی میماند. در زیر ارزیابیهایی از حوزههای خطر اضافی که در آنها برای فعالسازی محتوای ایمن و با کاربرد بالا و حمایت از بیان خلاقانهتر برای کاربران تلاش میکنیم، آمده است.
منشأ از طریق C2PA و جستجوی برگشتپذیر داخلی
تمام تصاویر تولید شده با فراداده C2PA ارائه میشوند که تصویر را به عنوان تصویری از GPT‑4o شناسایی میکند تا شفافیت را فراهم کند. ما همچنین یک ابزار جستجوی داخلی ساختهایم که از ویژگیهای فنی نسلها برای کمک به تأیید اینکه آیا محتوا از مدل ما آمده است یا خیر، استفاده میکند.
مسدود کردن چیزهای بد
ما همچنان درخواستهای مربوط به تصاویر تولید شدهای که ممکن است سیاستهای محتوای ما را نقض کنند، مانند مطالب مربوط به سوءاستفاده جنسی از کودکان و دیپفیکهای جنسی، را مسدود میکنیم. وقتی تصاویر افراد واقعی در متن قرار میگیرند، محدودیتهای بیشتری در مورد نوع تصاویری که میتوان ایجاد کرد داریم، به ویژه تدابیر حفاظتی قوی در مورد برهنگی و خشونت گرافیکی اعمال میشود. همانند هر راهاندازی، ایمنی هرگز به پایان نمیرسد و یک حوزه سرمایهگذاری مداوم است. همانطور که اطلاعات بیشتری دربارهٔ استفاده واقعی از این مدل کسب میکنیم، سیاستهایمان را بر این اساس تنظیم خواهیم کرد.
برای اطلاعات بیشتر درباره رویکرد ما، به ضمیمه تولید تصویر کارت سیستم GPT‑4o سر بزنید.
استفاده از استدلال برای افزایش ایمنی
مشابه کار همترازی مشورتی ما، یک LLM استدلالی را آموزش دادهایم تا مستقیماً از مشخصات ایمنی نوشته شده توسط انسان و قابل تفسیر استفاده کند. ما در طول توسعه از این LLM استدلال برای کمک به شناسایی و رفع ابهامات در سیاستهایمان استفاده کردیم. این امر، همراه با پیشرفتهای چندوجهی ما و تکنیکهای ایمنی موجود که برای ChatGPT و Sora توسعه داده شدهاند، به ما امکان میدهد تا هم متن ورودی و هم تصاویر خروجی را در برابر سیاستهای خود نظارت کنیم.
قابلیت تولید تصویر 4o از امروز برای کاربران نسخههای پلاس، پرو، تیمی و رایگان به عنوان تولیدکننده پیشفرض تصویر در ChatGPT عرضه میشود و به زودی برای کاربران نسخههای سازمانی و آموزشی نیز در دسترس قرار خواهد گرفت. همچنین میتوانی از آن در Sora استفاده کنی. برای کسانی که جایگاه ویژهای برای DALL·E در قلبشان دارند، هنوز هم میتوانید از طریق یک GPT اختصاصی DALL·E به آن دسترسی پیدا کنید.
توسعهدهندگان به زودی قادر خواهند بود از طریق API، تصاویر را با استفاده از GPT‑4o تولید کنند و این دسترسی طی چند هفته آینده ارائه خواهد شد.
ایجاد و سفارشیسازی تصاویر به سادگی چت کردن با استفاده از GPT‑4o است - فقط آنچه را که نیاز دارید شرح دهید، از جمله هرگونه جزئیاتی مانند نسبت ابعاد، رنگهای دقیق با استفاده از کدهای هگز یا پسزمینه شفاف. چون این مدل تصاویر با جزئیات بیشتری ایجاد میکند، رندر تصاویر بیشتر طول میکشد و اغلب تا یک دقیقه زمان میبرد.
نویسنده
رهبری
گابریل گو: تولید تصویر
جکی شانون: محصول ChatGPT
منگچائو ژونگ، وین چانگ: مهندسی ChatGPT
روهان صحایی: محصول و مهندسی Sora
برندن کوئین، تامر کفتان: استنتاج
پرافولا داریوال: سازمان چند مدلی
تحقیق
پژوهشهای بنیادی
آلن جبری، دیوید مدینا، گابریل گو، کنجی هاتا، لو لیو، پرافولا داریوال
پژوهشهای اصلی
آدیتیا رامش، الکس نیکول، کیسی چو، چنگ لو، دیان آنگ یاپ، هیوو جون، جیمز بتکر، جیانفنگ وانگ، لانگ اوویانگ، لی جینگ، وسام ماناسرا
مشارکتکنندگان در پژوهش
آیدن لو، براندون مک کینزی، چارلی نش، هویون چانگ، ایشان گلراجانی، جیمی کیروس، جی لین، کشتیج گوپتا، یانگ سونگ
رفتار مدلی
لورنتیا رومانیوک
سازمان چند مدلی
اندرو گیبیانسکی، یانگ لو
داده
سرپرستان داده
گیلداس چابوت، جیمز پارک لنون
داده
آرشی باتناگار، دراگوس اوپریکا، روهان کشیرساگار، اسپنسر پاپای، سی چیه یو، وسام مناسرا، ییلی کیان
مدیران
هیزل برن، جنیفر لاکنبیل، ماریانو لوپز
مشاوران داده انسانی
لانگ اویانگ
مقیاسبندی
سرپرستان استنتاج
برندان کوئین، تامر کفتان
استنتاج
آلیسا هوانگ، جیکوب منیک، نیک استاتاس، روسلان واسیلوف، استنلی هسیه
کاربردی
سرپرست محصول ChatGPT
جکی شانون
سرپرستان مهندسی ChatGPT
منگچائو ژونگ، وین چانگ
سرپرست طراحی محصول
مت چان
دانشمند داده
شیائولین هائو
ChatGPT
اندرو سیما، آنی چنگ، بنجامین گو، بویانگ نیو، دیان آنگ یاپ، دوک تران، ادده اویوو، اریک ژانگ، ایتان چانگ، جفری دانهام، جی چن، کان وو، کارن لی، کلی استیرمن، منگیوان شو، میشل کین، اولا اوکلولا، پدرو آگیلار، راکی اسمیت، روهیت رامچاندانی، سارا کالور، شان فیتزجرالد، ولاد فومنکو، وانینگ جیانگ، وسام ماناسرا، شیائولین هائو، ییلی کیان
Sora
سرپرستان محصول Sora
روحان صحاي، وسام منصرا
مهندسی و محصولات Sora
بویانگ نیو، دیوید اشنور، گیلمن تول، جو تیلور، جوی فلین، مایک استار، راجیو نایاک، روهان صاحای، وسام ماناسرا
ایمنی
سرپرست ایمنی
سومای جین
ایمنی
الکس بوتل، آندریا والونه، بوتائو هائو، برندان کوئین، کامرون ریموند، چونگ ژانگ، دیوید رابینسون، اریک والاس، فیلیپو راسو، هویون چانگ، ایان کیولیچان، ایرینا کوفمن، کرن گو-لمبرگ، کریستن یینگ، مادلاین بوید، مگان شاه، مایکل لمپی، اوون کمپبل-مور، روهان ساهای، رودریگو ریازا پرز، سام تویزر، ساندینی آگاروال، تروی پترسون
استراتژی
آدام کوهن، آدام ولز، آلی بنت، اشلی پانتولیانو، کارولینا پاز، کلودیا فیشر، دکلان گراب، گبی ساکرامون-لوتز، لورن جوناس، رایان بایرمایستر، شیائو لی، تام استاسی، تایس والترز، زیاد رسلان، زوئی استول
بازاریابی و ارتباطات
ارتباطات و سرنخهای بازاریابی
مینیا فنگ، ناتالی سامرز، تایا کریستینسون
ارتباطات
الکس بیکر-ویتکامب، اشلی تایرا، بیلی ریچاردسون، گبی رایلا، مارسلوس کیتون، اسکات اتراسمیت، سوکی منصور
طراحی و خلاقیت
سرنخها
کندرا ریمباخ، ویت مولر
طراحی
آدام براندون، آدام کوپل، آنجلا باک، کری هادسون، دانا پالمی، فردی سولیت، جفری سابین ماتسوموتو، لیان لو، مت نیکولز، توماس دگری، ونسا آنتونیا شفکه، یارا خاکباز
تشکر ویژه
آدیتیا رامش، آیدان کلارک، الکس بیوتل، بن نیوهاوس، بن روسن، چه چانگ، گرگ بروکمن، هانا وونگ، ایشان سیگال، جیسون کوان، جیاچنگ فنگ، جیاهوی یو، جوآن جانگ، یوهانس هایدکه، کوین ویل، مارک چن، میا گلیز، نیک ترلی، رائول پوری، رییچیرو ناکانو، روئی شو، سم آلتمن، شوچائو بی، وینی موناکو

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






