وقتی ماه گذشته قابلیت تولید تصویر را در ChatGPT معرفی کردیم، به سرعت به یکی از محبوبترین ویژگیهایمان تبدیل شد: بیش از ۱۳۰ میلیون کاربر در سراسر جهان در هفته اول(در یک پنجره جدید باز میشود) بیش از ۷۰۰ میلیون تصویر ایجاد کردند.
امروز، ما مدل چند وجهی بومی که این تجربه را در ChatGPT تقویت میکند، از طریق gpt-image-1 به API معرفی میکنیم، که به توسعهدهندگان و کسبوکارها امکان میدهد تا به راحتی تولید تصویر با کیفیت بالا و حرفهای را به طور مستقیم در ابزارها و پلتفرمهای خود ادغام کنند. انعطافپذیری مدل به آن اجازه میدهد تا تصاویر را در سبکهای گوناگون خلق کند، بهطور دقیق از راهنماییهای سفارشی پیروی کند، از دانش جهانی بهره ببرد و متن را بهطور دقیق نمایش دهد—قفلگشایی کاربردهای عملی بیشمار در حوزههای مختلف.
شرکتهای بزرگ و استارتآپها در صنایع مختلف از جمله ابزارهای خلاقانه، تجارت الکترونیک، آموزش، نرمافزارهای سازمانی و بازیسازی، در حال حاضر از تولید تصویر در محصولات و تجربیاتشان استفاده میکنند. ما خوشحال میشویم که تعدادی از این مثالها را در زیر با شما به اشتراک بگذاریم.
Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.
ما همچنین به همکاری با توسعهدهندگان و کسبوکارها ادامه میدهیم تا راههای بیشتری را برای استفاده از تولید تصویر در API برای کاربردهایشان کشف کنیم، از جمله:
طراحی و ویرایش: Canva در حال بررسی راههایی برای ادغام gpt-image-1 از OpenAI است تا مرزهای تولید و ویرایش طراحی را در ابزارهای Canva AI و Magic Studio گسترش دهد. از طریق قابلیتهای gpt-image-1 مانند تبدیل طرحهای اولیه به عناصر گرافیکی خیرهکننده و امکان ویرایشهای بصری با کیفیت بالا، Canva به ۲۳۰ میلیون کاربر خود این امکان را میدهد که ایدههایشان را به روشهای کاملاً جدیدی زنده کنند.
ایجاد و ویرایش لوگوها: GoDaddy به طور فعال در حال آزمایش است تا تولید تصویر را ادغام کند و مشتریان بتوانند به راحتی لوگوهایی ایجاد کنند که قابل ویرایش باشند، پسزمینهها را حذف کنند و تایپوگرافی حرفهای تولید کنند. علاوه بر این، به عنوان یک تجربه جدید با GoDaddy Airo®، Team در حال کار است تا مشتریان بتوانند پستهای رسانههای اجتماعی و داراییهای بازاریابی ایجاد کنند که هویتهای برند منحصر به فردشان را برای محتوای اصلی محصول و برند که از یک درخواست ایجاد شده است، منعکس کند.
ساخت مطالب بازاریابی: HubSpot در حال بررسی است که چگونه قابلیتهای جدید تولید تصویر هوش مصنوعی OpenAI میتواند به مشتریان در ایجاد مطالب بازاریابی و فروش کمک کند. همانطور که HubSpot به افزودن ابزارهای جدید مبتنی بر هوش مصنوعی برای مقیاسگذاری کسبوکارها ادامه میدهد، این قابلیتهای تولید تصویر پتانسیل این را دارند که نحوه تولید تصاویر باکیفیت برای رسانههای اجتماعی، بازاریابی ایمیلی و صفحات فرود را بدون نیاز به تخصص طراحی خاص، متحول کنند.
تولید دستور پخت و لیست خرید: Instacart در حال آزمایش روشهای جدیدی برای استفاده از API برای تولید تصویر است، از جمله تصاویر برای دستور پختها و لیستهای خرید.
ویرایش ویدئوها: invideo به میلیونها کاربر این امکان را میدهد که ایدههایشان را با استفاده از هوش مصنوعی به ویدئو تبدیل کنند. با ادغام gpt-image-1، پلتفرم اکنون تولید متن بهبود یافته، کنترلهای ویرایش دقیق و راهنماییهای پیشرفته در سبک را ارائه میدهد.
مدل gpt-image-1 در API از همان محافظهای ایمنی برای تولید تصویر 4o در ChatGPT بهره میبرد، از جمله محافظهایی که مدل را از تولید تصاویر مضر بازمیدارند و شامل متا دیتای C2PA در تصاویر تولید شده میشود—میتوانی درباره این موضوع در پست وبلاگ گذشته ما اینجا بیشتر بخوانید. علاوه بر این، توسعهدهندگان میتوانند حساسیت تعدیل را با پارامتر `moderation` کنترل کنند، که میتواند برای فیلتر استاندارد به auto (پیشفرض) تنظیم شود، یا برای فیلتر کمتر محدودکننده به low تنظیم شود. در مستندات(در یک پنجره جدید باز میشود) ما بیشتر یاد بگیر.
به طور پیشفرض، ما هرگز بر روی دادههای API مشتریان آموزش نمیدهیم و تمام ورودیها و خروجیهای تصویر همچنان تحت سیاستهای استفاده از APIما قرار دارند.
استفاده از gpt-image-1 بهازای هر توکن قیمتگذاری میشود، با قیمتگذاری جداگانه برای توکنهای متنی و تصویری:
- توکنهای ورودی متن (متن درخواست): 5 دلار به ازای هر 1 میلیون توکن
- توکنهای ورودی تصویری (تصاویر ورودی): 10 دلار به ازای هر 1 میلیون توکن
- توکنهای خروجی تصویر (تصاویر تولید شده): 40 دلار برای هر 1 میلیون توکن
در عمل، این به طور تقریبی به ۰.۰۲ دلار، ۰.۰۷ دلار و ۰.۱۹ دلار برای هر تصویر مربعی تولید شده با کیفیت پایین، متوسط و بالا ترجمه میشود. برای اطلاع از قیمتهای دقیق بر اساس کیفیت و اندازه تصویر، به مستندات(در یک پنجره جدید باز میشود) سر بزنید.
مدل gpt-image-1 اکنون بهصورت جهانی از طریق API تصاویر در دسترس است و بهزودی پشتیبانی در API پاسخها نیز ارائه میشود. برخی از توسعهدهندگان ممکن است نیاز داشته باشند تا بتوانند سازمان خود را تأیید(در یک پنجره جدید باز میشود) کنند تا بتوانند از این مدل استفاده کنند. لطفاً تنظیمات سازمان(در یک پنجره جدید باز میشود) را بررسی کن تا ببینی آیا در حال حاضر دسترسی داری یا نه.
برای شروع، قابلیتهای مدل را در Playground(در یک پنجره جدید باز میشود) کاوش کن و به راهنمای تولید تصویر(در یک پنجره جدید باز میشود) ما سر بزن. ما بیصبرانه منتظریم تا ببینیم شما چه چیزی میسازید.