۳ اردیبهشت ۱۴۰۴

معرفی مدل جدید تولید تصویر ما در API

در حال بارگذاری…

وقتی ماه گذشته قابلیت تولید تصویر را در ChatGPT معرفی کردیم، به سرعت به یکی از محبوب‌ترین ویژگی‌هایمان تبدیل شد: بیش از ۱۳۰ میلیون کاربر در سراسر جهان در هفته اول⁠(در یک پنجره جدید باز می‌شود) بیش از ۷۰۰ میلیون تصویر ایجاد کردند.

امروز، ما مدل چند وجهی بومی که این تجربه را در ChatGPT تقویت می‌کند، از طریق gpt-image-1 به API معرفی می‌کنیم، که به توسعه‌دهندگان و کسب‌وکارها امکان می‌دهد تا به راحتی تولید تصویر با کیفیت بالا و حرفه‌ای را به طور مستقیم در ابزارها و پلتفرم‌های خود ادغام کنند. انعطاف‌پذیری مدل به آن اجازه می‌دهد تا تصاویر را در سبک‌های گوناگون خلق کند، به‌طور دقیق از راهنمایی‌های سفارشی پیروی کند، از دانش جهانی بهره ببرد و متن را به‌طور دقیق نمایش دهد—قفل‌گشایی کاربردهای عملی بی‌شمار در حوزه‌های مختلف.

شرکت‌های بزرگ و استارت‌آپ‌ها در صنایع مختلف از جمله ابزارهای خلاقانه، تجارت الکترونیک، آموزش، نرم‌افزارهای سازمانی و بازی‌سازی، در حال حاضر از تولید تصویر در محصولات و تجربیاتشان استفاده می‌کنند. ما خوشحال می‌شویم که تعدادی از این مثال‌ها را در زیر با شما به اشتراک بگذاریم.

Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.

ما همچنین به همکاری با توسعه‌دهندگان و کسب‌وکارها ادامه می‌دهیم تا راه‌های بیشتری را برای استفاده از تولید تصویر در API برای کاربردهایشان کشف کنیم، از جمله:

طراحی و ویرایش: Canva در حال بررسی راه‌هایی برای ادغام gpt-image-1 از OpenAI است تا مرزهای تولید و ویرایش طراحی را در ابزارهای Canva AI و Magic Studio گسترش دهد. از طریق قابلیت‌های gpt-image-1 مانند تبدیل طرح‌های اولیه به عناصر گرافیکی خیره‌کننده و امکان ویرایش‌های بصری با کیفیت بالا، Canva به ۲۳۰ میلیون کاربر خود این امکان را می‌دهد که ایده‌های‌شان را به روش‌های کاملاً جدیدی زنده کنند.

ایجاد و ویرایش لوگوها: GoDaddy به طور فعال در حال آزمایش است تا تولید تصویر را ادغام کند و مشتریان بتوانند به راحتی لوگوهایی ایجاد کنند که قابل ویرایش باشند، پس‌زمینه‌ها را حذف کنند و تایپوگرافی حرفه‌ای تولید کنند. علاوه بر این، به عنوان یک تجربه جدید با GoDaddy Airo^®، Team در حال کار است تا مشتریان بتوانند پست‌های رسانه‌های اجتماعی و دارایی‌های بازاریابی ایجاد کنند که هویت‌های برند منحصر به فردشان را برای محتوای اصلی محصول و برند که از یک درخواست ایجاد شده است، منعکس کند.

ساخت مطالب بازاریابی: HubSpot در حال بررسی است که چگونه قابلیت‌های جدید تولید تصویر هوش مصنوعی OpenAI می‌تواند به مشتریان در ایجاد مطالب بازاریابی و فروش کمک کند. همان‌طور که HubSpot به افزودن ابزارهای جدید مبتنی بر هوش مصنوعی برای مقیاس‌گذاری کسب‌وکارها ادامه می‌دهد، این قابلیت‌های تولید تصویر پتانسیل این را دارند که نحوه تولید تصاویر باکیفیت برای رسانه‌های اجتماعی، بازاریابی ایمیلی و صفحات فرود را بدون نیاز به تخصص طراحی خاص، متحول کنند.

تولید دستور پخت و لیست خرید: Instacart در حال آزمایش روش‌های جدیدی برای استفاده از API برای تولید تصویر است، از جمله تصاویر برای دستور پخت‌ها و لیست‌های خرید.

ویرایش ویدئوها: invideo به میلیون‌ها کاربر این امکان را می‌دهد که ایده‌های‌شان را با استفاده از هوش مصنوعی به ویدئو تبدیل کنند. با ادغام gpt-image-1، پلتفرم اکنون تولید متن بهبود یافته، کنترل‌های ویرایش دقیق و راهنمایی‌های پیشرفته در سبک را ارائه می‌دهد.

ایمنی

مدل gpt-image-1 در API از همان محافظ‌های ایمنی برای تولید تصویر 4o در ChatGPT بهره می‌برد، از جمله محافظ‌هایی که مدل را از تولید تصاویر مضر بازمی‌دارند و شامل متا دیتای C2PA در تصاویر تولید شده می‌شود—می‌توانی درباره این موضوع در پست وبلاگ گذشته ما اینجا بیشتر بخوانید. علاوه بر این، توسعه‌دهندگان می‌توانند حساسیت تعدیل را با پارامتر `moderation` کنترل کنند، که می‌تواند برای فیلتر استاندارد به auto (پیش‌فرض) تنظیم شود، یا برای فیلتر کمتر محدودکننده به low تنظیم شود. در مستندات⁠(در یک پنجره جدید باز می‌شود) ما بیشتر یاد بگیر.

به طور پیش‌فرض، ما هرگز بر روی داده‌های API مشتریان آموزش نمی‌دهیم و تمام ورودی‌ها و خروجی‌های تصویر همچنان تحت سیاست‌های استفاده از APIما قرار دارند.

تعرفه ها

استفاده از gpt-image-1 به‌ازای هر توکن قیمت‌گذاری می‌شود، با قیمت‌گذاری جداگانه برای توکن‌های متنی و تصویری:

توکن‌های ورودی متن (متن درخواست): 5 دلار به ازای هر 1 میلیون توکن
توکن‌های ورودی تصویری (تصاویر ورودی): 10 دلار به ازای هر 1 میلیون توکن
توکن‌های خروجی تصویر (تصاویر تولید شده): 40 دلار برای هر 1 میلیون توکن

در عمل، این به طور تقریبی به ۰.۰۲ دلار، ۰.۰۷ دلار و ۰.۱۹ دلار برای هر تصویر مربعی تولید شده با کیفیت پایین، متوسط و بالا ترجمه می‌شود. برای اطلاع از قیمت‌های دقیق بر اساس کیفیت و اندازه تصویر، به مستندات⁠(در یک پنجره جدید باز می‌شود) سر بزنید.

شروع کنید

مدل gpt-image-1 اکنون به‌صورت جهانی از طریق API تصاویر در دسترس است و به‌زودی پشتیبانی در API پاسخ‌ها نیز ارائه می‌شود. برخی از توسعه‌دهندگان ممکن است نیاز داشته باشند تا بتوانند سازمان خود را تأیید⁠(در یک پنجره جدید باز می‌شود) کنند تا بتوانند از این مدل استفاده کنند. لطفاً تنظیمات سازمان⁠(در یک پنجره جدید باز می‌شود) را بررسی کن تا ببینی آیا در حال حاضر دسترسی داری یا نه.

برای شروع، قابلیت‌های مدل را در Playground⁠(در یک پنجره جدید باز می‌شود) کاوش کن و به راهنمای تولید تصویر⁠(در یک پنجره جدید باز می‌شود) ما سر بزن. ما بی‌صبرانه منتظریم تا ببینیم شما چه چیزی می‌سازید.

نویسنده‌ها

OpenAI