API میں ہمارے تازہ ترین تصویر جنریشن ماڈل کا تعارف
جب ہم نے پچھلے مہینے ChatGPT میں تصویر بنانے کی سہولت متعارف کروائی، تو یہ تیزی سے ہماری سب سے مقبول فیچرز میں سے ایک بن گئی: دنیا بھر میں 130 ملین سے زیادہ صارفین نے صرف پہلے ہفتے(نئی ونڈو میں کھلتا ہے) میں 700 ملین سے زیادہ تصاویر بنائیں۔
آج، ہم ChatGPT میں اس تجربے کو طاقت دینے والے مقامی طور پر ملٹی موڈل ماڈل کو API کے ذریعے gpt-image-1 میں لا رہے ہیں، جس سے ڈویلپرز اور کاروباروں کو اپنے ٹولز اور پلیٹ فارمز میں براہ راست اعلٰی معیار، پیشہ ورانہ درجے کی تصویر کی تخلیق کو آسانی سے شامل کرنے کی سہولت ملتی ہے۔ ماڈل کی ہمہ جہتی اسے متنوع انداز میں تصاویر بنانے، مخصوص رہنما اصولوں کو وفاداری سے فالو کرنے، عالمی علم سے فائدہ اٹھانے، اور متن کو درست طریقے سے پیش کرنے کی اجازت دیتی ہے—جو متعدد شعبے میں بے شمار عملی درخواستیں کھولتی ہے۔
تخلیقی ٹولز، ای کامرس، تعلیم، انٹرپرائز سافٹ ویئر، گیمنگ سمیت مختلف صنعتوں میں سرکردہ ادارے اور اسٹارٹ اپس پہلے ہی اپنی مصنوعات اور تجربات میں تصویر کی تخلیق کو استعمال کر رہے ہیں۔ ہم نہایت خوشی سے ذیل میں دی گئی کچھ مثالوں کا اشتراک کر رہے ہیں۔
Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.
ہم ڈویلپرز اور کاروباری اداروں کے ساتھ کام جاری رکھے ہوئے ہیں تاکہ API میں تصویر جنریشن کے استعمال کے مزید طریقے دریافت کیے جا سکیں، جن میں شامل ہیں:
ڈیزائننگ اور ایڈیٹنگ: Canva اپنے Canva AI اور Magic Studio ٹولز میں ڈیزائن جنریشن اور ایڈیٹنگ کی حدود کو بڑھانے کے لیے OpenAI کے gpt-image-1 کو دریافت کر رہا ہے۔ gpt-image-1 کی صلاحیتوں کے ذریعے، جیسے کہ ابتدائی خاکوں کو شاندار گرافک عناصر میں تبدیل کرنا اور اعلٰی معیار کی بصری ترامیم کو ممکن بنانا، Canva اپنے 230 ملین صارفین کو نئے طریقوں سے اپنے خیالات کو حقیقت میں بدلنے کے لیے زیادہ طاقتور بنائے گا۔
لوگو بنانے اور ترمیم کرنے: GoDaddy فعال طور پر تجربات کر رہا ہے تاکہ تصویر جنریٹ کرنے کا اس میں ضم کیا جا سکے، تاکہ صارفین آسانی سے قابل ترمیم لوگو بنا سکیں، پس منظر ہٹانا سکیں، اور پیشہ ورانہ ٹائپوگرافی جنریٹ کر سکیں۔ مزید برآں، GoDaddy Airo® کے ساتھ ایک نئے تجربے کے طور پر، ٹیم اس پر کام کر رہی ہے کہ صارفین سوشل میڈیا پوسٹس اور مارکیٹنگ کے اثاثے بنائیں جو ان کی منفرد برانڈ شناختوں کی عکاسی کریں، جو کسی پرامپٹ سے تیار کردہ اصل پروڈکٹ اور برانڈ مواد کے لیے ہیں۔
مارکیٹنگ مواد کی تیاری: HubSpot یہ دریافت کر رہا ہے کہ OpenAI کی نئی AI تصویر کی صلاحیتیں صارفین کو کس طرح مارکیٹنگ اور سیلز مواد بنانے میں مدد دے سکتی ہیں۔ جیسا کہ HubSpot کاروباروں کو بڑھانے کے لیے نئے AI سے تقویت یافتہ ٹولز شامل کرتا رہتا ہے، یہ تصویر کی صلاحیتیں کسٹمرز کے لیے بغیر کسی خاص ڈیزائن کی مہارت کی ضرورت کے، سوشل میڈیا، ای میل مارکیٹنگ، اور لینڈنگ پیجز کے لیے اعلٰی معیار کی تصاویر تیار کرنے کے طریقوں کو تبدیل کرنے کی صلاحیت رکھتی ہیں۔
ترکیبیں اور خریداری کی فہرستیں جنریٹ کرنا: Instacart API کے ذریعے تصویر جنریٹ کرنے کے نئے طریقے آزما رہا ہے، جن میں ترکیبوں اور خریداری کی فہرستوں کے لیے تصاویر شامل ہیں۔
ویڈیوز کی تدوین: invideo لاکھوں صارفین کو AI کا استعمال کرتے ہوئے اپنے خیالات کو ویڈیوز میں تبدیل کرنے کے قابل بناتا ہے۔ gpt-image-1 کے انضمام کے ساتھ، پلیٹ فارم اب بہتر متن کی تخلیق، باریک بینی سے تدوین کے کنٹرولز، اور جدید طرز کی رہنمائی فراہم کرتا ہے۔
API میں gpt-image-1 ماڈل ChatGPT میں 4o تصویر کی تخلیق کی طرح ہی حفاظتی گارڈریل استعمال کرتا ہے، جس میں ایسے حفاظتی اقدامات شامل ہیں جو ماڈل کو نقصان دہ تصاویر پیدا کرنے سے روکتے ہیں اور جنریٹ کردہ تصاویر میں C2PA میٹا ڈیٹا شامل کرتے ہیں—آپ اس کے بارے میں مزید ہماری پچھلی بلاگ پوسٹ میں یہاں پڑھ سکتے ہیں۔ اضافی طور پر، ڈویلپرز 'ماڈریشن' پیرا میٹر کے ساتھ اعتدال کی حساسیت کو بھی کنٹرول کر سکتے ہیں، جسے آٹو (پہلے سے طے شدہ) پر معیاری فلٹرکریں کے لیے یا کم پابندی والی فلٹرکریں کے لیے لو/کم پر مقرر کیا جا سکتا ہے۔ ہماری ڈاکس(نئی ونڈو میں کھلتا ہے) میں مزید معلومات حاصل کریں۔
طے شدہ طور پر، ہم کبھی بھی کسٹمر API ڈیٹا پر تربیت نہیں کرتے، اور تمام تصویری ان پٹ اور آؤٹ پٹ ہمارے استعمال کی پالیسیوںکے تابع رہتی ہیں۔
gpt-image-1 کا استعمال فی ٹوکن قیمتوں کے تعین کے حساب سے ہوتا ہے، جس میں متن اور تصویری ٹوکنز کے لیے علیحدہ قیمتیں ہیں:
- پرامپٹ متن کے ان پٹ ٹوکنز: $5 فی 1M ٹوکن
- تصویر ان پٹ ٹوکنز(ان پٹ تصاویر): $10 فی 1M ٹوکنز
- تصویر آؤٹ پٹ ٹوکنز (جنریٹ کردہ تصاویر): $40 فی 1M ٹوکنز
عملی طور پر، اس کا مطلب یہ ہے کہ کم، درمیانی، اور اعلٰی معیار کی مربع تصاویر کے لیے بالترتیب تقریباً $0.02، $0.07، اور $0.19 فی جنریٹ کردہ تصویری لاگت آتی ہے۔ تصویر کے معیار اور سائز کے لحاظ سے تفصیلی قیمتوں کے تعین کے لیے، ڈوکس(نئی ونڈو میں کھلتا ہے) ملاحظہ کریں۔
gpt-image-1 ماڈل اب عالمی سطح پر تصویریں API کے ذریعے دستیاب ہے، اور جلد ہی رسپانسز API میں سپورٹ فراہم کی جائے گی۔ کچھ ڈویلپرز کو ماڈل استعمال کرنے سے پہلے اپنی تنظیم کی تصدیق کرنے(نئی ونڈو میں کھلتا ہے) کی ضرورت ہو سکتی ہے۔ براہ کرم تنظیم کی ترتیبات(نئی ونڈو میں کھلتا ہے) کی پڑتال کریں تاکہ دیکھ سکیں کہ آیا آپ کو پہلے ہی رسائی حاصل ہے۔
شروع کرنے کے لیے، Playground(نئی ونڈو میں کھلتا ہے) میں ماڈل کی صلاحیتوں کو دریافت کریں اور ہمارا تصویر جنریٹ کرنے کا گائیڈ(نئی ونڈو میں کھلتا ہے) ملاحظہ کریں۔ ہم یہ دیکھنے کے منتظر ہیں کہ آپ کیا تعمیر کرتے ہیں۔