۲۴ مارچ، ۲۰۲۶

نوجوانوں کے زیادہ محفوظ AI تجربات بنانے میں ڈویلپرز کی مدد کرنا

gpt-oss-safeguard کے لیے پرومپٹ کی شکل میں نوجوانوں کی حفاظت کی پالیسیوں کا تعارف

لوڈ ہو رہا ہے…

آج، ہم پرومپٹ پر مبنی حفاظتی پالیسیاں⁠(نئی ونڈو میں کھلتا ہے) جاری کر رہے ہیں تاکہ ڈیویلپرز نوعمروں کے لیے عمر کے لحاظ سے موزوں حفاظتی اقدامات تیار کر سکیں. ہمارے اوپن ویٹ حفاظتی ماڈل، gpt-oss-safeguard⁠(نئی ونڈو میں کھلتا ہے)، کے ساتھ کام کرنے کے لیے تیار کردہ یہ پالیسیاں اس عمل کو آسان بناتی ہیں کہ ڈیویلپرز کس طرح حفاظتی تقاضوں کو حقیقی دنیا کے سسٹمز کے لیے قابلِ استعمال کلاسیفائرز میں تبدیل کریں.

ہم نے طاقتور AI تک رسائی کو جمہوری بنانے اور وسیع پیمانے پر اختراع کی حمایت کے لیے اوپن ویٹ ماڈلز جاری کیے. اسی کے ساتھ، ہم یہ بھی مانتے ہیں کہ حفاظت اور جدّت ساتھ ساتھ چلتے ہیں اور یہ کہ ڈویلپرز کو قابل ماڈلز تک رسائی کے ساتھ ساتھ انہیں محفوظ اور ذمہ دارانہ طریقے سے تعینات کرنے کے لیے ٹولز اور پالیسیوں تک بھی رسائی ہونی چاہیے. ہم نے یہ پالیسیاں نوجوان صارفین کے تحفظ کے لیے ڈویلپرز کی حفاظتی کوششوں میں معاونت کرنے کے لیے تیار کی ہیں اور اس عمل میں Common Sense Media⁠(نئی ونڈو میں کھلتا ہے) اور everyone.ai⁠(نئی ونڈو میں کھلتا ہے) سمیت قابلِ اعتماد بیرونی تنظیموں سے ان پٹ حاصل کی ہے.

ہم تسلیم کرتے ہیں کہ نوعمر افراد اور بالغ افراد کی ضروریات مختلف ہوتی ہیں اور یہ کہ نوعمر افراد کو اضافی تحفظ کی ضرورت ہوتی ہے. یہ پالیسیاں اس لیے تیار کی گئی ہیں تاکہ ڈویلپرز ان اختلافات کو مدِنظر رکھ سکیں اور ایسے تجربات تخلیق کریں جو کم عمر صارفین کے لیے بااختیار بنانے والے اور موزوں ہوں.

نوجوانوں کی حفاظت کے لیے ہمارے وسیع تر کام کو آگے بڑھانا

ہم طویل عرصے سے ایسے AI تیار کرنے کے لیے پُرعزم ہیں جو نوجوانوں کے لیے مواقع کو وسعت دے اور انہیں محفوظ رکھے. اس کام کے حصے کے طور پر، ہم نے اپنے ماڈل اسپیک⁠(نئی ونڈو میں کھلتا ہے)—یعنی وہ رہنما اصول جو OpenAI کے ماڈلز کے مطلوبہ رویے کی وضاحت کرتے ہیں—کو اپ ڈیٹ کیا تاکہ اس میں انڈر-18 (U18) اصول⁠(نئی ونڈو میں کھلتا ہے) شامل کیے جا سکیں اور کم عمر صارفین کے بہتر تحفظ کے لیے پیرنٹل کنٹرولز⁠ اور عمر کی پیشگوئی⁠ جیسے پروڈکٹ کی سطح کے حفاظتی اقدامات متعارف کرائے. ہم نے اپنے ٹین سیفٹی بلیو پرنٹ⁠ کے ذریعے صنعت بھر میں حفاظتی اقدامات کا بھی مطالبہ کیا ہے.

آج کی ریلیز اسی بنیاد پر استوار ہے. ہم اسے حفاظتی پالیسیوں ڈیویلپرز کے لیے دستیاب بنا رہے ہیں تاکہ وہ نوعمروں کے لیے حفاظتی اقدامات نافذ کرنے میں معاونت حاصل کر سکیں اور اوپن ویٹس ایکو سسٹم میں رسائی کو جمہوری بنانے میں مدد ملے.

نوجوانوں کی حفاظت کو واضح اور قابلِ عمل پالیسیوں میں تبدیل کرنا

اگرچہ gpt-oss-safeguard جیسے حفاظتی درجہ بندی کرنے والے نقصان دہ مواد کا پتہ لگا سکتے ہیں، لیکن وہ اس بات کی واضح تعریفوں پر انحصار کرتے ہیں کہ ایسا مواد کیا ہے. عملی طور پر، ڈویلپرز کو درپیش سب سے بڑے چیلنجز میں سے ایک ایسی پالیسیوں کی وضاحت کرنا ہے جو نوعمروں سے متعلق مخصوص خطرات کو درست طور پر محیط کریں اور حقیقی نظاموں میں مستقل طور پر لاگو کی جا سکیں.

یہاں تک کہ تجربہ کار ٹیمیں بھی اکثر اعلٰی سطحی حفاظتی اہداف کو واضح، قابلِ عمل اصولوں میں تبدیل کرنے میں دشواری محسوس کرتی ہیں، خاص طور پر اس لیے کہ اس کے لیے موضوعی مہارت اور AI کے بارے میں گہرا علم، دونوں درکار ہوتے ہیں. یہ تحفظ میں خلا، غیر یکساں نفاذ، یا ضرورت سے زیادہ وسیع فلٹرنگ کا باعث بن سکتا ہے. واضح اور اچھی طرح متعین پالیسیاں مؤثر حفاظتی نظام کے لیے ایک بنیادی اساس ہیں.

ڈیویلپرز کو نوعمروں کی حفاظت کو عملی جامہ پہنانے میں مدد کرنا

اس چیلنج سے نمٹنے کے لیے، ہم حفاظتی پالیسیوں⁠(نئی ونڈو میں کھلتا ہے) کا ایک مجموعہ جاری کر رہے ہیں، جو نوعمروں کو درپیش عام خطرات کے مطابق تیار کی گئی ہیں اور جو نوعمروں کے منفرد ترقیاتی اختلافات کے بارے میں موجودہ تحقیق کے محتاط جائزے سے رہنمائی حاصل کرتی ہیں. یہ پالیسیاں پرومپٹ کی شکل میں ترتیب دی گئی ہیں جنہیں gpt-oss-safeguard⁠(نئی ونڈو میں کھلتا ہے) اور دیگر ریزننگ ماڈل کے ساتھ براہِ راست استعمال کیا جا سکتا ہے، جس سے ڈویلپرز کے لیے اپنے سسٹمز میں یکساں حفاظتی معیارات کو زیادہ آسانی سے نافذ کرنا ممکن ہو جاتا ہے.

ابتدائی ریلیز میں ایسی پالیسیز شامل ہیں جو درج ذیل کا احاطہ کرتی ہیں:

گرافک پرتشدد مواد
گرافک جنسی مواد
نقصان دہ جسمانی معیارات اور رویّے
خطرناک سرگرمیاں اور چیلنجز
رومانوی یا پُرتشدد کردار نگاری
عمر کے لحاظ سے محدود اشیا اور خدمات

ان پالیسیوں کو ریئل ٹائم مواد کی فلٹرنگ کے لیے اور صارف کے تیار کردہ مواد کے آف لائن تجزیے کے لیے استعمال کیا جا سکتا ہے.

پالیسیوں کو پرومپٹ کی شکل میں ترتیب دینے سے، ڈویلپرز انہیں موجودہ ورک فلوز میں زیادہ آسانی سے ضم کر سکتے ہیں، اپنے استعمال کے معاملات کے مطابق ڈھال سکتے ہیں اور وقت کے ساتھ ان میں تکراری بہتری لا سکتے ہیں.

خاکہ جس میں نوعمروں کی حفاظت کی پالیسی کے زمرے اور نوعمروں سے متعلق مواد کو ایک GPT-OSS سیف گارڈ سسٹم میں جاتے ہوئے دکھایا گیا ہے، جو اندرونی ریزننگ سے باخبر پالیسی فیصلے تیار کرتا ہے.

بیرونی ماہرین کی رہنمائی کے ساتھ تیار کیا گیا

ہم نے ان پالیسیوں کی تیاری میں رہنمائی حاصل کرنے کے لیے بیرونی اداروں کے ساتھ کام کیا، جن میں Common Sense Media⁠(نئی ونڈو میں کھلتا ہے) اور everyone.ai⁠(نئی ونڈو میں کھلتا ہے) شامل ہیں. ان کی مہارت نے احاطہ کیے جانے والے مواد کے دائرہ کار کی تشکیل دینے، پرومپٹ کی ساخت کو مضبوط بنانے اور ان کا جائزہ لیتے وقت مدنظر رکھے جانے والے ایج کیسز کو بہتر بنانے میں مدد کی.

یہ کام ماہرین اور وسیع تر ماحولیاتی نظام کے ساتھ تعاون کی ایک جاری کوشش کی عکاسی کرتا ہے تاکہ AI سسٹمز نوجوانوں کی مدد کو بہتر بنایا جا سکے.

"نوجوانوں کے لیے AI کی حفاظت میں سب سے بڑے خلا میں سے ایک واضح اور قابلِ عمل پالیسیوں کی کمی رہی ہے، جن کی بنیاد پر ڈویلپرز کام کر سکیں. اکثر، ڈیویلپرز بالکل نئے سرے سے شروع کرتے ہیں. یہ پرومپٹ پر مبنی پالیسیاں پورے ایکوسسٹم میں حفاظت کی ایک بامعنی بنیادی سطح قائم کرنے میں مدد کرتی ہیں اور چونکہ انہیں اوپن سورس کے طور پر جاری کیا جاتا ہے، اس لیے وقت کے ساتھ ان میں تبدیلی اور بہتری کی جا سکتی ہے. "ہمیں اس نوعیت کے انفراسٹرکچر کو وسیع پیمانے پر دستیاب کیا جاتا دیکھ کر حوصلہ افزا محسوس ہوتا ہے اور ہمیں امید ہے کہ یہ پوری صنعت میں نوجوانوں کی حفاظت سے متعلق مزید مشترکہ ابتدائی بنیادوں کو فروغ دے گا."

—رابی ٹورنی، ہیڈ آف AI اینڈ ڈیجیٹل اسیسمنٹس، Common Sense Media

"اس نوعیت کی کوششیں، جو نوجوانوں کی حفاظتی پالیسیوں کو زیادہ قابلِ عمل بناتی ہیں، قیمتی ہیں کیونکہ یہ ماہرین کے علم کو ایسی رہنمائی میں ڈھالنے میں مدد دیتی ہیں جسے حقیقی نظاموں میں استعمال کیا جا سکے. مواد سے متعلق پالیسیاں ایک اہم پہلا قدم ہیں اور یہ اس بات پر مزید وسیع کام کے لیے بھی راہ ہموار کرتی ہیں کہ وقت کے ساتھ ماڈل کے رویے نوجوانوں سے متعلق خطرات کو کیسے تشکیل دے سکتے ہیں. اس کام اور اپنی تحقیق سے متاثر ہو کر، everyone.ai⁠(نئی ونڈو میں کھلتا ہے) نے بھی خصوصیت اور حد سے زیادہ انحصار جیسے خطرات پر توجہ مرکوز کرنے سے متعلق ایک ابتدائی پالیسی تیار کی ہے."

—ڈاکٹر میتھلڈ سیریولی، everyone.AI کے چیف سائنٹسٹ

نقطہ آغاز، مکمل حل نہیں.

یہ پالیسیاں ایک ابتدائی نقطۂ آغاز کے طور پر ہیں، نہ کہ نوجوانوں کی حفاظت کی کوئی جامع یا حتمی تعریف یا ضمانت. ہر ایپلیکیشن کے اپنے منفرد خطرات، سامعین اور سیاق و سباق ہوتے ہیں اور ڈویلپرز اس بات کو بہتر طور پر سمجھنے کی بہترین پوزیشن میں ہوتے ہیں کہ ان کی مصنوعات اور AI انضمامات کون سے خطرات پیدا کر سکتے ہیں. ہم ڈویلپرز کی بھرپور حوصلہ افزائی کرتے ہیں کہ وہ اپنی مخصوص ضروریات کی بنیاد پر ان پالیسیوں کو اپنائیں اور انہیں وسعت دیں اور انہیں دیگر حفاظتی اقدامات کے ساتھ یکجا کریں، جیسے کہ پروڈکٹ ڈیزائن کے فیصلے، صارف کے کنٹرولز، نوجوانوں کے لیے موزوں شفافیت، نگرانی کے نظام اور سوچ سمجھ کر دیئے گئے، عمر کے لحاظ سے مناسب جوابات.

ہمیں یقین ہے کہ زیادہ محفوظ AI سسٹمز کی تعمیر کے لیے کثیر سطحی گہرائی میں دفاع⁠ کا نقطہ نظر ضروری ہے. یہ پالیسیاں ہمارے اندرونی تجربے سے ماخوذ ہیں، لیکن یہ OpenAI کی اندرونی پالیسیوں یا حفاظتی اقدامات کی مکمل طور پر عکاسی نہیں کرتی ہیں.

آگے کا راستہ

ہم تعاون اور مسلسل بہتری کی حوصلہ افزائی کے لیے ان پالیسیوں کو ROOST ماڈل کمیونٹی⁠(نئی ونڈو میں کھلتا ہے) کے ذریعے اوپن سورس کے طور پر جاری کر رہے ہیں. تعاون کرنے، اپنی رائے دینے، یا نوعمروں کی حفاظت کی اضافی پالیسیز شیئر کرنے کے لیے، GitHub ریپوزٹری⁠(نئی ونڈو میں کھلتا ہے)ملاحظہ کریں.

ڈویلپرز اور ادارے ان پالیسیوں کو اپنی مخصوص ایپلیکیشنز کے مطابق ڈھال سکتے ہیں، انہیں مختلف زبانوں میں ترجمہ کر سکتے ہیں اور مزید خطرے کے شعبوں کا احاطہ کرنے کے لیے ان میں توسیع کر سکتے ہیں. وقت کے ساتھ، ہمیں امید ہے کہ یہ AI سسٹمز میں حفاظتی پالیسیوں کے نفاذ کے لیے ایک زیادہ مضبوط اور مشترکہ بنیاد فراہم کرنے میں سہولت فراہم کرے گا.

gpt-oss-safeguard کے ساتھ شروعات کرنے کے لیے، اسے Hugging Face⁠(نئی ونڈو میں کھلتا ہے) سے ڈاؤن لوڈ کریں.

پڑھتے رہیں

سب دیکھیں

طویل افق والے ماڈلز کے دور میں سیفٹی اور الائنمنٹ

حفاظت۲۰ جولائی، ۲۰۲۶

Why teens deserve access to safe AI — card image

نوعمروں کو محفوظ اے آئی تک رسائی کیوں ملنی چاہیے

حفاظت۱۶ جولائی، ۲۰۲۶

GPT-Red: مضبوطی کے لیے خود بہتری کو کھولنا

حفاظت۱۵ جولائی، ۲۰۲۶