مساعدة المطورين على بناء تجارب ذكاء اصطناعي أكثر أمانًا للمراهقين
تقديم مجموعة من سياسات سلامة المراهقين المصاغة في قالب مطالبات والمخصصة للاستخدام مع نموذج gpt-oss-safeguard
يسرنا اليوم الإعلان عن إطلاق سياسات سلامة(يفتح في نافذة جديدة) قائمة على المطالبات لتمكين المطورين من بناء آليات حماية ملائمة لأعمار المراهقين. هذه السياسات، التي جرى تطويرها لتتكامل مع نموذج السلامة مفتوح الأوزان gpt-oss-safeguard(يفتح في نافذة جديدة)، تجعل من السهل على المطورين صياغة متطلبات الأمان وتحويلها إلى أدوات تصنيف تقنية فعالة يمكن دمجها وتطبيقها في أنظمة العمل الحقيقية.
جاء إطلاقنا للنماذج بأوزان مفتوحة سعيًا وراء إتاحة القدرات المتطورة للذكاء الاصطناعي للجميع وتحفيز الابتكار الشامل. فنحن ننطلق من قناعة راسخة بأن السلامة والابتكار يسيران جنبًا إلى جنب، ومن حق المطورين الحصول ليس فقط على نماذج متميزة وقوية، بل وأيضًا على الأدوات والسياسات التي تضمن نشرها بأسلوب يتسم بالأمان والمسؤولية. وعليه، فقد قمنا بصياغة هذه السياسات لدعم جهود المطورين في حماية المستخدمين الصغار، مستندين في ذلك إلى مشورات قدمتها منظمات خارجية ذات مصداقية عالية، مثل Common Sense Media(يفتح في نافذة جديدة) وeveryone.ai(يفتح في نافذة جديدة).
إننا ندرك تمامًا أن احتياجات المراهقين تختلف عن احتياجات البالغين، مما يستوجب توفير طبقات إضافية من الحماية لهم. وتأتي هذه السياسات لتساعد المطورين على استيعاب تلك الاختلافات، وتصميم تجارب تجمع بين تمكين المستخدمين الصغار وضمان ملاءمة المحتوى لمتطلباتهم الخاصة.
لقد كان التزامنا ببناء تقنيات ذكاء اصطناعي تعزز الفرص المتاحة للصغار مع توفير بيئة آمنة لهم التزامًا طويل الأمد. وكجزء من هذه الجهود، أجرينا تحديثات على مواصفات النموذج(يفتح في نافذة جديدة)—وهي المعايير التوجيهية التي تضبط الأداء السلوكي المستهدف لنماذج OpenAI— لتتضمن معايير حماية المستخدمين دون سن الثامنة عشرة(يفتح في نافذة جديدة)، كما أطلقنا ضمانات حماية مدمجة في المنتجات مثل الرقابة الأبوية و تقدير العمر لتوفير حماية أفضل للمستخدمين الأصغر سنًا. إضافة إلى ذلك، طالبنا بوضع ميثاق حماية موحد للصناعة عبر المخطط الإرشادي لسلامة المراهقين.
يأتي إصدار اليوم استكمالاً لهذا الأساس الراسخ؛ فنحن نتيح سياسات السلامة هذه لمجتمع المطورين لدعمهم في تفعيل آليات حماية للصغار، مما يساعد في ترسيخ مبدأ إتاحة الوصول للجميع وتكافؤ الفرص ضمن بيئة العمل التقنية الخاصة بالنماذج مفتوحة الأوزان.
على الرغم من قدرة أدوات تصنيف السلامة، مثل gpt-oss-safeguard، على رصد المحتوى الضار، إلا أن فعاليتها تظل مرتهنة بوجود تعريفات واضحة وجلية لماهية هذا المحتوى. ومن الناحية العملية، يبرز أحد أكبر التحديات التي تواجه المطورين في صياغة سياسات تستوعب بدقة المخاطر الخاصة بالمراهقين، وتكون في الوقت ذاته قابلة للتطبيق بأسلوب متسق ومنتظم داخل أنظمة العمل الحقيقية.
حتى الأفرقة التي تتمتع بخبرة واسعة غالبًا ما تواجه تحديات في تحويل أهداف السلامة العامة إلى قواعد إجرائية دقيقة، لا سيما وأن هذا الأمر يستلزم الجمع بين الخبرة التخصصية في المجال والمعرفة العميقة بتقنيات الذكاء الاصطناعي. وقد يؤدي هذا القصور إلى ظهور ثغرات في منظومة الحماية، أو عدم الاتساق في إنفاذ القواعد، أو اللجوء إلى عمليات فلترة واسعة النطاق بشكل مفرط. لذا، تُعد السياسات الواضحة ومحددة النطاق ركيزة أساسية لبناء أنظمة سلامة فعّالة.
سعيًا منا لمواجهة هذه العقبات، أطلقنا مجموعة من سياسات السلامة(يفتح في نافذة جديدة) المصممة خصيصًا لتلائم المخاطر الشائعة التي يواجهها المراهقون، والتي استندنا في صياغتها إلى مراجعة دقيقة للأبحاث الحالية المتعلقة بالفوارق النمائية الفريدة لهذه الفئة العمرية. وقد تمت هيكلة هذه السياسات في صورة مطالبات يمكن استخدامها مباشرة مع نموذج gpt-oss-safeguard(يفتح في نافذة جديدة) ونماذج الاستدلال الأخرى، مما يُمكّن المطورين من تطبيق معايير سلامة متسقة عبر أنظمتهم بمزيد من السهولة واليسر.
تشمل النسخة الأولى من السياسات المطروحة ما يلي:
- المحتوى العنيف الصادم
- المحتوى الجنسي الصريح
- الأنماط والممارسات الجسدية المؤذية
- الأنشطة والتحديات الخطرة
- تقمص الأدوار الرومانسي أو العنيف
- السلع والخدمات المقيدة بالفئة العمرية
يمكن توظيف هذه السياسات في عمليات تصفية المحتوى في الوقت الفعلي، فضلًا عن استخدامها في التحليلات الجارية على المحتوى الذي ينشئه المستخدمون.
ومن خلال هيكلة هذه السياسات في صورة مطالبات، سيتمكن المطورون من دمجها بمرور الوقت وبسهولة أكبر ضمن مسارات العمل القائمة، وتطويعها لتلائم حالات الاستخدام الخاصة بهم، مع إمكانية تحديثها وتطويرها بشكل متكرر ومستمر.

لقد تعاونّا مع منظمات خارجية، من بينها Common Sense Media(يفتح في نافذة جديدة) وeveryone.ai(يفتح في نافذة جديدة)، بهدف إثراء مسار تطوير هذه السياسات. وقد ساهمت خبرات هذه الجهات في تحديد نطاق المحتوى الذي ينبغي تغطيته، وتعزيز هيكلية المطالبات، بالإضافة إلى تدقيق وتوضيح الحالات الاستثنائية الواجب مراعاتها عند تقييم هذه السياسات واختبار فعاليتها.
يعكس هذا العمل التزامًا مستمرًا بالتعاون مع الخبراء والمنظومة التقنية الأوسع نطاقًا، بهدف الارتقاء بسبل دعم أنظمة الذكاء الاصطناعي لفئة الشباب وتعزيز فاعليتها.
"لقد تمثلت إحدى أكبر الفجوات في مجال سلامة الذكاء الاصطناعي للمراهقين في الافتقار إلى سياسات إجرائية واضحة يمكن للمطورين الارتكاز عليها في بناء أنظمتهم؛ ففي كثير من الأحيان، يجد المطورون أنفسهم مضطرين للبدء من نقطة الصفر. وتساهم هذه السياسات القائمة على المطالبات في وضع حد أدنى جوهري لمعايير الأمان عبر المنظومة التقنية بأكملها، وبفضل طرحها كموارد مفتوحة المصدر، فإنه يمكن تطويعها وتحسينها بمرور الوقت. إننا نشعر بالتفاؤل لرؤية مثل هذه البنية التحتية وهي تُتاح على نطاق واسع، ونأمل أن تشكل حافزًا لإيجاد المزيد من نقاط الانطلاق المشتركة لسلامة الصغار في كافة قطاعات هذا المجال."
—روبي تورني، رئيس قسم الذكاء الاصطناعي والتقييمات الرقمية في مؤسسة Common Sense Media
"إن الجهود التي تسعى لجعل سياسات سلامة الشباب أكثر إجرائية هي جهود ذات قيمة عالية؛ لأنها تساعد في ترجمة معارف الخبراء إلى توجيهات يمكن توظيفها داخل الأنظمة الواقعية. وتعتبر سياسات المحتوى خطوة أولى هامة، كما أنها تفتح الآفاق أمام عمل أوسع نطاقاً حول الكيفية التي يمكن بها لسلوك النموذج أن يشكل المخاطر ذات الصلة بالشباب بمرور الوقت. وبإلهام من هذا العمل ومن أبحاثنا الخاصة، قامت مؤسسة everyone.ai(يفتح في نافذة جديدة) أيضًا بوضع سياسة سلوكية أولية تركز على مخاطر مثل الإقصاء والاعتماد المفرط."
—الدكتورة ماتيلد سيريولي، كبيرة العلماء في مؤسسة everyone.AI
إن هذه السياسات هي حجر الأساس الأولي، وهي لا تهدف لتقديم صياغة وافية أو قطعية لمعايير سلامة المراهقين، ولا تشكل كفالة تضمن سلامتهم بشكل كامل. وبما أن التطبيقات تختلف في مخاطرها ونوعية جمهورها وسياق استخدامها، فإن المطورين يمتلكون الرؤية الأعمق لفهم ما قد تشكله منتجاتهم وأنظمة الذكاء الاصطناعي المدمجة بها من مخاطر. ونحن ندعو المطورين بإصرار إلى تعديل هذه السياسات وتطويعها بناءً على ضرورات عملهم، والجمع بينها وبين ضمانات حماية أخرى كالخيارات التصميمية، وصلاحيات المستخدمين، ومعايير الشفافية التي تراعي احتياجات المراهقين، وآليات التتبع، والردود التفاعلية الرصينة والمتناسبة مع فئاتهم العمرية.
إننا نرى في منهجية الدفاع المتعدد الطبقات ركيزة أساسية لتطوير أنظمة ذكاء اصطناعي تتسم بمستويات أمان أعلى. وتستند هذه السياسات في جوهرها إلى تجربتنا المؤسسية الخاصة، بيد أنها لا تمثل الحجم الكلي للسياسات أو الضمانات الداخلية التي نطبقها في OpenAI.
نحن نطرح هذه السياسات كمصدر مفتوح من خلال مجتمع نماذج ROOST Model Community (RMC)(يفتح في نافذة جديدة)، بهدف تشجيع التعاون والتحسين التطويري المستمر. وللمساهمة في هذا العمل، أو تقديم الملاحظات، أو مشاركة سياسات إضافية تتعلق بسلامة المراهقين، يرجى زيارة مستودع RMC على منصة GitHub.(يفتح في نافذة جديدة)
وتستطيع الشركات والمطورون تطويع هذه السياسات بما يتوافق مع حالات الاستخدام الخاصة بهم، ونقلها إلى لغات متعددة، وتطويرها لتغطي مجالات مخاطر أوسع. إننا نتطلع إلى أن يسفر ذلك مستقبلًا عن بناء ركيزة مشتركة وقوية لتطبيق معايير الأمان داخل بيئات وأنظمة الذكاء الاصطناعي.
للبدء باستخدام نموذج gpt-oss-safeguard، يمكنك تنزيله من Hugging Face(يفتح في نافذة جديدة).


