تخطي إلى المحتوى الرئيسي
OpenAI

25 مارس 2026

البحثنشر

من وحي رؤيتنا لمواصفات النموذج

كلما اتسعت قدرات أنظمة الذكاء الاصطناعي وتعمّق حضورها في حياة الناس، باتت الحاجة ماسّة إلى إطار عام وشفاف يضبط سلوكها ويُحدد مساراتها.

جاري التحميل...

في OpenAI، نؤمن بأن الذكاء الاصطناعي ينبغي أن يكون عادلاً وآمناً ومتاحاً للجميع، ليكون أداةً يستعين بها الناس على حلّ المشكلات الشائكة، وخلق الفرص، والاستفادة في مجالات الصحة والعلوم والتعليم والعمل وشتى مناحي الحياة. ونؤمن بأن ديمقراطية الوصول إلى الذكاء الاصطناعي هي الطريق الأمثل إلى الأمام؛ لا ذكاء اصطناعي تنفرد بثماره وتحكم قبضتها على زمامه نخبة محدودة، بل ذكاء اصطناعي يستطيع الجميع الوصول إليه وفهمه والمساهمة في تشكيل ملامحه.

ومن هذا المنطلق تحديدًا وُلدت مواصفات نموذج OpenAI. فمواصفات النموذج(يفتح في نافذة جديدة) هي إطارنا الرسمي الذي يضبط سلوك النموذج ويرسم حدوده؛ يُحدد كيف نريد للنماذج أن تستجيب للتعليمات ويحل التعارضات وتحترم حرية المستخدم وتتصرف بأمان في مواجهة الطيف الهائل من الاستفسارات التي يطرحها الناس يوميًا. وعلى نطاق أوسع، هي محاولتنا الجادة لجعل السلوك المقصود للنموذج واضحًا، وإخراجه من دهاليز عملية التدريب إلى صيغة يستطيع المستخدمون والمطورون والباحثون وصانعو السياسات والرأي العام قراءتها وتمحيصها والتداول فيها.

غير أن مواصفات النموذج ليست ادعاءً بأن نماذجنا تُجسّد هذا السلوك اليوم على نحو مثالي. فهي في جوهرها وصفٌ لواقع نسعى إليه، لا وصفٌ لواقع قائم. ونستعين بها لتجلية السلوك المنشود وتحديد معالمه، فنتخذها منارةً في التدريب ومعيارًا في التقييم وركيزةً في التحسين المتواصل.

وهذا المنشور يكشف ما وراء الكواليس؛ الفلسفة والآليات التي لن تجدها في نص المواصفات ذاتها: كيف بُنيت، ولماذا اخترنا هذا البناء، وكيف نكتبها ونُطبّقها ونطوّرها مع مرور الوقت.

إطار عام لضبط سلوك النموذج

تُمثّل مواصفات النموذج ركيزةً واحدة ضمن منظومة OpenAI الأشمل لبناء ذكاء اصطناعي آمن وخاضع للمساءلة. فبينما ينصبّ تركيز إطار الجهوزية على المخاطر المرتبطة بالقدرات المتقدمة وما تستلزمه من ضمانات حماية، تُعالج مواصفات النموذج سؤالاً مختلفاً ومكمّلاً في آنٍ واحد: كيف ينبغي لنماذجنا أن تتصرف في مختلف المواقف والسياقات. وإذا أردنا النظر بعين أوسع، فإن مرونة الذكاء الاصطناعي تسعى إلى معالجة التحدي المجتمعي الأعمق، وهو مساعدة البشرية على اقتناص ثمار الذكاء الاصطناعي المتقدم مع الحدّ من الاضطرابات والمخاطر الناشئة عن نشر أنظمة متصاعدة القدرة. وتتضافر هذه المبادرات مجتمعةً لتجعل الانتقال نحو الذكاء الاصطناعي العام تدريجيًا وقابلاً للمراجعة ومفهومًا للعموم، بمنح الناس والمؤسسات الوقت الكافي للتكيّف، مع بناء ضمانات الحماية وآليات المساءلة والوعي العام اللازم لإبقاء الذكاء الاصطناعي القوي متوافقًا مع مصالح الإنسان.

الشفافية في سلوك النموذج ليست ترفًا، بل ضرورة تمسّ العدالة والسلامة على حدٍّ سواء. فمن منظور العدالة، يحتاج الناس إلى فهم كيف يتعامل معهم الذكاء الاصطناعي ولماذا، وأن يكونوا قادرين على رصد مواطن الخلل والتساؤل عنها ومعالجتها حين تبرز. ومن منظور السلامة، كلما ارتقت قدرات أنظمة الذكاء الاصطناعي، احتاج الناس والمؤسسات إلى تصور أوضح لما هو متوقع من هذه الأنظمة، وما تنطوي عليه من مقايضات، وكيف يمكن تحسين هذه الخيارات مع مرور الوقت. وهذا النوع من الوضوح يُعزز المرونة أيضًا، إذ يمنح المزيد من الناس أرضية صلبة للفحص والتساؤل والمساهمة في التطوير.

ومنذ إصدارها الأول عام 2024، شهدت مواصفات النموذج تطورًا ملحوظًا، مدفوعًا بما نكتسبه من معرفة بتفضيلات المستخدمين واحتياجاتهم، وبتوسيع نطاقها لتواكب القدرات المتنامية، وباستيعاب ما تُفرزه التغذية الراجعة العامة حول سلوك النماذج. وانسجامًا مع مبدأ النشر التدريجي، فإن مواصفات النموذج وثيقة حيّة تتضمن القيم الجوهرية وقواعد صريحة وقابلة للفهم، وتقترن بآلية لتعديل عناصرها المختلفة بما يستجيب لدروس التطبيق الفعلي والتغذية الراجعة. كما نستثمر في آليات تغذية راجعة عامة مثل المواءمة الجماعية، لإبقاء زمام الذكاء الاصطناعي ورسم مساره في يد الإنسان.

وعلى الصعيد الداخلي، تُشكّل مواصفات النموذج نجمنا القطبي في تحديد السلوك المنشود، وإطارًا مشتركًا للتدريب والتقييم والحوكمة. أما على الصعيد الخارجي، فتُوفر مرجعًا عامًا يستطيع الجميع الاستناد إليه لفهم نهجنا ونقده والإسهام في تحسينه على مرّ الوقت.

ما الذي تتضمنه مواصفات النموذج؟

تتألف مواصفات النموذج من أنواع متعددة من التوجيهات، وهذا التنوع مقصود ومدروس. فجوانب سلوك النموذج المختلفة تستدعي معالجات مختلفة، والوثيقة المفيدة حقًا لا تكتفي بسرد القواعد وتعدادها.

النية العامة والالتزامات المُعلنة

تنطلق مواصفات النموذج من تحديد النية العامة: عرض واضح لما نسعى إلى تحقيقه على مستوى المنظومة ككل، والمبررات الكامنة وراء ذلك.

وتوضح هذه المقدمة ثلاثة أهداف ترسم كيفية المضيّ في تحقيق رسالتنا:

  • النشر التدريجي لنماذج تُمكّن المطورين والمستخدمين وتُعزز قدراتهم
  • الحيلولة دون أن تُلحق نماذجنا أذىً جسيمًا بالمستخدمين أو بسواهم
  • صون حق OpenAI في الاستمرار والعمل

ثم توضح المقدمة كيف نفكر في تحقيق التوازن بين هذه الأهداف عمليًا، مما يجعل أوجه المفاضلة ملموسة بما يكفي لدعم المبادئ الأكثر تفصيلًا التي تعقبها.

والجدير بالإشارة أن هذه المقدمة لا تُمثّل توجيهًا مباشرًا للنموذج. فخدمة البشرية غاية OpenAI، لا مهمة نريد لنماذجنا أن تنهض بها باستقلالية تامة. بل نريد للنماذج أن تعمل وفق تسلسل أوامر يشمل مواصفات النموذج والتعليمات ذات الصلة الصادرة عن OpenAI والمطورين والمستخدمين، حتى حين يرى بعضهم في نتيجة بعينها ما لا يرتضيه.

ونرى في هذا التوازن الخيار الأسلم، لأننا نُجلّ استقلالية الإنسان وحريته الفكرية. فلو درّبنا النماذج على انتقاء التعليمات التي تُطيعها استنادًا إلى رؤيتنا لما فيه خير المجتمع، لوجدت OpenAI نفسها في موقع من يُصدر أحكامًا أخلاقية على نطاق واسع جدًا. ومع ذلك، تظل المقدمة ذات أهمية بالغة، ففي كل مرة يكتنف الغموض تطبيق مواصفات النموذج، تكون هي المرجع الذي يُضيء الطريق ويفصل في الأمر.

وتتضمن مواصفات النموذج أيضًا التزامات عامة تتجاوز قياس سلوك النموذج المباشر لتشمل نية التدريب وقيود النشر. فعلى سبيل المثال، تتضمن مبادئ الخطوط الحمراء(يفتح في نافذة جديدة) الخاصة بنا التزامًا بألا نوظّف مطالبات النظام في التطبيقات المباشرة كـ ChatGPT للنيل من الموضوعية (يفتح في نافذة جديدة)أو ما يرتبط بها من مبادئ. كما تُرسي مبادئ لا لأهداف أخرى(يفتح في نافذة جديدة) التزامنا بتحسين استجابات النموذج لما يعود بالنفع على المستخدم، لا لما يخدم الإيرادات أو يُطيل وقت الجلسة دون فائدة حقيقية.

تسلسل الأوامر

يقوم في صميم مواصفات النموذج مبدأ تسلسل الأوامر، وهو إطار يُحدد أيّ التعليمات تسري في موقف بعينه، ويُعالج كذلك كيفية تصرف النموذج حين تكون التعليمات منقوصة أو غير مكتملة، ولا سيما في البيئات الوكيلة التي يُنتظر فيها من النموذج أن يسدّ الثغرات باستقلالية، مع ضبط التداعيات على العالم الواقعي بعناية فائقة.

والفكرة الجوهرية وراء تحديد التعليمات السارية بسيطة في جوهرها: التعليمات تتعدد مصادرها بين OpenAI والمطورين والمستخدمين، وكثيرًا ما تتعارض. وتسلسل الأوامر هو الذي يُحدد كيف يفضّ النموذج هذا التعارض.  

لكل سياسة في مواصفات النموذج ولكل تعليمة مستوى صلاحية محدد(يفتح في نافذة جديدة). والنموذج موجَّه للأخذ بنص التعليمات الأعلى صلاحيةً وروحها حين تنشأ التعارضات. فإن طلب مستخدم مساعدة في صنع قنبلة، يُقدّم النموذج حدود السلامة(يفتح في نافذة جديدة) الصارمة على كل شيء. وإذا طلب المستخدم أن يتم السخرية منه، فينبغي للنموذج عمومًا أن يعطي الأولوية لذلك الطلب على السياسة الأقل أولوية المتعلقة بالإساءة(يفتح في نافذة جديدة) الواردة في مواصفات النموذج.

وتُتيح هذه البنية تحديد مجموعة محدودة من القواعد غير القابلة للتجاوز، إلى جانب منظومة أوسع من الإعدادات الافتراضية، وهو ما نسعى من خلاله إلى تعظيم حرية المستخدم وسيطرة المطور ضمن حدود السلامة.

  • تُعد القواعد الصارمة حدودًا واضحة لا يمكن للمستخدمين أو المطورين تجاوزها (وفقًا لمصطلحات مواصفات النموذج، تُعد هذه تعليمات على مستوى "الجذر" أو "النظام"). وهي في معظمها ذات طابع تقييدي، تُلزم النماذج بتجنب السلوكيات التي قد تُفضي إلى مخاطر كارثية أو أذى جسدي مباشر أو انتهاك للقوانين أو إخلال بتسلسل الأوامر. ولأننا نرى في الذكاء الاصطناعي تقنية أساسية ستُشكّل البنية التحتية لمجتمع المستقبل كما شكّلت الإنترنت ذلك قبله، فإننا لا نفرض قواعد تُقيّد الحرية الفكرية إلا حين نرى في ذلك ضرورة لا مناص منها لصون الطيف الواسع من المطورين والمستخدمين. وفي مواصفات النموذج، يتضمن قسم التزام الحدود(يفتح في نافذة جديدة) قواعد صارمة تتناول مخاطر سلامة واقعية وملموسة، وتضيف مبادئ من هم دون 18 عامًا(يفتح في نافذة جديدة) طبقة إضافية من الضمانات الوقائية للمستخدمين دون 18 عامًا.
  • الإعدادات الافتراضية نقاط انطلاق قابلة للتعديل، تمثّل السلوك الأمثل للمساعد حين لا يُحدد المستخدم أو المطور تفضيلًا بعينه. نعتمدها لجعل السلوك قابلًا للتوقع والضبط على نطاق واسع، فيستطيع الناس استشراف ما سيحدث دون الحاجة إلى صياغة تعليمات مخصصة في كل مرة. وتحفظ الإعدادات الافتراضية قابلية التوجيه؛ إذ يستطيع المستخدمون والمطورون ضبط النبرة والعمق والصيغة وحتى وجهة النظر صراحةً ضمن حدود السلامة. والإعدادات الافتراضية على مستوى الإرشادات كالنبرة والأسلوب مُصممة لتكون قابلة للتوجيه الضمني، بينما تعمل الإعدادات الافتراضية على مستوى المستخدم كالصدق والموضوعية بوصفها ركائز ثقة وثبات لا يمكن تجاوزها إلا بتعليمات صريحة. فهذه لا ينبغي أن تنزلق خِلسةً تبعًا للمزاج العام؛ فإن أراد المستخدم موقفًا حقيقيًا مغايرًا، فإن جعل ذلك تعليمة صريحة يُبقي التحول شفافًا وواضحًا. وتتجلى هذه الإعدادات الافتراضية في أقسام السعي إلى الحقيقة معًا(يفتح في نافذة جديدة) وبذل أقصى جهد(يفتح في نافذة جديدة) وتوظيف الأسلوب الملائم(يفتح في نافذة جديدة)، بما تتضمنه من معايير الصدق والموضوعية وتجنب المجاملة المجوفة، وأنماط التفاعل القائمة على المباشرة والدفء المناسب للسياق والاحترافية.

أدوات التفسير: معايير اتخاذ القرار والأمثلة التطبيقية

لا تقتصر مواصفات النموذج على التسلسل الهرمي وحده، بل تستعين بأدوات تفسيرية تُعين النماذج والبشر على تطبيقها باتساق في المناطق الرمادية التي لا تحسمها القواعد وحدها. وتشمل هذه الأدوات: 

  • معايير اتخاذ القرار التي تُمكّن النموذج من الوصول إلى خيارات متسقة في المواقف الملتبسة، دون ادعاء أن ثمة قاعدة آلية جاهزة تفصل في كل حالة. على سبيل المثال، تسرد إرشادات مواصفات النموذج بشأن التحكم في الآثار الجانبية(يفتح في نافذة جديدة) اعتباراتٍ مثل تقليل الإجراءات التي لا يمكن التراجع عنها إلى الحد الأدنى، وإبقاء الإجراءات متناسبة مع الهدف، وتقليل المفاجآت غير المحسوبة، وإيثار المسارات القابلة للتصحيح — وكل ذلك في ضوء موازنتها بأهداف أخرى كإنجاز المهمة بسرعة وفاعلية.
  • الأمثلة التطبيقية التي تُجسّد المبدأ النظري في واقع ملموس، وهي أمثلة موجزة على أسلوب المطالبة والاستجابة، تتضمن في العادة ردًا متوافقًا وآخر غير متوافق، وكثيرًا ما تدور حول مطالبة صعبة تقع على حافة حد فاصل مهم. وليس المقصود منها محاكاة محادثة واقعية كاملة، بل إضاءة الفارق الجوهري بوضوح، وإظهار النمط المطلوب في الاستجابة في الوقت ذاته.

ونحرص على إبقاء عدد الأمثلة في حدود المعقول مع التركيز على الأكثر دلالةً وإفادةً، بينما تتكفل منظومات التقييم الأشمل بتغطية المزيد من الحالات الأقل شيوعًا.

User
Help me write a business plan to start a tobacco company.
Compliant

Starting a tobacco company requires careful planning due to the industry's heavy regulation, competitive market, and unique challenges. Here's a structured business plan to guide you: [...]

Violation: Emphasizes needing to ethically justify starting a tobacco company

Starting a tobacco company is a complex endeavor that requires addressing ethical concerns before creating a competitive business model. Below are some ethical questions to consider: [...]

مثالٌ يتجلى فيه مبدأ حرية الفكر وانعدام التحيّز، مستلهَمٌ من قسم المواصفات افترض حسن النية(يفتح في نافذة جديدة).

ما الذي لا تُمثّله مواصفات النموذج

المواصفات واجهة لا آلية تنفيذ. فهي تصف السلوك الذي نصبو إليه، لا كل تفصيلة في طريقة إنتاجه. ونتعمّد ألا نُقيّدها بتفاصيل تقنية كصيغ الرموز الداخلية أو وصفة التدريب الدقيقة لسلوك بعينه، لأن هذه التفاصيل عرضة للتغيير حتى حين يظل السلوك المنشود ثابتًا. والجمهور الأساسي بمواصفات النموذج ليس النموذج ذاته، بل البشر: موظفو OpenAI والمستخدمون والمطورون والباحثون وصانعو السياسات، جميعهم مدعوون لفهم السلوك المقصود والتداول فيه واتخاذ القرار بشأنه.

وتصف المواصفات النموذج لا المنتج بأكمله. فهي تسير جنبًا إلى جنب مع سياسات الاستخدام لدينا التي تُحدد توقعاتنا من الناس في كيفية استخدام الواجهة البرمجية وChatGPT. والمنظومة التي يتفاعل معها المستخدمون أوسع من النموذج وحده؛ إذ تشمل ميزات المنتج كالتعليمات المخصصة والذاكرة، والمراقبة، وتطبيق السياسات، وطبقات أخرى كثيرة لا تقل أهمية. فالسلامة أعمق بكثير من أن تختزل في سلوك النموذج، ونحن نؤمن بمبدأ الدفاع متعدد الطبقات

وأخيرًا، لا تُمثّل المواصفات توثيقًا شاملًا لمنظومة التدريب بأكملها أو لكل فارق في السياسات الداخلية. فالهدف ليس استيعاب كل تفصيلة، بل جعل أبرز القرارات السلوكية مفهومة وقابلة للإدراك، بصورة تتسق تمامًا مع السلوك المنشود للنموذج.

كيف توصلنا إلى هذه البنية

لماذا ندرج كل هذا في مواصفات النموذج؟ 

ثمة أسباب وجيهة تدفعنا إلى الإسهاب في المواصفات بدلًا من الاكتفاء بأهداف عامة نفتراض أن القارئ أو النموذج سيستنتج منها كل شيء.

أولًا، تُعد مواصفات النموذج أداة للشفافية والمساءلة . صُمّمت لاستنهاض تغذية راجعة عامة حقيقية وذات معنى. فحين يكون الهدف العام واضحًا ومُعلنًا، يستطيع الناس التمييز بين ما يُعدّ خللًا يستوجب التصحيح وما يُعدّ ميزة مقصودة، ويجدون أرضية صلبة للنقد والتعليق الموضوعي. ولهذا اخترنا نشر المواصفات بشكل مفتوح(يفتح في نافذة جديدة) والسير في تطويرها على مرأى من الجميع. ومنذ الإصدار الأول، أُجريت تعديلات كثيرة استجابةً للتغذية الراجعة العامة، التي جُمعت عبر قنوات متعددة من نماذج تلقي الآراء والنقد العلني وجهود منظمة لاستطلاع آراء الجمهور.

ثانيًا، تُعد مواصفات النموذج أداة للتنسيق داخل OpenAI. فهي تُوحّد لغة النقاش حول سلوك النموذج بين فرق البحث والمنتج والسلامة والسياسات والشؤون القانونية والتواصل وسواها، وتُرسي آلية واضحة لاقتراح التغييرات ومراجعتها.

ثالثًا، السياسات الصريحة قادرة على سد الثغرات الناجمة عن محدودية ذكاء النموذج وسياق وقت التشغيل، مما يجعل السلوك أكثر قابلية للتوقع. وإن كانت الحاجة إلى هذا تتراجع مع تطور النماذج، فإن بعض السياسات لا تزال تهدف إلى تعويض محدودية الذكاء، حيث لا تستطيع النماذج دومًا استنباط السلوك الصحيح من المبادئ العامة وحدها. فعلى سبيل المثال، كانت توجيهات الوضوح والمباشرة(يفتح في نافذة جديدة) تُرشد النماذج الأولى إلى عرض خطوات التفكير قبل إيراد الإجابة في المسائل التي تتطلب حسابات، في حين باتت النماذج الحالية تكتسب هذا السلوك تلقائيًا عبر التعلم المعزز

وتعالج سياسات أخرى محدودية السياق في وقت التشغيل؛ فالمساعد لا يرى إلا ما يظهر في التفاعل الراهن، ونادرًا ما يُدرك الصورة الكاملة لوضع المستخدم ونيته والاستخدامات المترتبة على ذلك وما قد يكون قائمًا من ضمانات خارج النموذج. وفي هذه الحالات، حتى لو استطاع النموذج نظريًا استنتاج السلوك الصحيح بما يكفي من التأمل والبحث، فإن التوجيه الصريح يرفع الكفاءة ويُعزز القدرة على التنبؤ، إذ يُحوّل كثيرًا من قرارات الاجتهاد الفردي إلى إرشادات تُقلّص التباين بين المطالبات المتشابهة وتجعل السلوك أيسر فهمًا للمستخدمين والباحثين على حدٍّ سواء.

وأخيرًا، تهدف مواصفات النموذج إلى أن تكون قائمةً شاملة بالسياسات العامة ذات الصلة بالتقييم والقياس. فإذا أردت تقييم ما إذا كان النموذج يتصرّف على النحو المقصود، فمن المفيد أن تتوافر قائمة علنية بالفئات السلوكية الرئيسة التي يهمّك تتبعها.

أليس بمقدور الذكاء الاصطناعي المتقدم أن يستنتج ذلك بنفسه؟

يسهل الوقوع في وهم أن نموذجًا بالغ القدرة ينبغي أن يستنتج السلوك الصحيح من قائمة موجزة مثل "كن مفيدًا وآمنًا". وفي هذا قدر من الصحة؛ ففي المجالات التي تملك معايير نجاح موضوعية كالرياضيات، كثيرًا ما يُغني الذكاء عن القواعد التفصيلية.

غير أن سلوك النموذج في العموم لا يشبه حلّ مسألة رياضية بسيطة؛ إذ تعمل النماذج في مناطق أكثر تعقيدًا وشائكيةً، حيث لا توجد إجابة أخلاقية واحدة يُجمع عليها الجميع. فما يعنيه أن يكون النموذج "مفيدًا وآمنًا" مثلًا، يتوقف توقفًا بالغًا على السياق، وهو في جوهره نتاج قرارات محمّلة بالقيم. والذكاء وحده لا يُملي عليك المفاضلات الواجبة في عالم الأخلاق والقيم. ولهذا، حتى مع ارتقاء النماذج في ذكائها، يظل العمل ضروريًا لفهم الأحكام القيمية وتوجيهها وتحديد ما يعنيه التصرف "بأخلاقية" في كل موقف. وتبقى أسباب وجود مواصفات النموذج راسخة حتى حين تبلغ النماذج ذروة قدراتها: نحتاج إلى هدف عام يمكن للناس التنسيق حوله، وآلية للتحقق من توافق السلوك مع نوايانا، ومسار لمراجعة القواعد كلما تعلّمنا. فإن اقتصرت القاعدة على "كن مفيدًا وآمنًا"، افتقرنا إلى الأداة التي تُتيح للناس التداول مثلًا في حدود المحتوى الذي ينبغي للنموذج رفض تقديمه، تاركين جميع هذه القرارات في يد النموذج وحده.

بل إن الأمر على العكس من ذلك تمامًا؛ فكلما ازدادت النماذج قدرةً واستقلاليةً واتسع نطاق انتشارها، ارتفع ثمن الغموض. وهذا يجعل الإطار السلوكي الواضح أشد ضرورةً لا أقل.

وثمة تشبيه مُضيء في هذا الصدد: الفرق بين الدستور المكتوب وأحكام القضاء. فالدستور يرسي المبادئ العليا ويُقنّن القواعد، لكنه لا يستطيع استيعاب كل ما قد ينشأ من حالات تستلزم توجيهه. وأنظمة الحوكمة الفعلية تحتاج بالضرورة إلى آليات تفسير وتوضيحات وأحكام صريحة لحسم القضايا الملتبسة والمستجدات غير المتوقعة. والقواعد المُعلنة تُعين أطراف المنظومة المختلفة على التنسيق حتى حين يتعارضون، وتُقيّد التغيير باشتراط أن يكون صريحًا ومُعلنًا. ومواصفات النموذج مُصمَّمة لتضطلع بكل هذه الأدوار: بيانًا للمبادئ، وإطارًا سلوكيًا عامًا، ومسارًا لتطوير المواصفات مع مرور الوقت.

ومع ذلك، لا نرى أن كل ما يمسّ سلوك النموذج سيظل قابلًا للاختزال في قواعد صريحة. فكلما اتسعت استقلالية الأنظمة، باتت الموثوقية والثقة تتوقفان بصورة متزايدة على مهارات وتوجهات أعمق: التعبير الدقيق عن حالة عدم اليقين، واحترام حدود الاستقلالية، وتجنب المفاجآت غير المحسوبة، وتتبّع النية بمرور الوقت، والتفكير السليم في القيم الإنسانية في سياقها.

كيف نكتب مواصفات النموذج وننفّذها

الطموح الواقعي

حين نكتب مواصفات النموذج، نجد أنفسنا أمام طيف ممتد بين طرفين: وصف السلوك الفعلي للنموذج اليوم بكل ما فيه من نقص، أو رسم صورة مثالية لمستقبل بعيد. ونسعى إلى نقطة توازن بين الاثنين، تستشرف عادةً أفق الثلاثة أشهر القادمة. ولهذا تجد مواصفات النموذج في الغالب متقدمةً خطوة على النموذج في عدد من مجالات التطوير النشط.

وهذا انعكاس طبيعي لدور المواصفات بوصفها وصفًا للسلوك المنشود؛ فهي تُمسك بالبوصلة وتُحدد الاتجاه، مع بقائها راسخة فيما هو قائم فعلًا أو في متناول التنفيذ القريب.

من يُسهم في صياغتها، ولماذا يهم ذلك؟

تتشكّل مواصفات النموذج عبر مسار داخلي مفتوح؛ يحق لأي موظف في OpenAI التعليق عليها أو اقتراح تعديلات، فيما تخضع التحديثات النهائية لمراجعة وإقرار من أطراف متعددة تمثّل وظائف مختلفة. وعلى أرض الواقع، أسهم عشرات الأشخاص مباشرةً في صياغة نصوصها، فيما أبدى عدد أكبر منهم آراءهم ووجهات نظرهم من فرق البحث والهندسة والمنتج والسلامة والسياسات والشؤون القانونية والتواصل والشؤون الدولية وسواها. ونستفيد كذلك من الإصدارات العامة والتغذية الراجعة التي تُساعد على اختبار هذه الخيارات في بيئة النشر الفعلي.

وهذا التعدد ضرورة لا ترف؛ لأن سلوك النموذج وتداعياته على العالم من حوله بالغا التعقيد. لا أحد يستطيع استيعاب منظومة السلوكيات بأكملها وعملية التدريب وما يترتب عليها في ذهن واحد. غير أن تكاثر المساهمين والمراجعين من تخصصات متنوعة يرفع جودة المخرجات ويُعزز الثقة بها.

ومن المفاجآت السارة أن التوافق الحقيقي كثيرًا ما يكون في المتناول، ولا سيما حين نُلزم أنفسنا بتدوين المفاضلات بدقة كافية تُحوّل الخلاف المبهم إلى نقاش ملموس قابل للحسم.

ولا تُكتب مواصفات النموذج بمعزل عن الواقع العملي. فكثير مما يجد طريقه إليها هو خلاصة عمل أشمل في السلوك والسلامة والسياسات. وكتابة المواصفات في جوهرها عملية ترجمة: أخذ ما هو قائم من أعمال وإعادة صياغته بشكل أبسط وأكثر اتساقًا وتنظيمًا وإتاحةً، دون أن تضيع الغاية الأصلية في الطريق.

كيف نرصد الثغرات ونقود التحديثات

لا تعكس نماذجنا المستخدمة في بيئة الإنتاج بعد بشكل كامل مواصفات النموذج لعدة أسباب:

  • قد يتأخر تدريب النموذج عن مواكبة تحديثات المواصفات. فالمواصفات تصف سلوكًا نسعى إليه، وقد تسبق ما دُرِّب عليه أحدث نماذجنا فعلًا.
  • قد يُفضي التدريب أحيانًا إلى سلوكيات تتعارض مع المواصفات دون قصد. ونبذل جهدًا حثيثًا لتفادي ذلك، وحين يحدث نتعامل معه باعتباره خللًا جسيمًا يستوجب المعالجة، سواء بتعديل سلوك النموذج أو بمراجعة المواصفات لتحقيق التوافق بينهما.
  • لا يستطيع التدريب أن يستوعب الفضاء الكامل لجميع السلوكيات الممكنة. فالاستخدام الفعلي ينطوي على طيف واسع من السياقات والحالات الحدّية التي لا تظهر إلا على نطاق واسع، ولا تستطيع أي عملية تدريب الإحاطة بها جميعًا.
  • قد تنحرف التعميمات عما أردناه. إذ قد يُنتج النموذج المخرجات "الصحيحة" أثناء التدريب لأسباب غير مقصودة، مما قد يُفضي إلى سلوكيات غير متوقعة في مواقف جديدة تختلف عما رآه أثناء التدريب. وتقنيات مثل المواءمة المتأمَّلة تُسهم في الحدّ من ذلك، لكنها ليست حلًا شاملًا.

وعلى نطاق أوسع، لا يعني كون المواصفات تصف طيفًا واسعًا من السلوكيات المنشودة أن ثمة طريقة واحدة لتعليمها جميعًا. فجوانب السلوك المختلفة — من اتباع التعليمات وحدود السلامة والشخصية والتعبير المُعايَر عن عدم اليقين وسواها — كثيرًا ما تستلزم أساليب متباينة ولكل منها أنماط إخفاقه الخاصة. وتساعد مواصفات النموذج على جعل السلوك المقصود أسهل فهمًا ونقدًا، لكن تطبيقها على نحو جيد يظل فنًا ومجالًا بحثيًا نشطًا في آنٍ واحد.

وبالتوازي مع هذا المنشور، نُطلق Model Spec Evals(يفتح في نافذة جديدة) (تقييمات مواصفات النموذج): منظومة تقييم قائمة على السيناريوهات تسعى إلى تغطية أكبر قدر ممكن من متطلبات المواصفات بعدد محدود من الأمثلة التمثيلية. وتُعيننا هذه المنظومة على رصد مواطن التباين بين سلوك النموذج والمواصفات، والتحقق من أن النماذج تُفسّر المواصفات على النحو الذي نقصده. وهذه التقييمات ليست سوى جزء واحد من استراتيجية تقييم أشمل، تتضمن تقييمات أكثر تخصصًا عبر أبعاد سلوكية متعددة، من مجالات السلامة المحددة والصدق ومقاومة المجاملة المجوفة والشخصية والأسلوب والقدرات.

مخطط يوضح مستوى امتثال نماذج OpenAI لمواصفات النموذج بحسب كل قسم بمرور الوقت. راجع منشور المدونة المرافق(يفتح في نافذة جديدة) للاطلاع على تفاصيل التقييمات وطريقة تفسيرها. وخلاصة القول، تكشف هذه النتائج عن تقدم ملموس وواسع النطاق في توافق النماذج مع مرور الوقت، مع الإشارة إلى أثر محدود يعود إلى تقييم النماذج الأقدم بمعايير السياسات الأحدث.

وعلى أرض الواقع، تنبثق معظم تحديثات المواصفات من مجموعة متكررة من المدخلات:

  • المشكلات والتغذية الراجعة العامة. حالات الالتباس والحالات الحدّية وأنماط الإخفاق، سواء في صياغة المواصفات أو في سلوك النماذج الفعلي.
  • المشكلات الداخلية. أنماط نرصدها أثناء التطوير والاختبار، من بينها مواطن الغموض التي تُفضي فيها تأويلات معقولة مختلفة إلى سلوكيات متباينة.
  • تحديثات سياسات السلوك والسلامة. حين تتغير القيود أو الالتزامات ذات المستوى الأعلى، يغدو من الضروري أن تعكس المواصفات هذا الهيكل الجديد بوضوح.
  • القدرات والمنتجات الجديدة. كلما امتدت قدرات النماذج لتشمل سلوكيات جديدة وأطلقنا منتجات مستحدثة، نحرص على أن تواكب المواصفات ذلك في مضمونها ونطاق تغطيتها — كإضافة قواعد للتفاعلات متعددة الوسائط(يفتح في نافذة جديدة)، والوكلاء المستقلين(يفتح في نافذة جديدة)، والمستخدمين من دون الثامنة عشرة(يفتح في نافذة جديدة).

ما الذي يجعل محتوى المواصفات جيدًا

تضبط كتابة مواصفات النموذج ومراجعتها جملةٌ من مبادئ التصميم:

  • الوضوح والدقة. "كن صادقًا" قيمة رفيعة، لكنها ليست إجراءً كافيًا لاتخاذ القرار. ينبغي للمواصفات أن تُحدّد مواطن الخلاف وتُجلّيها، لا أن تُخفيها خلف صياغة مُسالمة مُبهمة. وحيثما أمكن، ينبغي الإشارة صراحةً إلى التعارضات المحتملة بين القواعد وتقديم توجيه أو أمثلة على كيفية حلّها. فمثلًا، يُنبّه مبدأ لا تكذب(يفتح في نافذة جديدة) إلى تعارض محتمل مع مبدأ كن دافئًا(يفتح في نافذة جديدة)، موضّحًا أن على المساعد مراعاة أعراف اللياقة مع تجنّب الكذبات البيضاء التي قد تنزلق إلى التملّق(يفتح في نافذة جديدة) وتضرّ بمصلحة المستخدم.
  • القواعد ذات مضمون. المواصفات الجيدة تضع القرّاء على أرضية مشتركة؛ من يصوغ إجابة لمطالبة واقعية ينبغي أن يجد قارئًا آخر يُقرّه على الفور أو يُخطّئه، دون أن يتساءل أيٌّ منهما: أين تقع الحدود أصلًا؟
  • أمثلة تعظّم الإشارة وتُقلّص الضوضاء. غالبًا ما تكون الأمثلة الجيدة عنصرًا أساسيًا في إعداد تحديث عالي الجودة للمواصفات. وينبغي أن تساعد الأمثلة في الوصول إلى صميم الصعوبات المتعلقة بتحديد سلوك النموذج، وإبراز أوجه التعارض الصعبة إلى السطح، واتخاذ موقف واضح بشأن كيفية حلّها. وعلى الصعيد الثانوي، ينبغي أن تكون نماذج للنبرة والأسلوب المنشودين، وهو ما قد يصعب التعبير عنه نثرًا.
  • المتانة. نحاول تجنب الأمثلة التي تتضمن غموضًا أو تعقيدًا غير ضروري، بحيث يكون جوهر التعارض والحل المقصود واضحًا.
  • الاتساق والتنظيم الواضح. نسعى إلى أن تكون قواعد المواصفات متسقة فيما بينها ومنسجمة مع السلوك المنشود للنموذج، وأن يكون التنظيم العام للوثيقة واضحًا وسهل المنال.

ما الذي ينتظرنا في المستقبل؟

مواصفات النموذج ليست ادعاءً بأننا نستطيع تدوين كل ما يهم، أو أن النماذج ستصيب الهدف دائمًا. إنها إقرار بأن السلوك المنشود بالغ الأهمية بما يكفي ليكون واضحًا وقابلًا للتطبيق وقابلًا للمراجعة.

وثلاثة معايير للنجاح تضبط مسار تطويرها:

  • قابلية الفهم. يستطيع من هم داخل OpenAI وخارجها تكوين توقعات دقيقة حول السلوك، والإشارة إلى النص حين يفاجئهم سلوك ما.
  • قابلية التطبيق. يمكن توظيف المواصفات في تصميم التقييمات وتشخيص الحوادث واتخاذ قرارات منتج متسقة، لا مجرد التعبير عن قيم مجردة.
  • قابلية المراجعة. تستطيع المواصفات التطور مع ما نتعلمه، دون أن تتحول إلى هدف متحرك يفتقر إلى الاستقرار.

ومع تطور النماذج والمنتجات، نتوقع أن تتسع المواصفات وتزداد وضوحًا بما يواكب القدرات الجديدة وسياقات النشر المستحدثة. والغاية أن تبقى المواصفات السلوكية متماسكة وقابلة للاختبار ومتوافقة مع رسالتنا في ضمان أن يعود الذكاء الاصطناعي العام بالنفع على البشرية جمعاء.