24 मार्च 2026

डेवलपर्स को टीन के लिए सुरक्षित AI एक्सपीरियंस बनाने में मदद करना

gpt-oss-safeguard के लिए प्रॉम्प्ट्स के रूप में तैयार की गई टीन सेफ्टी पॉलिसीज़ का एक सेट पेश करना

लोड किया जा रहा है...

आज हम प्रॉम्प्ट-आधारित सेफ्टी पॉलिसीज़⁠(एक नई विंडो में खुलेगा) जारी कर रहे हैं, ताकि डेवलपर्स टीन के लिए उम्र के अनुसार सुरक्षा बना सकें. हमारे ओपन-वेट सेफ्टी मॉडल gpt-oss-safeguard⁠(एक नई विंडो में खुलेगा) के साथ काम करने के लिए बनी ये पॉलिसीज़, डेवलपर्स के लिए सेफ्टी आवश्यकताओं को रियल-वर्ल्ड सिस्टम्स के उपयोगी क्लासिफायर्स में बदलना आसान बनाती हैं.

हमने ओपन-वेट मॉडल्स जारी किए ताकि शक्तिशाली AI तक पहुंच को लोकतांत्रिक बनाया जा सके और व्यापक इनोवेशन को सपोर्ट किया जा सके. साथ ही, हमारा मानना है कि सेफ्टी और इनोवेशन साथ-साथ चलते हैं, और डेवलपर्स के पास सक्षम मॉडल्स के साथ-साथ उन्हें सुरक्षित और ज़िम्मेदारी से डिप्लॉय करने के लिए टूल्स और पॉलिसीज़ भी होने चाहिए. हमने ये पॉलिसीज़ डेवलपर्स की सेफ्टी कोशिशों को सपोर्ट करने के लिए बनाई हैं, ताकि वे युवा यूज़र्स की सुरक्षा कर सकें, और इसमें Common Sense Media⁠(एक नई विंडो में खुलेगा) और everyone.ai⁠(एक नई विंडो में खुलेगा) जैसे भरोसेमंद बाहरी संगठनों का इनपुट शामिल है.

हम समझते हैं कि टीन और वयस्कों की ज़रूरतें अलग होती हैं, और टीन को अतिरिक्त सुरक्षा की आवश्यकता होती है. ये पॉलिसीज़ डेवलपर्स को इन अंतर को ध्यान में रखने और ऐसे एक्सपीरियंस बनाने में मदद करने के लिए डिज़ाइन की गई हैं जो युवा यूज़र्स के लिए सशक्त बनाने वाले और उपयुक्त हों.

युवाओं की सुरक्षा के लिए हमारे व्यापक काम को आगे बढ़ाते हुए

हम लंबे समय से ऐसे AI बनाने के लिए प्रतिबद्ध हैं जो युवाओं के लिए अवसर बढ़ाए और उन्हें सुरक्षित भी रखे. इस काम के हिस्से के रूप में, हमने अपने मॉडल स्पेक⁠(एक नई विंडो में खुलेगा)—जो OpenAI के मॉडल्स के इच्छित व्यवहार को परिभाषित करता है—को अपडेट किया, जिसमें 18 साल से कम (U18) सिद्धांत⁠(एक नई विंडो में खुलेगा) जोड़े गए, और युवा यूज़र्स की बेहतर सुरक्षा के लिए पैरेंटल कंट्रोल्स⁠ और उम्र का अनुमान⁠ जैसे प्रॉडक्ट-लेवल सेफगार्ड्स पेश किए. हमने अपने टीन सेफ्टी ब्लूप्रिंट⁠ के माध्यम से इंडस्ट्री-भर में सुरक्षा उपायों की भी मांग की है.

आज का यह रिलीज़ उसी आधार को आगे बढ़ाता है. हम इन सेफ्टी पॉलिसीज़ को डेवलपर्स के लिए उपलब्ध करा रहे हैं, ताकि वे टीन के लिए सुरक्षा उपाय लागू कर सकें और ओपन-वेट्स इकोसिस्टम में एक्सेस को लोकतांत्रिक बनाने में मदद मिले.

टीन सेफ्टी को स्पष्ट और उपयोगी पॉलिसीज़ में बदलना

gpt-oss-safeguard जैसे सेफ्टी क्लासिफायर्स हानिकारक कंटेंट को पहचान सकते हैं, लेकिन वे इस बात की स्पष्ट परिभाषा पर निर्भर करते हैं कि वह कंटेंट क्या है. "व्यवहार में, डेवलपर्स के सामने सबसे बड़ी चुनौतियों में से एक है ऐसी पॉलिसीज़ को परिभाषित करना जो टीन-विशिष्ट जोखिमों को सटीक रूप से पकड़ सकें और वास्तविक सिस्टम्स में लगातार लागू की जा सकें.अनुभवी टीमें भी अक्सर उच्च-स्तरीय सेफ्टी लक्ष्यों को सटीक और ऑपरेशनल नियमों में बदलने में संघर्ष करती हैं, खासकर क्योंकि इसके लिए विषय विशेषज्ञता और गहरी AI समझ दोनों की ज़रूरत होती है. इससे सुरक्षा में कमी, असंगत लागूकरण या बहुत व्यापक फ़िल्टरिंग जैसी समस्याएँ हो सकती हैं. स्पष्ट और सही दायरे वाली पॉलिसीज़ प्रभावी सेफ्टी सिस्टम्स के लिए एक महत्वपूर्ण आधार होती हैं.

डेवलपर्स को टीन सेफ्टी को लागू करने में मदद करना

इस चुनौती से निपटने के लिए, हम सेफ्टी पॉलिसीज़⁠(एक नई विंडो में खुलेगा) का एक सेट जारी कर रहे हैं, जो टीन के आम जोखिमों के अनुसार तैयार हैं और उनके विकास से जुड़े अंतर पर मौजूदा रिसर्च की समीक्षा पर आधारित हैं. ये पॉलिसीज़ प्रॉम्प्ट्स के रूप में तैयार हैं, जिन्हें gpt-oss-safeguard⁠(एक नई विंडो में खुलेगा) और अन्य रीजनिंग मॉडल्स के साथ सीधे इस्तेमाल किया जा सकता है, जिससे डेवलपर्स अपने सिस्टम्स में एकसमान सेफ्टी स्टैंडर्ड्स आसानी से लागू कर सकें.

शुरुआती रिलीज़ में शामिल पॉलिसीज़ इन क्षेत्रों को कवर करती हैं:

ग्राफिक हिंसक कंटेंट
ग्राफिक यौन कंटेंट
हानिकारक शरीर से जुड़े आदर्श और व्यवहार
खतरनाक गतिविधियाँ और चैलेंजेज़
रोमांटिक या हिंसक रोलप्ले
आयु-सीमित प्रॉडक्ट्स और सेवाएँ

इन पॉलिसीज़ का उपयोग रियल-टाइम कंटेंट फ़िल्टरिंग के साथ-साथ यूज़र-जनरेटेड कंटेंट के ऑफलाइन विश्लेषण के लिए भी किया जा सकता है.

पॉलिसीज़ को प्रॉम्प्ट्स के रूप में स्ट्रक्चर करने से डेवलपर्स उन्हें अपने मौजूदा वर्कफ़्लोज़ में आसानी से इंटीग्रेट कर सकते हैं, अपने उपयोग मामलों के अनुसार ढाल सकते हैं और समय के साथ बेहतर बना सकते हैं.

डायग्राम जो टीन सेफ्टी पॉलिसी कैटेगरीज़ और टीन से जुड़ा कंटेंट GPT-OSS सेफगार्ड सिस्टम में जाते हुए दिखाता है, जो इंटरनल रीजनिंग के आधार पर पॉलिसी फैसले बनाता है.

बाहरी विशेषज्ञों के इनपुट के साथ विकसित

इन पॉलिसीज़ के विकास के लिए हमने Common Sense Media⁠(एक नई विंडो में खुलेगा) और everyone.ai⁠(एक नई विंडो में खुलेगा) जैसे बाहरी संगठनों के साथ काम किया. उनकी विशेषज्ञता ने कवर किए जाने वाले कंटेंट के दायरे को तय करने, प्रॉम्प्ट्स की संरचना को मज़बूत करने और मूल्यांकन के समय ध्यान देने वाले edge cases को बेहतर बनाने में मदद की.

यह काम विशेषज्ञों और व्यापक इकोसिस्टम के साथ मिलकर यह सुधारने के लगातार प्रयास को दर्शाता है कि AI सिस्टम्स युवाओं को बेहतर तरीके से कैसे सपोर्ट कर सकते हैं.

“टीन के लिए AI सेफ्टी में सबसे बड़ी कमियों में से एक यह रही है कि डेवलपर्स के पास काम शुरू करने के लिए स्पष्ट और ऑपरेशनल पॉलिसीज़ की कमी रही है. कई बार डेवलपर्स को बिल्कुल शुरुआत से काम शुरू करना पड़ता है. ये प्रॉम्प्ट-आधारित पॉलिसीज़ पूरे इकोसिस्टम में एक मजबूत सेफ्टी बेसलाइन तय करने में मदद करती हैं, और क्योंकि इन्हें ओपन सोर्स के रूप में जारी किया गया है, इन्हें समय के साथ बदला और बेहतर किया जा सकता है. इस तरह का इंफ्रास्ट्रक्चर व्यापक रूप से उपलब्ध होता देख हमें प्रोत्साहन मिलता है, और हम उम्मीद करते हैं कि इससे इंडस्ट्री में यूथ-सेफ्टी के लिए और साझा शुरुआती फ्रेमवर्क्स बनेंगे.”

—Robbie Torney, AI और डिजिटल असेसमेंट्स के प्रमुख, Common Sense Media

“इस तरह के प्रयास, जो यूथ सेफ्टी पॉलिसीज़ को ज़्यादा ऑपरेशनल बनाते हैं, मूल्यवान हैं क्योंकि ये विशेषज्ञ ज्ञान को ऐसी गाइडेंस में बदलते हैं जिसे वास्तविक सिस्टम्स में इस्तेमाल किया जा सके. कंटेंट पॉलिसीज़ एक महत्वपूर्ण पहला कदम हैं, और ये इस बात के लिए भी रास्ता खोलती हैं कि समय के साथ मॉडल का व्यवहार यूथ से जुड़े जोखिमों को कैसे प्रभावित कर सकता है. इस काम और हमारी अपनी रिसर्च से प्रेरित होकर, everyone.ai⁠(एक नई विंडो में खुलेगा) ने भी एक्सक्लूसिविटी और ओवररिलायंस जैसे जोखिमों पर केंद्रित एक शुरुआती बिहेवियरल पॉलिसी बनाई है."

—Dr. Mathilde Cerioli, everyone.AI में मुख्य वैज्ञानिक

एक शुरुआत, पूरा समाधान नहीं

ये पॉलिसीज़ एक शुरुआती बिंदु के रूप में हैं, न कि टीन सेफ्टी की कोई पूरी या अंतिम परिभाषा या गारंटी. हर एप्लिकेशन के अपने अलग जोखिम, ऑडियंस और कॉन्टेक्स्ट होते हैं, और डेवलपर्स ही सबसे बेहतर समझ सकते हैं कि उनके प्रॉडक्ट्स और AI इंटीग्रेशन्स कौन से जोखिम ला सकते हैं. हम डेवलपर्स को दृढ़ता से प्रोत्साहित करते हैं कि वे अपनी ज़रूरतों के अनुसार इन पॉलिसीज़ को ढालें और बढ़ाएँ, और इन्हें अन्य सेफगार्ड्स जैसे प्रॉडक्ट डिज़ाइन निर्णय, यूज़र कंट्रोल्स, टीन-फ्रेंडली ट्रांसपेरेंसी, मॉनिटरिंग सिस्टम्स और सोच-समझकर दिए गए उम्र के अनुसार उपयुक्त रिस्पॉन्सेस के साथ जोड़ें.

हमारा मानना है कि सुरक्षित AI सिस्टम्स बनाने के लिए एक layered defense in depth⁠⁠ अप्रोच ज़रूरी है. ये पॉलिसीज़ हमारे इंटरनल अनुभव पर आधारित हैं, लेकिन ये OpenAI की सभी इंटरनल पॉलिसीज़ या सेफगार्ड्स को पूरी तरह दर्शाती नहीं हैं.

आगे का रास्ता

हम इन पॉलिसीज़ को ओपन सोर्स के रूप में ROOST मॉडल कम्युनिटी⁠(एक नई विंडो में खुलेगा) के जरिए जारी कर रहे हैं, ताकि सहयोग और निरंतर सुधार को बढ़ावा मिले. योगदान देने, फीडबैक देने या अतिरिक्त टीन सेफ्टी पॉलिसीज़ साझा करने के लिए RMC GitHub रिपॉजिटरी.⁠(एक नई विंडो में खुलेगा) पर जाएँ

डेवलपर्स और संगठन इन पॉलिसीज़ को अपने खास एप्लिकेशन्स के अनुसार ढाल सकते हैं, उन्हें अलग-अलग भाषाओं में अनुवाद कर सकते हैं, और अतिरिक्त जोखिम क्षेत्रों को कवर करने के लिए इन्हें बढ़ा सकते हैं. समय के साथ, हमें उम्मीद है कि यह AI सिस्टम्स में सेफ्टी पॉलिसीज़ लागू करने के लिए एक मजबूत और साझा आधार बनाने में योगदान देगा.

gpt-oss-safeguard के साथ शुरुआत करने के लिए, इसे Hugging Face⁠(एक नई विंडो में खुलेगा) से डाउनलोड करें.

पढ़ते रहें

सभी देखें

लॉन्ग-होराइज़न मॉडल के युग में सुरक्षा और अलाइनमेंट

सुरक्षा20 जुलाई 2026

Why teens deserve access to safe AI — card image

किशोरों को सुरक्षित एआई की पहुंच क्यों मिलनी चाहिए

सुरक्षा16 जुलाई 2026

GPT-Red: मजबूती के लिए स्व-सुधार को अनलॉक करना

सुरक्षा15 जुलाई 2026