२४ मार्च, २०२६

विकसकांना किशोरवयीन मुलांसाठी अधिक सुरक्षित AI अनुभव तयार करण्यात मदत करणे

gpt-oss-safeguard साठी प्रॉम्प्ट्सच्या स्वरूपात मांडलेल्या किशोरवयीन सुरक्षाधोरणांचा एक संच सादर करत आहोत

लोड होत आहे...

आज, आम्ही विकसकांना किशोरांसाठी वयानुरूप संरक्षण तयार करण्यात मदत करण्यासाठी प्रॉम्प्ट-आधारित सुरक्षा धोरणे⁠(नवीन विंडोमध्ये उघडेल) जारी करत आहोत. आमच्या ओपन-वेट सुरक्षा मॉडेल, gpt-oss-safeguard⁠(नवीन विंडोमध्ये उघडेल), सोबत काम करण्यासाठी तयार केलेली ही धोरणे, विकसकांना वास्तविक-जगातील प्रणालींसाठी सुरक्षा आवश्यकता वापरण्यायोग्य क्लासिफायर्समध्ये रूपांतरित करणे सोपे करतात.

शक्तिशाली AI चा प्रवेश सर्वांसाठी खुला करण्यासाठी आणि व्यापक नवकल्पनांना पाठबळ देण्यासाठी आम्ही ओपन वेट मॉडेल्स प्रकाशित केली. त्याच वेळी, आमचा विश्वास आहे की सुरक्षितता आणि नवोन्मेष हातात हात घालून चालतात. विकसकांना सक्षम मॉडेल्स, तसेच त्यांची सुरक्षित आणि जबाबदारीने तैनाती करण्यासाठी आवश्यक साधने आणि धोरणे उपलब्ध असावीत. तरुण वापरकर्त्यांचे संरक्षण करण्याच्या त्यांच्या सुरक्षा प्रयत्नांना विकसकांना समर्थन देण्यासाठी आम्ही ही धोरणे विकसित केली आहेत. हे धोरणे तयार करताना Common Sense Media⁠(नवीन विंडोमध्ये उघडेल) आणि everyone.ai⁠(नवीन विंडोमध्ये उघडेल) यांसारख्या विश्वासार्ह बाह्य संस्थांचा अभिप्राय घेतला आहे.

आम्ही ओळखतो की किशोरवयीन मुले आणि प्रौढ यांच्या गरजा वेगळ्या असतात, आणि किशोरवयीन मुलांना अतिरिक्त संरक्षणाची गरज असते. ही धोरणे विकसकांना त्या फरकांचा विचार करता यावा आणि तरुण वापरकर्त्यांसाठी सक्षम करणारे व योग्य असे अनुभव तयार करता यावेत यासाठी तयार करण्यात आली आहेत.

तरुणांचे संरक्षण करण्यासाठी आमच्या व्यापक कार्यावर आधारित

आम्ही दीर्घकाळापासून असे AI तयार करण्यासाठी वचनबद्ध आहोत जे तरुणांसाठी संधी वाढवते आणि त्यांना सुरक्षित ठेवते. या कामाचा एक भाग म्हणून, आम्ही आमचा मॉडेल स्पेक⁠(नवीन विंडोमध्ये उघडेल)—OpenAI च्या मॉडेल्सचे अपेक्षित वर्तन परिभाषित करणारी मार्गदर्शक तत्त्वे—अद्यतनित करून त्यात अठरा वर्षांखालील (U18) तत्त्वे⁠(नवीन विंडोमध्ये उघडेल) समाविष्ट केली, आणि कमी वयाच्या वापरकर्त्यांचे अधिक चांगले संरक्षण करण्यासाठी पॅरेंटल कंट्रोल्स⁠ आणि वयाचा अंदाज⁠ यांसारखी उत्पादन-स्तरीय सुरक्षा उपाययोजना सादर केल्या. आम्ही आमच्या किशोरवयीन सुरक्षिततेचा आराखडा⁠ द्वारे संपूर्ण उद्योगक्षेत्रात संरक्षण उपायांची मागणी देखील केली आहे.

आजचे प्रकाशन त्या पाया वर आधारित आहे. आम्ही ही सुरक्षा धोरणे विकसकांसाठी उपलब्ध करून देत आहोत, ज्यामुळे त्यांना किशोरांसाठी सुरक्षा संरक्षणे लागू करण्यात आणि ओपन वेट्स इकोसिस्टममध्ये प्रवेश अधिक लोकशाहीकृत करण्यात मदत होईल.

किशोरवयीन सुरक्षिततेचे स्पष्ट, वापरण्यास सुलभ धोरणांमध्ये रूपांतर

gpt-oss-safeguard सारखे सुरक्षा वर्गीकरणकर्ते हानिकारक सामग्री शोधू शकतात, परंतु ती सामग्री नेमकी काय आहे याच्या स्पष्ट व्याख्यांवर ते अवलंबून असतात. व्यवहारात, विकसकांसमोर असलेल्या सर्वात मोठ्या आव्हानांपैकी एक म्हणजे अशी धोरणे परिभाषित करणे जी किशोरवयीनांसाठी विशिष्ट जोखमी अचूकपणे प्रतिबिंबित करतात आणि जी वास्तविक प्रणालींमध्ये सातत्याने लागू करता येतात.

अनुभवी संघांनाही अनेकदा उच्च-स्तरीय सुरक्षा उद्दिष्टांचे अचूक, कार्यान्वयनीय नियमांमध्ये भाषांतर करण्यात अडचण येते, विशेषतः कारण यासाठी विषयातील तज्ज्ञता आणि AI विषयी सखोल ज्ञान या दोन्हींची आवश्यकता असते. यामुळे संरक्षणातील तफावत, विसंगत अंमलबजावणी, किंवा अतिव्यापक फिल्टरिंग होऊ शकते. स्पष्ट, सु-परिभाषित धोरणे ही प्रभावी सुरक्षा प्रणालींसाठी एक अत्यंत महत्त्वाचा पाया आहेत.

विकसकांना किशोरवयीन सुरक्षितता अंमलात आणण्यास मदत

या आव्हानाला तोंड देण्यासाठी, आम्ही सुरक्षा धोरणांचा⁠(नवीन विंडोमध्ये उघडेल) एक संच जारी करत आहोत, जो किशोरांना भेडसावणाऱ्या सामान्य जोखमींनुसार तयार केलेला आहे आणि किशोरांच्या अनन्य विकासात्मक फरकांबाबत विद्यमान संशोधनाचे काळजीपूर्वक पुनरावलोकन करून तयार केलेला आहे. ही धोरणे प्रॉम्प्ट्सच्या स्वरूपात संरचित केलेली आहेत, जी gpt-oss-safeguard⁠(नवीन विंडोमध्ये उघडेल) आणि इतर रीझनिंग मॉडेल्ससह थेट वापरता येऊ शकतात, ज्यामुळे विकसकांना त्यांच्या प्रणालींमध्ये अधिक सुलभपणे सुसंगत सुरक्षा मानके लागू करता येतात.

प्रारंभिक प्रकाशनामध्ये खालील धोरणे समाविष्ट आहेत:

ग्राफिक हिंसक सामग्री
लैंगिकदृष्ट्या ग्राफिक सामग्री
शरीराबाबतचे हानिकारक आदर्श आणि वर्तन
धोकादायक क्रियाकलाप आणि आव्हाने
रोमँटिक किंवा हिंसक भूमिकानाट्य
वय-प्रतिबंधित वस्तू आणि सेवा

या पॉलिसी रिअल-टाइम कंटेंट फिल्टरिंगसाठी, तसेच वापरकर्त्यांनी तयार केलेल्या कंटेंटच्या ऑफलाइन विश्लेषणासाठी वापरल्या जाऊ शकतात.

धोरणांना प्रॉम्प्ट्सच्या स्वरूपात संरचित केल्याने, विकासक त्यांना विद्यमान कार्यप्रवाहांमध्ये सहजपणे समाविष्ट करू शकतात, त्यांच्या वापराच्या बाबींनुसार अनुकूल करू शकतात आणि कालांतराने त्यात सुधारणा करू शकतात.

किशोर सुरक्षा धोरणांच्या श्रेणी आणि किशोर-संबंधित सामग्री GPT-OSS सुरक्षितता प्रणालीमध्ये समाविष्ट होते, ज्यामुळे अंतर्गत रीझनिंगवर आधारित धोरणात्मक निर्णय घेतले जातात, असे दर्शवणारा एक चित्र.

बाह्य तज्ञांच्या सल्ल्यानुसार विकसित केलेले

या धोरणांच्या विकासास माहिती देण्यासाठी आम्ही Common Sense Media⁠(नवीन विंडोमध्ये उघडेल) आणि everyone.ai⁠(नवीन विंडोमध्ये उघडेल) यांसह बाह्य संस्थांसोबत काम केले. त्यांच्या तज्ज्ञतेमुळे समाविष्ट करावयाच्या मजकुराची व्याप्ती निश्चित करण्यात, प्रॉम्प्ट्सची रचना अधिक मजबूत करण्यात आणि त्यांचे मूल्यांकन करताना विचारात घ्यावयाच्या एज केसेस अधिक परिष्कृत करण्यात मदत झाली.

हे कार्य तज्ञ आणि व्यापक परिसंस्थेसोबत सहकार्य करण्यासाठी, तसेच AI प्रणाली तरुणांना कशा प्रकारे समर्थन देतात हे अधिक चांगले करण्यासाठी सतत सुरू असलेल्या प्रयत्नांचे प्रतिबिंब आहे.

किशोरवयीन मुलांसाठी AI सुरक्षिततेतील सर्वात मोठ्या उणिवांपैकी एक म्हणजे स्पष्ट आणि कार्यक्षम धोरणांचा अभाव, ज्यावर विकसक काम करू शकतील. बर्‍याच वेळा, विकसक शून्यातून सुरुवात करतात. ही प्रॉम्प्ट-आधारित धोरणे परिसंस्थेत सुरक्षेची अर्थपूर्ण पातळी निश्चित करण्यात मदत करतात, आणि ती ओपन सोर्स म्हणून प्रकाशित असल्यामुळे, कालांतराने त्यांचे रूपांतर आणि सुधारणा करता येतात. अशा प्रकारची पायाभूत सुविधा व्यापकपणे उपलब्ध होत आहे, हे पाहून आम्हाला प्रोत्साहन मिळते, आणि आम्हाला आशा आहे की यामुळे उद्योगात युवक-सुरक्षेसाठी अधिक सामायिक प्रारंभिक चौकटींना चालना मिळेल.

—रॉबी टॉर्नी, Common Sense Media येथे AI आणि डिजिटल मूल्यांकन प्रमुख

“युवक सुरक्षितता धोरणांना अधिक कार्यक्षम बनवणारे असे प्रयत्न मौल्यवान आहेत, कारण ते तज्ज्ञ ज्ञानाचे रूपांतर अशा मार्गदर्शनात करण्यास मदत करतात जे वास्तविक प्रणालींमध्ये वापरता येऊ शकते. कंटेंट धोरणे ही एक महत्त्वाची पहिली पायरी आहे, आणि ती कालांतराने मॉडेल वर्तन युवकांशी संबंधित जोखमींना कसे आकार देऊ शकते यावरील व्यापक कामासाठीही दार उघडते. या कामातून आणि आमच्या स्वतःच्या संशोधनातून प्रेरित होऊन, everyone.ai⁠(नवीन विंडोमध्ये उघडेल) नेही विशिष्टतेच्या जोखमी आणि अतिअवलंबित्व यांसारख्या जोखमींवर लक्ष केंद्रित करणारे एक प्रारंभिक वर्तनविषयक धोरण तयार केले आहे."

—डॉ. मॅथिल्ड सेरिओली, everyone.AI येथील चीफ सायंटिस्ट

एक प्रारंभ बिंदू, परंतु संपूर्ण उपाय नाही

ही धोरणे किशोरवयीन सुरक्षिततेची सर्वसमावेशक किंवा अंतिम व्याख्या किंवा हमी म्हणून नव्हे, तर एक प्रारंभिक बिंदू म्हणून अभिप्रेत आहेत. प्रत्येक अनुप्रयोगामध्ये अद्वितीय जोखीम, प्रेक्षकवर्ग आणि संदर्भ असतात, आणि त्यांच्या उत्पादनांमुळे व AI एकीकरणांमुळे कोणत्या जोखीम उद्भवू शकतात हे समजून घेण्यासाठी विकासक सर्वात योग्य स्थितीत असतात. आम्ही विकसकांना ठामपणे प्रोत्साहन देतो की त्यांनी या धोरणांना त्यांच्या विशिष्ट गरजांनुसार अनुकूलित आणि विस्तारित करावे, तसेच प्रॉडक्ट डिझाइनविषयक निर्णय, वापरकर्ता नियंत्रणे, किशोरांसाठी अनुकूल पारदर्शकता, निगराणी प्रणाली आणि विचारपूर्वक, वयानुसार योग्य प्रतिसाद यांसारख्या इतर सुरक्षा उपायांसह त्यांचा एकत्रित वापर करावा.

सुरक्षित AI प्रणाली तयार करण्यासाठी स्तरित सखोल संरक्षण⁠ दृष्टिकोन अत्यावश्यक आहे, असे आम्हाला वाटते. ही धोरणे आमच्या अंतर्गत अनुभवावर आधारित आहेत, परंतु ती OpenAI च्या अंतर्गत धोरणे किंवा संरक्षणात्मक उपायांची पूर्ण व्याप्ती प्रतिबिंबित करत नाहीत.

पुढील वाटचाल

सहकार्य आणि पुनरावृत्तीला प्रोत्साहन देण्यासाठी आम्ही ही धोरणे ROOST मॉडेल Community⁠(नवीन विंडोमध्ये उघडेल) द्वारे ओपन सोर्स म्हणून प्रकाशित करत आहोत. योगदान देण्यासाठी, अभिप्राय देण्यासाठी किंवा किशोरवयीन सुरक्षिततेसंबंधी अतिरिक्त धोरणे शेअर करण्यासाठी, RMC GitHub रिपॉझिटरीला भेट द्या.⁠(नवीन विंडोमध्ये उघडेल)

विकसकां आणि संस्था या धोरणांना त्यांच्या विशिष्ट अनुप्रयोगांनुसार अनुकूल करू शकतात, त्यांचे विविध भाषांमध्ये भाषांतर करू शकतात आणि अतिरिक्त जोखीम क्षेत्रांचा समावेश करण्यासाठी त्यांचा विस्तार करू शकतात. कालांतराने, आम्हाला आशा आहे की हे AI प्रणालींमध्ये सुरक्षा धोरणांची अंमलबजावणी करण्यासाठी अधिक मजबूत आणि सामायिक पाया तयार करण्यात मदत करेल.

gpt-oss-safeguard सह सुरुवात करण्यासाठी, ते Hugging Face⁠(नवीन विंडोमध्ये उघडेल) वरून डाउनलोड करा.

वाचत राहा

सर्व पहा

दीर्घकालीन मॉडेल्सच्या युगातील सुरक्षा आणि संरेखन

सुरक्षितता२० जुलै, २०२६

Why teens deserve access to safe AI — card image

किशोरांना सुरक्षित कृत्रिम बुद्धिमत्तेचा प्रवेश का हवा

सुरक्षितता१६ जुलै, २०२६

GPT-Red: मजबुतीसाठी स्व-सुधारणा खुली करणे

सुरक्षितता१५ जुलै, २०२६