ડેવલપર્સને કિશોરો માટે વધુ સુરક્ષિત AI અનુભવ બનાવવા મદદરૂપ થવું
gpt-oss-safeguard માટે પ્રોમ્પ્ટ સ્વરૂપે કિશોર સુરક્ષા નીતિઓનો સમૂહ રજૂ કરીએ છીએ.
આજે, અમે કિશોરો માટે વય-યોગ્ય સુરક્ષા બનાવવામાં ડેવલપર્સને મદદ કરવા માટે પ્રોમ્પ્ટ-આધારિત સુરક્ષા નીતિઓ(નવી વિન્ડોમાં ખૂલે છે) પ્રકાશિત કરી રહ્યા છીએ. અમારી ઓપન વેઇટ સુરક્ષા મોડલ gpt-oss-safeguard(નવી વિન્ડોમાં ખૂલે છે) સાથે કામ કરવા માટે બનાવેલી આ નીતિઓ ડેવલપર્સને સુરક્ષા જરૂરિયાતોને વાસ્તવિક સિસ્ટમો માટે ઉપયોગી વર્ગીકરણકારોમાં ફેરવવાનું સરળ બનાવે છે.
અમે શક્તિશાળી AI સુધીની પહોંચ લોકતંત્રાત્મક બનાવવા અને વ્યાપક નવીનતાને ટેકો આપવા માટે ઓપન વેઇટ મોડલ્સ પ્રકાશિત કર્યા. સાથે જ, અમારો વિશ્વાસ છે કે સુરક્ષા અને નવીનતા હાથમાં હાથ નાખીને ચાલે છે, અને ડેવલપર્સને સક્ષમ મોડલ્સ સાથે સાથે તેમને સુરક્ષિત અને જવાબદારીપૂર્વક તૈનાત કરવા માટેના સાધનો અને નીતિઓની પણ પહોંચ હોવી જોઈએ. અમે વિશ્વસનીય બાહ્ય સંસ્થાઓ જેમ કે Common Sense Media(નવી વિન્ડોમાં ખૂલે છે) અને everyone.ai(નવી વિન્ડોમાં ખૂલે છે) ના સૂચનો સાથે, યુવા વપરાશકર્તાઓને સુરક્ષિત રાખવા માટે ડેવલપર્સના સુરક્ષા પ્રયત્નોને ટેકો આપવા આ નીતિઓ વિકસાવી છે.
અમે માનીએ છીએ કે કિશોરો અને પ્રૌઢોની જરૂરિયાતો અલગ છે, અને કિશોરોને વધારાની સુરક્ષાની જરૂર પડે છે. આ નીતિઓ ડેવલપર્સને આ ભિન્નતાઓને ધ્યાનમાં લેવા અને યુવા વપરાશકર્તાઓ માટે સશક્તિકારક તેમજ યોગ્ય અનુભવો બનાવવામાં મદદ કરવા માટે રચવામાં આવી છે.
યુવાનોને સુરક્ષિત રાખતાં રાખતાં તેમની તકોનો વિસ્તાર કરે એવું AI બનાવવા માટે અમે લાંબા સમયથી પ્રતિબદ્ધ છીએ. આ કાર્યના ભાગરૂપે, અમે અમારા મોડલ સ્પેક(નવી વિન્ડોમાં ખૂલે છે)—જે OpenAIના મોડલ્સના ઇચ્છિત વર્તનને વ્યાખ્યાયિત કરતી માર્ગદર્શિકાઓ છે—માં 18 વર્ષથી ઓછી ઉંમર (U18) સિદ્ધાંતો(નવી વિન્ડોમાં ખૂલે છે) ઉમેર્યા છે, અને યુવા વપરાશકર્તાઓને વધુ સારી રીતે સુરક્ષિત રાખવા માટે પેરેન્ટલ કંટ્રોલ્સ અને વય અનુમાન જેવી પ્રોડક્ટ-સ્તરની સુરક્ષા પણ રજૂ કરી છે. અમે અમારા Teen Safety Blueprint દ્વારા ઉદ્યોગ-વ્યાપી સુરક્ષાઓ માટે પણ અપીલ કરી છે.
આજનું પ્રકાશન એ જ પાયો આગળ વધારે છે. અમે આ સુરક્ષા નીતિઓ ડેવલપર્સ માટે ઉપલબ્ધ બનાવી રહ્યા છીએ જેથી તેઓ કિશોરો માટે સુરક્ષા ઉપાયો તૈનાત કરી શકે અને ઓપન વેઇટ્સ ઇકોસિસ્ટમમાં પહોંચનું વધુ લોકતંત્રિકરણ કરવામાં મદદ મળી શકે.
gpt-oss-safeguard જેવા સુરક્ષા વર્ગીકરણકારો હાનિકારક સામગ્રી શોધી શકે છે, પરંતુ તે સામગ્રી શું છે તેની સ્પષ્ટ વ્યાખ્યાઓ પર તેઓ નિર્ભર રહે છે. વ્યવહારમાં, ડેવલપર્સને પડતા સૌથી મોટા પડકારોમાંનો એક એવો છે કે એવી નીતિઓ વ્યાખ્યાયિત કરવી જે કિશોર-વિશિષ્ટ જોખમોને ચોક્કસ રીતે પકડે અને વાસ્તવિક સિસ્ટમોમાં સતત રીતે લાગુ કરી શકાય.
અનુભવી ટીમો માટે પણ ઉચ્ચ-સ્તરની સુરક્ષા લક્ષ્યોને ચોક્કસ, કાર્યાત્મક નિયમોમાં ફેરવવું ઘણીવાર મુશ્કેલ બને છે, ખાસ કરીને કારણ કે તેમાં વિષય નિષ્ણાતી અને AI વિશેનું ઊંડું જ્ઞાન બંને જરૂરી પડે છે. પરિણામે સુરક્ષામાં ખાડા, અમલમાં અસંગતતા અથવા અતિ-વ્યાપક ફિલ્ટરિંગ થઈ શકે છે. સ્પષ્ટ અને સારી રીતે મર્યાદિત નીતિઓ અસરકારક સુરક્ષા સિસ્ટમોની નિર્ણાયક પાયાની રચના કરે છે.
આ પડકારનો સામનો કરવા માટે, અમે સુરક્ષા નીતિઓ(નવી વિન્ડોમાં ખૂલે છે) નો એક સમૂહ પ્રકાશિત કરી રહ્યા છીએ, જે કિશોરો સામનો કરતા સામાન્ય જોખમોને ધ્યાનમાં રાખીને અને કિશોરોના વિશિષ્ટ વિકાસલક્ષી તફાવતો વિશેના હાલના સંશોધનના સચોટ સમીક્ષા પરથી માર્ગદર્શિત છે. આ નીતિઓ પ્રોમ્પ્ટ સ્વરૂપે રચાયેલ છે જેથી gpt-oss-safeguard(નવી વિન્ડોમાં ખૂલે છે) અને અન્ય রিজনিং મોડેલ્સ સાથે સીધી રીતે ઉપયોગ કરી શકાય, અને ડેવલપર્સને તેમની સિસ્ટમોમાં વધુ સરળતાથી સચોટ સુરક્ષા ધોરણો લાગુ કરવામાં સક્ષમ બનાવે છે.
પ્રારંભિક પ્રકાશનમાં નીચે આવરી લેવાયેલી નીતિઓનો સમાવેશ થાય છે:
- દૃશ્યમાન હિંસક સામગ્રી
- દૃશ્યમાન યૌન સામગ્રી
- હાનિકારક શરીર આદર્શો અને વર્તનો
- જોખમી પ્રવૃત્તિઓ અને પડકારો
- પ્રેમસભર અથવા હિંસક રોલપ્લે
- ઉંમર-પ્રતિબંધિત માલસામાન અને સેવાઓ
આ નીતિઓ વાસ્તવિક-સમયની સામગ્રી ફિલ્ટરિંગ તેમજ વપરાશકર્તા-સર્જિત સામગ્રીના ઑફલાઇન વિશ્લેષણ માટે ઉપયોગી બની શકે છે.
নীতિઓને પ્રોમ્પ્ટ તરીકે રચવાથી ડેવલપર્સ તેમને હાલની વર્કફ્લોમાં વધુ સરળતાથી સંકલિત કરી શકે છે, પોતાના ઉપયોગકેસ માટે ઢાળી શકે છે અને સમય જતાં સુધારી શકે છે.

અમે Common Sense Media(નવી વિન્ડોમાં ખૂલે છે) અને everyone.ai(નવી વિન્ડોમાં ખૂલે છે) સહિતની બાહ્ય સંસ્થાઓ સાથે મળીને આ નીતિઓના વિકાસને માર્ગદર્શન આપ્યું. તેમની નિષ્ણાતીએ આવરી લેવાતી સામગ્રીનો વ્યાપ નક્કી કરવામાં, પ્રોમ્પ્ટની રચનાને મજબૂત કરવામાં અને તેમનું મૂલ્યાંકન કરતી વખતે ધ્યાનમાં લેવા યોગ્ય સીમાસ્થિતિઓને વધુ સૂક્ષ્મ બનાવવામાં મદદ કરી.
આ કાર્ય નિષ્ણાતો અને વ્યાપક ઇકોસિસ્ટમ સાથે સહકાર કરીને AI સિસ્ટમો યુવાનોને કેવી રીતે વધુ સારી રીતે ટેકો આપે તે સુધારવાના સતત પ્રયત્નોને પ્રતિબિંબિત કરે છે.
“કિશોરો માટે AI સુરક્ષામાં સૌથી મોટા ખાડાઓમાંનો એક એ રહ્યો છે કે ડેવલપર્સ આધાર લઈ શકે એવી સ્પષ્ટ, કાર્યાત્મક નીતિઓનો અભાવ. ઘણી વખત, ડેવલપર્સને શરૂઆત શૂન્યથી કરવી પડે છે. આ પ્રોમ્પ્ટ-આધારિત નીતિઓ ઇકોસિસ્ટમભરમાં અર્થસભર સુરક્ષાનો લઘુત્તમ આધાર સ્થાપિત કરવામાં મદદ કરે છે, અને કારણ કે તે ઓપન સોર્સ તરીકે પ્રકાશિત કરવામાં આવી છે, સમય જતાં તેને અનુકૂળ બનાવી અને સુધારી શકાય છે. આ પ્રકારની આધારભૂત વ્યવસ્થા વ્યાપકપણે ઉપલબ્ધ કરાતી જોઈને અમને પ્રોત્સાહન મળે છે, અને અમે આશા રાખીએ છીએ કે તે સમગ્ર ઉદ્યોગમાં યુવા-સુરક્ષાના વધુ સહભાગી પ્રારંભિક ધોરણોને પ્રેરણા આપશે.”
—Robbie Torney, AI & Digital Assessmentsના વડા, Common Sense Media
“યુવા સુરક્ષા નીતિઓને વધુ કાર્યરૂપ બનાવતા આવા પ્રયાસો મૂલ્યવાન છે કારણ કે તે નિષ્ણાત જ્ઞાનને એવી માર્ગદર્શિકામાં ફેરવવામાં મદદ કરે છે જેને વાસ્તવિક સિસ્ટમોમાં ઉપયોગ કરી શકાય. સામગ્રી નીતિઓ એક મહત્વપૂર્ણ પ્રથમ પગલું છે, અને તે આ બાબત માટે પણ દરવાજો ખોલે છે કે મોડલનું વર્તન સમય જતાં યુવા-સંબંધિત જોખમોને કેવી રીતે આકાર આપી શકે. આ કાર્ય અને અમારા પોતાના સંશોધનથી પ્રેરાઈને, everyone.ai(નવી વિન્ડોમાં ખૂલે છે) એ પણ વિશિષ્ટતા અને અતિનિર્ભરતા જેવા જોખમો પર કેન્દ્રિત એક પ્રારંભિક વર્તન નીતિ તૈયાર કરી છે.”
—Dr. Mathilde Cerioli, everyone.AI ખાતે Chief Scientist
આ નીતિઓનો હેતુ શરૂઆતનો આધાર આપવાનો છે, કિશોર સુરક્ષાની સંપૂર્ણ અથવા અંતિમ વ્યાખ્યા કે ખાતરી આપવાનો નથી. દરેક એપ્લિકેશનના જોખમો, દર્શકો અને પરિસ્થિતિઓ અલગ હોય છે, અને ડેવલપર્સ તેમની પ્રોડક્ટ્સ અને AI સંકલનો શું જોખમો પેદા કરી શકે છે તે સમજવા માટે શ્રેષ્ઠ સ્થિતિમાં હોય છે. અમે ડેવલપર્સને જોરદાર પ્રોત્સાહન આપીએ છીએ કે તેઓ પોતાની ચોક્કસ જરૂરિયાતોના આધારે આ નીતિઓને ઢાળે અને વિસ્તારે, અને પ્રોડક્ટ ડિઝાઇનના નિર્ણયો, વપરાશકર્તા નિયંત્રણો, કિશોર-મૈત્રીપૂર્ણ પારદર્શિતા, મોનિટરિંગ સિસ્ટમો અને વિચારપૂર્વકના, વય-યોગ્ય પ્રતિસાદો જેવી અન્ય સુરક્ષા વ્યવસ્થાઓ સાથે તેનું સંયોજન કરે.
અમારો વિશ્વાસ છે કે વધુ સુરક્ષિત AI સિસ્ટમો બનાવવા માટે સ્તરિત ડિફેન્સ ઇન ડેપ્થ અભિગમ અત્યંત જરૂરી છે. આ નીતિઓ અમારી આંતરિક અનુભવો પરથી આંકેલી છે, પરંતુ તે OpenAIની આંતરિક નીતિઓ અથવા સુરક્ષા ઉપાયોની સંપૂર્ણ વ્યાપ્તિ પ્રતિબિંબિત કરતી નથી.
અમે સહકાર અને સતત સુધારાને પ્રોત્સાહિત કરવા માટે આ નીતિઓ ROOST Model Community(નવી વિન્ડોમાં ખૂલે છે) મારફતે ઓપન સોર્સ તરીકે પ્રકાશિત કરી રહ્યા છીએ. યોગદાન આપવા, પ્રતિસાદ આપવા અથવા વધારાની કિશોર સુરક્ષા નીતિઓ શેર કરવા માટે RMC GitHub repository.(નવી વિન્ડોમાં ખૂલે છે) ની મુલાકાત લો.
ડેવલપર્સ અને સંસ્થાઓ આ નીતિઓને પોતાની ચોક્કસ એપ્લિકેશન્સ માટે ઢાળી શકે છે, અલગ ભાષાઓમાં અનુવાદિત કરી શકે છે અને વધારાના જોખમ ક્ષેત્રો આવરી લેવા માટે વિસ્તારી શકે છે. સમય જતાં, અમને આશા છે કે આ AI સિસ્ટમોમાં સુરક્ષા નીતિઓ અમલમાં મૂકવા માટે વધુ મજબૂત અને સહભાગી પાયો ઉભો કરવામાં યોગદાન આપશે.
gpt-oss-safeguard સાથે શરૂઆત કરવા માટે તેને Hugging Face(નવી વિન્ડોમાં ખૂલે છે) પરથી ડાઉનલોડ કરો.


