பதின்ம வயதினருக்கான பாதுகாப்பான AI அனுபவங்களை உருவாக்குவதில் டெவலப்பர்களுக்கு உதவுதல்
gpt-oss-safeguard க்காக ப்ராம்ப்ட்களாக வடிவமைக்கப்பட்ட இளையோர் பாதுகாப்புக் கொள்கைகளை அறிமுகப்படுத்துகிறோம்
இன்று, டெவலப்பர்கள் பதின்ம வயதினருக்கு வயதுக்கு ஏற்ற பாதுகாப்புகளை உருவாக்க உதவும் ப்ராம்ப்ட் அடிப்படையிலான பாதுகாப்புக் கொள்கைகளை(புதிய சாளரத்தில் திறக்கும்) வெளியிடுகிறோம். எங்கள் திறந்த-எடை பாதுகாப்பு மாடல் gpt-oss-safeguard(புதிய சாளரத்தில் திறக்கும்) உடன் செயல்படுமாறு உருவாக்கப்பட்ட இந்த கொள்கைகள், டெவலப்பர்கள் பாதுகாப்புத் தேவைகளை நிஜ உலக அமைப்புகளுக்குப் பயன்படுத்தக்கூடிய வகைப்பாட்டிகளாக மாற்றுவதை எளிமைப்படுத்துகின்றன.
சக்திவாய்ந்த AI-க்கான அணுகலை ஜனநாயகப்படுத்தவும் பரந்த புதுமையை ஆதரிக்கவும் நாங்கள் ஓபன் வேயிட் மாடல்கள் வெளியிட்டோம். அதே சமயம், பாதுகாப்பும் புதுமையும் ஒன்றோடொன்று இணைந்து செல்கின்றன என்றும், டெவலப்பர்கள் திறன்மிக்க மாடல்களுடன் அவற்றை பாதுகாப்பாகவும் பொறுப்புடனும் பயன்படுத்துவதற்கான கருவிகள் மற்றும் கொள்கைகளையும் அணுக முடிந்திருக்க வேண்டும் என்றும் நாங்கள் நம்புகிறோம். இளம் பயனர்களைப் பாதுகாக்கும் அவர்களின் பாதுகாப்பு முயற்சிகளுக்கு டெவலப்பர்களுக்கு ஆதரவளிக்க, Common Sense Media(புதிய சாளரத்தில் திறக்கும்) மற்றும் everyone.ai(புதிய சாளரத்தில் திறக்கும்) உள்ளிட்ட நம்பகமான வெளிப்புற நிறுவனங்களின் கருத்துகளைப் பெற்று, இந்தக் கொள்கைகளை நாங்கள் உருவாக்கினோம்.
பதின்ம வயதினருக்கும் பெரியவர்களுக்கும் வேறுபட்ட தேவைகள் உள்ளன என்பதை, மேலும் பதின்ம வயதினருக்கு கூடுதல் பாதுகாப்புகள் தேவை என்பதை நாங்கள் அங்கீகரிக்கிறோம். இந்தக் கொள்கைகள், அந்த வேறுபாடுகளைக் கருத்தில் கொண்டு, இளைய பயனர்களுக்கு அதிகாரமளிக்கும் மற்றும் அவர்களுக்குப் பொருத்தமான அனுபவங்களை டெவலப்பர்கள் உருவாக்க உதவுவதற்காக வடிவமைக்கப்பட்டுள்ளன.
இளைஞர்களுக்கான வாய்ப்புகளை விரிவுபடுத்துவதோடு, அவர்களைப் பாதுகாப்பாக வைத்திருக்கும் AI-ஐ உருவாக்குவதற்கு நாங்கள் நீண்ட காலமாக உறுதிபூண்டுள்ளோம். இந்தப் பணியின் ஒரு பகுதியாக, OpenAI-யின் மாடல்களின் நோக்கமுள்ள நடத்தையை வரையறுக்கும் வழிகாட்டுதல்களான எங்கள் மாடல் ஸ்பெக்(புதிய சாளரத்தில் திறக்கும்)-ஐ, 18 வயதுக்குட்பட்டோர் (U18) கொள்கைகள்(புதிய சாளரத்தில் திறக்கும்) சேர்க்கும் வகையில் புதுப்பித்தோம். மேலும், இளைய பயனர்களை சிறப்பாக பாதுகாக்க பேரென்டல் கண்ட்ரோல்ஸ் மற்றும் வயது கணிப்பு போன்ற தயாரிப்பு-நிலை பாதுகாப்புகளையும் அறிமுகப்படுத்தினோம். எங்கள் பதின்ம வயதினருக்கான பாதுகாப்பு ப்ளூபிரிண்ட் மூலம் துறை முழுவதும் பாதுகாப்புகளுக்கு நாங்கள் மேலும் அழைப்பு விடுத்துள்ளோம்.
இன்றைய வெளியீடு அந்த அடித்தளத்தில் கட்டமைக்கிறது. பதின்ம வயதினருக்கான பாதுகாப்புகளை நடைமுறைப்படுத்த டெவலப்பர்களுக்கு ஆதரவளிக்கவும், ஓபன் வெயிட்ஸ் சூழலமைப்பெங்கும் அணுகலை மேலும் பரவலாக்கவும், இந்த பாதுகாப்புக் கொள்கைகளை டெவலப்பர்களுக்குக் கிடைக்கச் செய்கிறோம்.
GPT‑OSS‑Safeguard போன்ற பாதுகாப்பு வகைப்படுத்திகள் தீங்கிழைக்கும் உள்ளடக்கத்தைக் கண்டறிய முடியும் என்றாலும், அந்த உள்ளடக்கம் என்ன என்பதற்கான தெளிவான வரையறைகளின் மீது அவை சார்ந்துள்ளன. நடைமுறையில், டெவலப்பர்கள் எதிர்கொள்ளும் மிகப்பெரிய சவால்களில் ஒன்று, பதின்ம வயதினருக்கே உரிய அபாயங்களைத் துல்லியமாகப் பிரதிபலிக்கும் மற்றும் உண்மையான அமைப்புகளில் தொடர்ந்து ஒரே மாதிரியாகப் பயன்படுத்தக்கூடிய கொள்கைகளை வரையறுப்பதாகும்.
அனுபவமிக்க குழுக்களுக்குக் கூட உயர்மட்ட பாதுகாப்பு இலக்குகளை துல்லியமான, செயல்படுத்தக்கூடிய விதிகளாக மொழிபெயர்ப்பதில் சிரமம் ஏற்படுகிறது, குறிப்பாக அதற்கு துறை நிபுணத்துவமும் ஆழமான AI அறிவும் தேவைப்படுவதால். இது பாதுகாப்பில் இடைவெளிகள், ஒற்றுமையற்ற அமலாக்கம் அல்லது அளவுக்கு அதிகமான பரந்த வடிகட்டலுக்கு வழிவகுக்கலாம். தெளிவான, நன்கு வரையறுக்கப்பட்ட கொள்கைகள் பயனுள்ள பாதுகாப்பு அமைப்புகளுக்கு முக்கியமான அடித்தளமாகும்.
இந்தச் சவாலை சமாளிக்க, பதின்ம வயதினர்கள் எதிர்கொள்ளும் பொதுவான அபாயங்களுக்கு ஏற்றவாறு வடிவமைக்கப்பட்டதும், பதின்ம வயதினரின் தனித்துவமான வளர்ச்சி வேறுபாடுகள் பற்றிய தற்போதைய ஆய்வுகளின் கவனமான மதிப்பாய்வின் அடிப்படையில் உருவாக்கப்பட்டதுமான பாதுகாப்புக் கொள்கைகளின்(புதிய சாளரத்தில் திறக்கும்) ஒரு தொகுப்பை நாங்கள் வெளியிடுகிறோம். இந்தக் கொள்கைகள், gpt-oss-safeguard(புதிய சாளரத்தில் திறக்கும்) மற்றும் பிற ரீஸனிங் மாடல்களுடன் நேரடியாகப் பயன்படுத்தக்கூடிய ப்ராம்ப்ட்களாக வடிவமைக்கப்பட்டுள்ளன. இதனால், டெவலப்பர்கள் தங்கள் அமைப்புகள் முழுவதும் ஒரே மாதிரியான பாதுகாப்பு தரநிலைகளை மேலும் எளிதாகப் பயன்படுத்த முடியும்.
ஆரம்ப வெளியீடு கொள்கைகளை உள்ளடக்கியது:
- கிராஃபிக் வன்முறை உள்ளடக்கம்
- தெளிவான பாலியல் உள்ளடக்கம்
- தீங்கு விளைவிக்கும் உடல் குறித்த இலட்சியங்கள் மற்றும் நடத்தைகள்
- ஆபத்தான செயல்பாடுகள் மற்றும் சவால்கள்
- காதல் அல்லது வன்முறையுடன் கூடிய பாத்திரப் பங்கு
- வயது வரம்புக்குட்பட்ட பொருட்கள் மற்றும் சேவைகள்
இந்தக் கொள்கைகள் நேரடி உள்ளடக்க வடிகட்டலுக்கும், பயனர்கள் உருவாக்கிய உள்ளடக்கத்தின் ஆஃப்லைன் பகுப்பாய்வுக்கும் பயன்படுத்தப்படலாம்.
கொள்கைகளை ப்ராம்ப்ட்களாக கட்டமைப்பதன் மூலம், டெவலப்பர்கள் அவற்றை ஏற்கனவே உள்ள பணிப்பாய்வுகளில் மேலும் எளிதாக ஒருங்கிணைக்கவும், தங்களின் பயன்பாட்டு சூழல்களுக்கு ஏற்ப அவற்றைத் தழுவிக்கொள்ளவும், காலப்போக்கில் அவற்றை மறுமுறை மேம்படுத்தவும் முடியும்.

இந்தக் கொள்கைகளை உருவாக்குவதற்குத் தேவையான தகவல்களைப் பெற, Common Sense Media(புதிய சாளரத்தில் திறக்கும்) மற்றும் everyone.ai(புதிய சாளரத்தில் திறக்கும்) உள்ளிட்ட வெளிப்புற அமைப்புகளுடன் நாங்கள் இணைந்து பணியாற்றினோம். அவர்கள் வழங்கிய நிபுணத்துவம், உள்ளடக்கத்தில் எதைச் சேர்க்க வேண்டும் என்பதற்கான வரம்பை நிர்ணயிக்கவும், ப்ராம்ப்ட்களின் கட்டமைப்பை வலுப்படுத்தவும், அவற்றை மதிப்பிடும்போது கருத்தில் கொள்ள வேண்டிய எட்ஜ் கேஸ்களைச் செம்மைப்படுத்தவும் உதவியது.
இளைஞர்களுக்கு AI அமைப்புகள் வழங்கும் ஆதரவை மேம்படுத்த, நிபுணர்களுடனும் பரந்த சூழலமைப்புடனும் இணைந்து செயல்படும் தொடர்ச்சியான முயற்சியையே இந்தப் பணி பிரதிபலிக்கிறது.
“பதின்ம வயதினருக்கான AI பாதுகாப்பில் உள்ள மிகப்பெரிய இடைவெளிகளில் ஒன்று, டெவலப்பர்கள் அடிப்படையாகக் கொண்டு உருவாக்கக்கூடிய தெளிவான, செயல்படுத்தக்கூடிய கொள்கைகள் இல்லாததுதான். பல நேரங்களில், டெவலப்பர்கள் ஆரம்பத்திலிருந்து தொடங்குகிறார்கள். இந்த ப்ராம்ப்ட்-அடிப்படையிலான கொள்கைகள் சூழலமைப்பு முழுவதும் அர்த்தமுள்ள குறைந்தபட்ச பாதுகாப்பு அடித்தளத்தை அமைக்க உதவுகின்றன, மேலும் அவை திறந்த மூலமாக வெளியிடப்பட்டுள்ளதால், காலப்போக்கில் அவற்றைத் தழுவி மேம்படுத்தலாம். “இந்த வகையான உள்கட்டமைப்பு பரவலாகக் கிடைக்கச் செய்யப்படுவது எங்களுக்கு ஊக்கமளிக்கிறது, மேலும் அது தொழில்துறை முழுவதும் இளைஞர்-பாதுகாப்புக்கான மேலும் பல பகிரப்பட்ட தொடக்க அடித்தளங்களைத் தூண்டிவிடும் என்று நாங்கள் நம்புகிறோம்.”
——Robbie Torney, Head of AI & Digital Assessments, Common Sense Media
“இளைஞர் பாதுகாப்புக் கொள்கைகளை மேலும் செயல்படுத்தக்கூடியதாக மாற்றும் இத்தகைய முயற்சிகள் மதிப்புமிக்கவை, ஏனெனில் அவை நிபுணர் அறிவை நிஜ அமைப்புகளில் பயன்படுத்தக்கூடிய வழிகாட்டுதலாக மாற்ற உதவுகின்றன. உள்ளடக்கக் கொள்கைகள் ஒரு முக்கியமான முதல் படியாகும்; மேலும், காலப்போக்கில் மாடல் நடத்தை இளைஞர்களுடன் தொடர்புடைய அபாயங்களை எவ்வாறு வடிவமைக்க முடியும் என்பதற்கான விரிவான பணிகளுக்கும் அவை வாயிலைத் திறக்கின்றன. இந்தப் பணியாலும் எங்களுடைய சொந்த ஆராய்ச்சியாலும் ஊக்கமடைந்து, everyone.ai(புதிய சாளரத்தில் திறக்கும்) கூட பிரத்தியேக சார்பு மற்றும் அதிகப்படியான சார்ந்திருத்தல் போன்ற அபாயங்களை மையமாகக் கொண்ட ஒரு ஆரம்பகட்ட நடத்தை கொள்கையை உருவாக்கியுள்ளது."
—Dr Mathilde Cerioli, everyone.AI-இன் தலைமை அறிவியலாளர்
இந்தக் கொள்கைகள், பதின்ம வயதினரின் பாதுகாப்பிற்கான முழுமையான அல்லது இறுதியான வரையறை அல்லது உத்தரவாதமாக அல்லாமல், ஒரு தொடக்கப் புள்ளியாகக் கருதப்படுகின்றன. ஒவ்வொரு பயன்பாட்டிற்கும் தனித்துவமான அபாயங்கள், பார்வையாளர்கள் மற்றும் சூழல்கள் உள்ளன; மேலும், தங்கள் தயாரிப்புகள் மற்றும் AI ஒருங்கிணைப்புகள் ஏற்படுத்தக்கூடிய அபாயங்களைப் புரிந்துகொள்ள டெவலப்பர்களே மிகவும் ஏற்ற நிலையில் உள்ளனர். டெவலப்பர்கள் இந்தக் கொள்கைகளைத் தங்களின் குறிப்பிட்ட தேவைகளுக்கேற்ப மாற்றியமைத்து விரிவுபடுத்தவும், மேலும் அவற்றை தயாரிப்பு வடிவமைப்பு முடிவுகள், பயனர் கட்டுப்பாடுகள், பதின்ம வயதினருக்கு ஏற்ற வெளிப்படைத்தன்மை, கண்காணிப்பு அமைப்புகள், மற்றும் சிந்தனையுடனும் வயதுக்கு ஏற்றவாறும் அமைந்த பதில்கள் போன்ற பிற பாதுகாப்பு நடவடிக்கைகளுடன் இணைக்கவும் நாங்கள் வலியுறுத்தி ஊக்குவிக்கிறோம்.
மேலும் பாதுகாப்பான AI அமைப்புகளை உருவாக்குவதற்கு, அடுக்குகளைக் கொண்ட ஆழமான பாதுகாப்பு அணுகுமுறை இன்றியமையாதது என்று நாங்கள் நம்புகிறோம். இந்த கொள்கைகள் எங்கள் உள் அனுபவத்திலிருந்து பெறப்பட்டவை, ஆனால் அவை OpenAI-யின் உள் கொள்கைகள் அல்லது பாதுகாப்பு நடவடிக்கைகளின் முழு பரப்பையும் பிரதிபலிக்கவில்லை.
ஒத்துழைப்பையும் மீளாய்வையும் ஊக்குவிப்பதற்காக, இந்த கொள்கைகளை ROOST மாடல் கம்யூனிட்டி(புதிய சாளரத்தில் திறக்கும்) மூலம் திறந்த மூலமாக வெளியிடுகிறோம். பங்களிக்க, கருத்துகளை வழங்க அல்லது கூடுதல் பதின்ம வயதினருக்கான பாதுகாப்புக் கொள்கைகளைப் பகிர, RMC GitHub ரிபாசிட்டரியைப் பார்வையிடவும்.(புதிய சாளரத்தில் திறக்கும்)
டெவலப்பர்களும் நிறுவனங்களும் இந்தக் கொள்கைகளை தங்களின் குறிப்பிட்ட பயன்பாடுகளுக்கேற்ப மாற்றியமைக்கலாம், அவற்றை வெவ்வேறு மொழிகளில் மொழிபெயர்க்கலாம், மேலும் கூடுதல் ஆபத்து பகுதிகளை உள்ளடக்கும் வகையில் அவற்றை விரிவுபடுத்தலாம். காலப்போக்கில், இது AI அமைப்புகளில் பாதுகாப்புக் கொள்கைகளை செயல்படுத்துவதற்கு மேலும் வலுவான மற்றும் பகிரப்பட்ட அடித்தளத்திற்கு பங்களிக்கும் என்று நாங்கள் நம்புகிறோம்.
Gpt-oss-safeguard ஐ பயன்படுத்தத் தொடங்க, அதை Hugging Face(புதிய சாளரத்தில் திறக்கும்) இலிருந்து பதிவிறக்கவும்.


