Kusaidia wasanidi programu kuunda uzoefu salama zaidi wa AI kwa vijana
Tunawasilisha seti ya sera za usalama kwa vijana zilizoumbizwa kama madokezo ya gpt-oss-safeguard
Leo, tunatoa sera za usalama zinazotegemea dokezo(fungua katika dirisha jipya) ili kuwasaidia wasanidi programu kuunda ulinzi unaofaa kwa umri kwa vijana. Yakiwa yameundwa kufanya kazi na muundo wetu wa usalama wenye uwezo uliotolewa hadharani, gpt-oss-safeguard(fungua katika dirisha jipya), sera hizi hurahisisha jinsi wasanidi programu wanavyobadilisha mahitaji ya usalama kuwa viainishaji vinavyoweza kutumika kwa mifumo ya ulimwengu halisi.
Tulitoa miundo yenye uwezo uliotolewa hadharani ili kufanya upatikanaji wa AI yenye nguvu uwe wa kidemokrasia na kuunga mkono ubunifu mpana. Wakati huohuo, tunaamini kwamba usalama na ubunifu unaenda sambamba, na kwamba wasanidi programu wanapaswa kuwa na ufikiaji wa miundo yenye uwezo pamoja na zana na sera za kuisambaza kwa usalama na kwa uwajibikaji. Tulitengeneza sera hizi ili kuwasaidia wasanidi programu katika juhudi zao za usalama za kuwalinda watumiaji wachanga, kwa maoni kutoka kwa mashirika ya nje yanayoaminika yakiwemo Common Sense Media(fungua katika dirisha jipya) na everyone.ai(fungua katika dirisha jipya).
Tunatambua kwamba vijana na watu wazima wana mahitaji tofauti, na kwamba vijana wanahitaji ulinzi wa ziada. Sera hizi zimeundwa ili kuwasaidia wasanidi programu kuzingatia tofauti hizo na kuunda matumizi ambayo yanawawezesha na yanafaa kwa watumiaji wachanga.
Kwa muda mrefu tumekuwa tumejitolea kuunda AI inayopanua fursa kwa vijana huku ikiwalinda. Kama sehemu ya kazi hii, tulisasisha Ufafanuzi wa Muundo(fungua katika dirisha jipya)wetu—miongozo inayofafanua tabia inayokusudiwa ya miundo ya OpenAI—ili kujumuisha Kanuni za Watu Walio Chini ya Miaka 18 (U18)(fungua katika dirisha jipya), na tukaanzisha ulinzi wa kiwango cha bidhaa kama vile udhibiti wa wazazi na utabiri wa umri ili kuwalinda vyema zaidi watumiaji wenye umri mdogo. Pia tumetoa wito wa kuwepo kwa ulinzi wa sekta nzima kupitia Mpango wa Usalama kwa Vijana.
Toleo la leo linaimarisha msingi huo. Tunafanya sera hizi za usalama zipatikane kwa watengenezaji ili kuwasaidia kutekeleza ulinzi wa usalama kwa vijana na kusaidia kupanua upatikanaji katika mfumo ikolojia wa uzito wazi.
Ingawa viainishaji vya usalama kama vile gpt-oss-safeguard vinaweza kutambua maudhui hatari, hutegemea ufafanuzi wazi wa maudhui hayo ni yapi. Kihalisia, mojawapo ya changamoto kubwa zaidi ambazo wasanidi programu wanakabiliwa nazo ni kufafanua sera zinazonasa kwa usahihi hatari mahususi kwa vijana na zinazoweza kutekelezwa kwa uthabiti katika mifumo halisi.
Hata timu zenye uzoefu mara nyingi hupata ugumu kutafsiri malengo ya juu ya usalama kuwa kanuni sahihi za kiutendaji, hasa kwa kuwa jambo hilo linahitaji utaalamu wa mada husika pamoja na ujuzi wa kina wa AI. Hili linaweza kusababisha mapengo katika ulinzi, utekelezaji usio thabiti, au uchujaji mpana kupita kiasi. Sera zilizo wazi na zenye upeo uliofafanuliwa vizuri ni msingi muhimu sana wa mifumo madhubuti ya usalama.
Ili kushughulikia changamoto hii, tunatoa seti ya sera za usalama(fungua katika dirisha jipya), zilizoundwa kulingana na hatari za kawaida zinazowakabili vijana na zinazotegemea mapitio makini ya utafiti uliopo kuhusu tofauti za kipekee za ukuaji wa vijana. Sera hizi zimeundwa kama madokezo ambayo yanaweza kutumiwa moja kwa moja na gpt-oss-safeguard(fungua katika dirisha jipya) na muundo wa uwazaji, na kuwawezesha wasanidi programu kutumia kwa urahisi zaidi viwango thabiti vya usalama katika mifumo yao yote.
Toleo la awali linajumuisha sera zinazohusu:
- Maudhui ya picha za kikatili
- Maudhui ya picha za ngono
- Mawazo na tabia zenye kudhuru mwili
- Shughuli na changamoto hatari
- Uigizaji wa kimapenzi au wa vurugu
- Bidhaa na huduma zenye vikwazo vya umri
Sera hizi zinaweza kutumika kwa uchujaji wa maudhui kwa wakati halisi, pamoja na uchanganuzi wa nje ya mtandao wa maudhui yanayoundwa na watumiaji.
Kwa kupanga sera kama madokezo, wasanidi programu wanaweza kwa urahisi zaidi kuzijumuisha katika mtiririko uliopo wa kazi, kuzirekebisha kulingana na hali zao za matumizi, na kuziboresha kwa muda.

Tulifanya kazi na mashirika ya nje ikiwa ni pamoja na Common Sense Media(fungua katika dirisha jipya) na everyone.ai(fungua katika dirisha jipya) ili kusaidia kuongoza uundaji wa sera hizi. Utaalamu wao ulisaidia kuunda wigo wa maudhui ya kushughulikia, kuimarisha muundo wa madokezo, na kuboresha hali za kipekee za kuzingatia wakati wa kuzitathmini.
Kazi hii inaonyesha juhudi inayoendelea ya kushirikiana na wataalamu na mfumo mpana wa ikolojia ili kuboresha jinsi mifumo ya AI inavyowaunga mkono vijana.
“Mojawapo ya mapengo makubwa zaidi katika usalama wa AI kwa vijana ni ukosefu wa sera zilizo wazi na zinazoweza kutekelezwa, ambazo wasanidi programu wanaweza kutumia kama msingi wa maendeleo. Mara nyingi, wasanidi programu huanza kutoka mwanzo. Sera hizi zinazotegemea madokezo husaidia kuweka kiwango cha msingi chenye maana cha usalama katika mfumo mzima wa ikolojia, na kwa sababu zimetolewa kama chanzo huria, zinaweza kurekebishwa na kuboreshwa kadri muda unavyopita. Tunatiwa moyo kuona aina hii ya miundombinu ikifanywa ipatikane kwa upana, na tunatumai itachochea misingi ya pamoja ya usalama wa vijana zaidi katika tasnia nzima.”
—Robbie Torney, Mkuu wa AI na Tathmini za Kidijitali, Common Sense Media
“Juhudi kama hizi zinazofanya sera za usalama wa vijana ziweze kutekelezeka zaidi ni za thamani kwa sababu zinasaidia kubadilisha maarifa ya wataalamu kuwa mwongozo unaoweza kutumika katika mifumo halisi. Sera za maudhui ni hatua muhimu ya kwanza, na pia zinafungua mlango kwa kazi pana zaidi kuhusu jinsi tabia ya muundo inaweza kuunda hatari zinazowahusu vijana kadri muda unavyopita. Tukichochewa na kazi hii na utafiti wetu wenyewe, everyone.ai(fungua katika dirisha jipya) pia imeunda sera ya awali ya kitabia inayolenga hatari kama vile kujitenga na kutegemea kupita kiasi."
—Dkt. Mathilde Cerioli, Mwanasayansi Mkuu katika everyone.AI
Sera hizi zimekusudiwa kuwa hatua ya kuanzia, si kama ufafanuzi wa kina au wa mwisho, wala hakikisho la usalama wa vijana. Kila programu ina hatari, hadhira na miktadha ya kipekee, na wasanidi programu wako katika nafasi nzuri zaidi ya kuelewa hatari ambazo bidhaa zao na ujumuishaji wa AI zinaweza kuwasilisha. Tunawahimiza sana wasanidi programu kurekebisha na kupanua sera hizi kulingana na mahitaji yao mahususi na kuzichanganya na hatua nyingine za ulinzi kama vile maamuzi ya muundo wa bidhaa, vidhibiti vya watumiaji, uwazi unaowafaa vijana, mifumo ya ufuatiliaji na majibu ya kuzingatia na yanayofaa kwa umri.
Tunaamini kwamba mbinu ya tabaka mbalimbali ya ulinzi wa kina ni muhimu katika kuunda mifumo ya AI iliyo salama zaidi. Sera hizi zinatokana na uzoefu wetu wa ndani, lakini haziakisi kikamilifu upana wa sera za ndani za OpenAI au hatua zake za ulinzi.
Tunatoa sera hizi kama chanzo huria kupitia Jumuiya ya Muundo ya ROOST(fungua katika dirisha jipya) ili kuhimiza ushirikiano na urudufishaji. Ili kuchangia, kutoa maoni, au kushiriki sera za ziada za usalama kwa vijana, tembelea uhifadhi wa GitHub wa RMC.(fungua katika dirisha jipya)
Wasanidi programu na mashirika wanaweza kurekebisha sera hizi kulingana na programu zao mahususi, kuzitafsiri katika lugha tofauti, na kuzipanua ili zishughulikie maeneo ya ziada ya hatari. Baada ya muda, tunatumaini kwamba hili litachangia msingi imara zaidi na wa pamoja kwa ajili ya kutekeleza sera za usalama katika mifumo ya AI.
Ili kuanza rasmi kutumia gpt-oss-safeguard, ipakue kutoka Hugging Face(fungua katika dirisha jipya).


