Ngħinu lill-iżviluppaturi jibnu esperjenzi tal-AI aktar siguri għaż-żgħażagħ
Qed nintroduċu sett ta’ politiki għas-sigurtà taż-żgħażagħ ifformattati bħala prompts għal gpt-oss-safeguard
Illum, qed noħorġu politiki tas-sigurtà(jinfetaħ f’tieqa ġdida) ibbażati fuq prompts biex ngħinu lill-iżviluppaturi joħolqu protezzjonijiet xierqa għall-età għaż-żgħażagħ. Mibnija biex jaħdmu mal-mudell tas-sigurtà open weight tagħna, gpt-oss-safeguard(jinfetaħ f’tieqa ġdida), dawn il-politiki jissimplifikaw kif l-iżviluppaturi jittraduċu r-rekwiżiti tas-sigurtà f’klassifikaturi użabbli għal sistemi tad-dinja reali.
Ħriġna mudelli open weight biex niddemokratizzaw l-aċċess għal AI qawwija u nappoġġjaw innovazzjoni wiesgħa. Fl-istess ħin, nemmnu li s-sigurtà u l-innovazzjoni jimxu id f’id, u li l-iżviluppaturi għandu jkollhom aċċess għal mudelli kapaċi kif ukoll għall-għodod u l-politiki biex jużawhom b’mod sikur u responsabbli. Żviluppajna dawn il-politiki biex nappoġġjaw lill-iżviluppaturi fl-isforzi tagħhom għas-sigurtà biex jipproteġu lill-utenti żgħażagħ, b’kontribut minn organizzazzjonijiet esterni fdati inklużi Common Sense Media(jinfetaħ f’tieqa ġdida) u everyone.ai(jinfetaħ f’tieqa ġdida).
Nirrikonoxxu li ż-żgħażagħ u l-adulti għandhom bżonnijiet differenti, u li ż-żgħażagħ jeħtieġu protezzjonijiet addizzjonali. Dawn il-politiki huma mfassla biex jgħinu lill-iżviluppaturi jqisu dawn id-differenzi u jibnu esperjenzi li huma kemm ta’ setgħa kif ukoll xierqa għal utenti iżgħar fl-età.
Ilna impenjati għal żmien twil li nibnu AI li tespandi l-opportunitajiet għaż-żgħażagħ filwaqt li żżommhom siguri. Bħala parti minn dan ix-xogħol, aġġornajna l-speċifikazzjoni tal-mudell(jinfetaħ f’tieqa ġdida) tagħna—il-linji gwida li jiddefinixxu l-imġiba maħsuba tal-mudelli ta’ OpenAI—biex tinkludi prinċipji għal taħt it-18-il sena (U18)(jinfetaħ f’tieqa ġdida), u introduċejna salvagwardji fil-livell tal-prodott bħal kontrolli tal-ġenituri u tbassir tal-età biex nipproteġu aħjar lill-utenti iżgħar fl-età. Sejjaħna wkoll għal protezzjonijiet mifruxa mal-industrija kollha permezz tal-Teen Safety Blueprint tagħna.
It-tnedija tal-lum tibni fuq dak il-pedament. Qed nagħmlu dawn il-politiki tas-sigurtà disponibbli għall-iżviluppaturi biex nappoġġjawhom fl-implimentazzjoni ta’ protezzjonijiet ta’ sigurtà għaż-żgħażagħ u ngħinu niddemokratizzaw l-aċċess fl-ekosistema open weights.
Filwaqt li klassifikaturi tas-sigurtà bħal gpt-oss-safeguard jistgħu jidentifikaw kontenut ta’ ħsara, dawn jiddependu fuq definizzjonijiet ċari ta’ x’inhu dak il-kontenut. Fil-prattika, waħda mill-akbar sfidi li jiffaċċjaw l-iżviluppaturi hija li jiddefinixxu politiki li jaqbdu b’mod preċiż ir-riskji speċifiċi għaż-żgħażagħ u li jistgħu jiġu applikati b’mod konsistenti f’sistemi reali.
Anke timijiet b’esperjenza ħafna drabi jsibuha diffiċli biex jittraduċu għanijiet ta’ sigurtà ta’ livell għoli f’regoli preċiżi u operazzjonali, speċjalment billi dan jeħtieġ kemm għarfien tas-suġġett kif ukoll għarfien profond tal-AI. Dan jista’ jwassal għal lakuni fil-protezzjoni, infurzar inkonsistenti, jew filtrazzjoni wiesgħa żżejjed. Politiki ċari u b’ambitu definit sew huma pedament kritiku għal sistemi tas-sigurtà effettivi.
Biex nindirizzaw din l-isfida, qed noħorġu sett ta’ politiki tas-sigurtà(jinfetaħ f’tieqa ġdida), imfassla għal riskji komuni li jiffaċċjaw iż-żgħażagħ u infurmati minn reviżjoni bir-reqqa tar-riċerka eżistenti dwar id-differenzi uniċi fl-iżvilupp taż-żgħażagħ. Dawn il-politiki huma strutturati bħala prompts li jistgħu jintużaw direttament ma’ gpt-oss-safeguard(jinfetaħ f’tieqa ġdida) u mudelli tar-raġunament oħra, u b’hekk jippermettu lill-iżviluppaturi japplikaw b’mod aktar faċli standards tas-sigurtà konsistenti fis-sistemi tagħhom.
It-tnedija inizjali tinkludi politiki li jkopru:
- Kontenut vjolenti grafiku
- Kontenut sesswali grafiku
- Ideali u mġibiet ta’ ħsara relatati mal-ġisem
- Attivitajiet u sfidi perikolużi
- Roleplay romantiku jew vjolenti
- Oġġetti u servizzi ristretti skont l-età
Dawn il-politiki jistgħu jintużaw għall-filtrazzjoni tal-kontenut f’ħin reali, kif ukoll għall-analiżi offline ta’ kontenut iġġenerat mill-utenti.
Billi l-politiki jiġu strutturati bħala prompts, l-iżviluppaturi jistgħu jintegrawhom aktar faċilment fil-flussi tax-xogħol eżistenti, jadattawhom għall-każijiet ta’ użu tagħhom, u jtejbuhom maż-żmien.

Ħdimna ma’ organizzazzjonijiet esterni inklużi Common Sense Media(jinfetaħ f’tieqa ġdida) u everyone.ai(jinfetaħ f’tieqa ġdida) biex ninfurmaw l-iżvilupp ta’ dawn il-politiki. L-għarfien espert tagħhom għen biex jifforma l-ambitu tal-kontenut li għandu jiġi kopert, isaħħaħ l-istruttura tal-prompts, u jirfina l-każijiet marġinali li għandhom jitqiesu meta jiġu evalwati.
Dan ix-xogħol jirrifletti sforz kontinwu biex nikkollaboraw ma’ esperti u mal-ekosistema usa’ biex intejbu kif is-sistemi tal-AI jappoġġjaw liż-żgħażagħ.
“Wieħed mill-akbar nuqqasijiet fis-sigurtà tal-AI għaż-żgħażagħ kien in-nuqqas ta’ politiki ċari u operazzjonali li l-iżviluppaturi jistgħu jibnu fuqhom. Ħafna drabi, l-iżviluppaturi jkunu qed jibdew mix-xejn. Dawn il-politiki bbażati fuq prompts jgħinu jistabbilixxu livell minimu sinifikanti ta’ sigurtà fl-ekosistema kollha, u minħabba li ġew rilaxxati bħala open source, jistgħu jiġu adattati u mtejba maż-żmien. Aħna mħeġġa naraw din it-tip ta’ infrastruttura ssir disponibbli b’mod wiesa’, u nittamaw li tikkatalizza aktar punti tat-tluq komuni għas-sigurtà taż-żgħażagħ fl-industrija kollha.”
—Robbie Torney, Kap tal-AI u l-Valutazzjonijiet Diġitali, Common Sense Media
“Sforzi bħal dawn li jagħmlu l-politiki tas-sigurtà taż-żgħażagħ aktar operazzjonali huma ta’ valur għax jgħinu jittraduċu l-għarfien espert f’gwida li tista’ tintuża f’sistemi reali. Il-politiki tal-kontenut huma l-ewwel pass importanti, u jiftħu wkoll il-bieb għal ħidma usa’ dwar kif l-imġiba tal-mudell tista’ tifforma riskji rilevanti għaż-żgħażagħ maż-żmien. Ispirata minn dan ix-xogħol u mir-riċerka tagħna stess, everyone.ai(jinfetaħ f’tieqa ġdida) ħolqot ukoll politika ta’ mġiba inizjali ffukata fuq riskji bħall-esklużività u d-dipendenza żejda.”
—Dr. Mathilde Cerioli, Xjentista Ewlenija f’everyone.AI
Il-politiki huma maħsuba bħala punt tat-tluq, mhux bħala definizzjoni komprensiva jew finali jew garanzija tas-sigurtà taż-żgħażagħ. Kull applikazzjoni għandha riskji, udjenzi u kuntesti uniċi, u l-iżviluppaturi huma fl-aħjar pożizzjoni biex jifhmu r-riskji li l-prodotti tagħhom u l-integrazzjonijiet tal-AI tagħhom jistgħu jippreżentaw. Inħeġġu bil-qawwa lill-iżviluppaturi jadattaw u jestendu dawn il-politiki skont il-ħtiġijiet speċifiċi tagħhom u jgħaqqduhom ma’ salvagwardji oħra bħal deċiżjonijiet tad-disinn tal-prodott, kontrolli tal-utent, trasparenza adattata għaż-żgħażagħ, sistemi ta’ monitoraġġ u tweġibiet maħsuba sew u xierqa għall-età.
Nemmnu li approċċ f’saffi ta’ difiża fil-fond huwa essenzjali biex jinbnew sistemi tal-AI aktar siguri. Dawn il-politiki jixorbu mill-esperjenza interna tagħna, iżda ma jirriflettux il-firxa sħiħa tal-politiki jew is-salvagwardji interni ta’ OpenAI.
Qed noħorġu dawn il-politiki bħala open source permezz tal-ROOST Model Community(jinfetaħ f’tieqa ġdida) biex ninkoraġġixxu kollaborazzjoni u titjib iterattiv. Biex tikkontribwixxi, tipprovdi feedback, jew taqsam politiki addizzjonali għas-sigurtà taż-żgħażagħ, żur ir-repożitorju GitHub tal-RMC.(jinfetaħ f’tieqa ġdida)
L-iżviluppaturi u l-organizzazzjonijiet jistgħu jadattaw dawn il-politiki għall-applikazzjonijiet speċifiċi tagħhom, jittraduċuhom f’lingwi differenti, u jestenduhom biex ikopru oqsma ta’ riskju addizzjonali. Maż-żmien, nittamaw li dan jikkontribwixxi għal pedament aktar robust u kondiviż għall-implimentazzjoni ta’ politiki tas-sigurtà fis-sistemi tal-AI.
Biex tibda b’gpt-oss-safeguard, niżżlu minn Hugging Face(jinfetaħ f’tieqa ġdida).


