24 ta’ Marzu 2026

Ngħinu lill-iżviluppaturi jibnu esperjenzi tal-AI aktar siguri għaż-żgħażagħ

Qed nintroduċu sett ta’ politiki għas-sigurtà taż-żgħażagħ ifformattati bħala prompts għal gpt-oss-safeguard

Qed jillowdja…

Illum, qed noħorġu politiki tas-sigurtà⁠(jinfetaħ f’tieqa ġdida) ibbażati fuq prompts biex ngħinu lill-iżviluppaturi joħolqu protezzjonijiet xierqa għall-età għaż-żgħażagħ. Mibnija biex jaħdmu mal-mudell tas-sigurtà open weight tagħna, gpt-oss-safeguard⁠(jinfetaħ f’tieqa ġdida), dawn il-politiki jissimplifikaw kif l-iżviluppaturi jittraduċu r-rekwiżiti tas-sigurtà f’klassifikaturi użabbli għal sistemi tad-dinja reali.

Ħriġna mudelli open weight biex niddemokratizzaw l-aċċess għal AI qawwija u nappoġġjaw innovazzjoni wiesgħa. Fl-istess ħin, nemmnu li s-sigurtà u l-innovazzjoni jimxu id f’id, u li l-iżviluppaturi għandu jkollhom aċċess għal mudelli kapaċi kif ukoll għall-għodod u l-politiki biex jużawhom b’mod sikur u responsabbli. Żviluppajna dawn il-politiki biex nappoġġjaw lill-iżviluppaturi fl-isforzi tagħhom għas-sigurtà biex jipproteġu lill-utenti żgħażagħ, b’kontribut minn organizzazzjonijiet esterni fdati inklużi Common Sense Media⁠(jinfetaħ f’tieqa ġdida) u everyone.ai⁠(jinfetaħ f’tieqa ġdida).

Nirrikonoxxu li ż-żgħażagħ u l-adulti għandhom bżonnijiet differenti, u li ż-żgħażagħ jeħtieġu protezzjonijiet addizzjonali. Dawn il-politiki huma mfassla biex jgħinu lill-iżviluppaturi jqisu dawn id-differenzi u jibnu esperjenzi li huma kemm ta’ setgħa kif ukoll xierqa għal utenti iżgħar fl-età.

Nibnu fuq il-ħidma usa’ tagħna biex nipproteġu liż-żgħażagħ

Ilna impenjati għal żmien twil li nibnu AI li tespandi l-opportunitajiet għaż-żgħażagħ filwaqt li żżommhom siguri. Bħala parti minn dan ix-xogħol, aġġornajna l-speċifikazzjoni tal-mudell⁠(jinfetaħ f’tieqa ġdida) tagħna—il-linji gwida li jiddefinixxu l-imġiba maħsuba tal-mudelli ta’ OpenAI—biex tinkludi prinċipji għal taħt it-18-il sena (U18)⁠(jinfetaħ f’tieqa ġdida), u introduċejna salvagwardji fil-livell tal-prodott bħal kontrolli tal-ġenituri⁠ u tbassir tal-età⁠ biex nipproteġu aħjar lill-utenti iżgħar fl-età. Sejjaħna wkoll għal protezzjonijiet mifruxa mal-industrija kollha permezz tal-Teen Safety Blueprint⁠ tagħna.

It-tnedija tal-lum tibni fuq dak il-pedament. Qed nagħmlu dawn il-politiki tas-sigurtà disponibbli għall-iżviluppaturi biex nappoġġjawhom fl-implimentazzjoni ta’ protezzjonijiet ta’ sigurtà għaż-żgħażagħ u ngħinu niddemokratizzaw l-aċċess fl-ekosistema open weights.

It-traduzzjoni tas-sigurtà taż-żgħażagħ f’politiki ċari u użabbli

Filwaqt li klassifikaturi tas-sigurtà bħal gpt-oss-safeguard jistgħu jidentifikaw kontenut ta’ ħsara, dawn jiddependu fuq definizzjonijiet ċari ta’ x’inhu dak il-kontenut. Fil-prattika, waħda mill-akbar sfidi li jiffaċċjaw l-iżviluppaturi hija li jiddefinixxu politiki li jaqbdu b’mod preċiż ir-riskji speċifiċi għaż-żgħażagħ u li jistgħu jiġu applikati b’mod konsistenti f’sistemi reali.

Anke timijiet b’esperjenza ħafna drabi jsibuha diffiċli biex jittraduċu għanijiet ta’ sigurtà ta’ livell għoli f’regoli preċiżi u operazzjonali, speċjalment billi dan jeħtieġ kemm għarfien tas-suġġett kif ukoll għarfien profond tal-AI. Dan jista’ jwassal għal lakuni fil-protezzjoni, infurzar inkonsistenti, jew filtrazzjoni wiesgħa żżejjed. Politiki ċari u b’ambitu definit sew huma pedament kritiku għal sistemi tas-sigurtà effettivi.

Ngħinu lill-iżviluppaturi jagħmlu s-sigurtà taż-żgħażagħ operazzjonali

Biex nindirizzaw din l-isfida, qed noħorġu sett ta’ politiki tas-sigurtà⁠(jinfetaħ f’tieqa ġdida), imfassla għal riskji komuni li jiffaċċjaw iż-żgħażagħ u infurmati minn reviżjoni bir-reqqa tar-riċerka eżistenti dwar id-differenzi uniċi fl-iżvilupp taż-żgħażagħ. Dawn il-politiki huma strutturati bħala prompts li jistgħu jintużaw direttament ma’ gpt-oss-safeguard⁠(jinfetaħ f’tieqa ġdida) u mudelli tar-raġunament oħra, u b’hekk jippermettu lill-iżviluppaturi japplikaw b’mod aktar faċli standards tas-sigurtà konsistenti fis-sistemi tagħhom.

It-tnedija inizjali tinkludi politiki li jkopru:

Kontenut vjolenti grafiku
Kontenut sesswali grafiku
Ideali u mġibiet ta’ ħsara relatati mal-ġisem
Attivitajiet u sfidi perikolużi
Roleplay romantiku jew vjolenti
Oġġetti u servizzi ristretti skont l-età

Dawn il-politiki jistgħu jintużaw għall-filtrazzjoni tal-kontenut f’ħin reali, kif ukoll għall-analiżi offline ta’ kontenut iġġenerat mill-utenti.

Billi l-politiki jiġu strutturati bħala prompts, l-iżviluppaturi jistgħu jintegrawhom aktar faċilment fil-flussi tax-xogħol eżistenti, jadattawhom għall-każijiet ta’ użu tagħhom, u jtejbuhom maż-żmien.

Dijagramma li turi kategoriji ta’ politiki dwar is-sigurtà taż-żgħażagħ u kontenut relatat magħhom li jidħol f’sistema ta’ salvagwardja GPT-OSS, li tipproduċi deċiżjonijiet ta’ politika infurmati minn raġunament intern.

Żviluppati b’kontribut minn esperti esterni

Ħdimna ma’ organizzazzjonijiet esterni inklużi Common Sense Media⁠(jinfetaħ f’tieqa ġdida) u everyone.ai⁠(jinfetaħ f’tieqa ġdida) biex ninfurmaw l-iżvilupp ta’ dawn il-politiki. L-għarfien espert tagħhom għen biex jifforma l-ambitu tal-kontenut li għandu jiġi kopert, isaħħaħ l-istruttura tal-prompts, u jirfina l-każijiet marġinali li għandhom jitqiesu meta jiġu evalwati.

Dan ix-xogħol jirrifletti sforz kontinwu biex nikkollaboraw ma’ esperti u mal-ekosistema usa’ biex intejbu kif is-sistemi tal-AI jappoġġjaw liż-żgħażagħ.

“Wieħed mill-akbar nuqqasijiet fis-sigurtà tal-AI għaż-żgħażagħ kien in-nuqqas ta’ politiki ċari u operazzjonali li l-iżviluppaturi jistgħu jibnu fuqhom. Ħafna drabi, l-iżviluppaturi jkunu qed jibdew mix-xejn. Dawn il-politiki bbażati fuq prompts jgħinu jistabbilixxu livell minimu sinifikanti ta’ sigurtà fl-ekosistema kollha, u minħabba li ġew rilaxxati bħala open source, jistgħu jiġu adattati u mtejba maż-żmien. Aħna mħeġġa naraw din it-tip ta’ infrastruttura ssir disponibbli b’mod wiesa’, u nittamaw li tikkatalizza aktar punti tat-tluq komuni għas-sigurtà taż-żgħażagħ fl-industrija kollha.”

—Robbie Torney, Kap tal-AI u l-Valutazzjonijiet Diġitali, Common Sense Media

“Sforzi bħal dawn li jagħmlu l-politiki tas-sigurtà taż-żgħażagħ aktar operazzjonali huma ta’ valur għax jgħinu jittraduċu l-għarfien espert f’gwida li tista’ tintuża f’sistemi reali. Il-politiki tal-kontenut huma l-ewwel pass importanti, u jiftħu wkoll il-bieb għal ħidma usa’ dwar kif l-imġiba tal-mudell tista’ tifforma riskji rilevanti għaż-żgħażagħ maż-żmien. Ispirata minn dan ix-xogħol u mir-riċerka tagħna stess, everyone.ai⁠(jinfetaħ f’tieqa ġdida) ħolqot ukoll politika ta’ mġiba inizjali ffukata fuq riskji bħall-esklużività u d-dipendenza żejda.”

—Dr. Mathilde Cerioli, Xjentista Ewlenija f’everyone.AI

Punt tat-tluq, mhux soluzzjoni sħiħa

Il-politiki huma maħsuba bħala punt tat-tluq, mhux bħala definizzjoni komprensiva jew finali jew garanzija tas-sigurtà taż-żgħażagħ. Kull applikazzjoni għandha riskji, udjenzi u kuntesti uniċi, u l-iżviluppaturi huma fl-aħjar pożizzjoni biex jifhmu r-riskji li l-prodotti tagħhom u l-integrazzjonijiet tal-AI tagħhom jistgħu jippreżentaw. Inħeġġu bil-qawwa lill-iżviluppaturi jadattaw u jestendu dawn il-politiki skont il-ħtiġijiet speċifiċi tagħhom u jgħaqqduhom ma’ salvagwardji oħra bħal deċiżjonijiet tad-disinn tal-prodott, kontrolli tal-utent, trasparenza adattata għaż-żgħażagħ, sistemi ta’ monitoraġġ u tweġibiet maħsuba sew u xierqa għall-età.

Nemmnu li approċċ f’saffi ta’ difiża fil-fond⁠⁠ huwa essenzjali biex jinbnew sistemi tal-AI aktar siguri. Dawn il-politiki jixorbu mill-esperjenza interna tagħna, iżda ma jirriflettux il-firxa sħiħa tal-politiki jew is-salvagwardji interni ta’ OpenAI.

It-triq ’il quddiem

Qed noħorġu dawn il-politiki bħala open source permezz tal-ROOST Model Community⁠(jinfetaħ f’tieqa ġdida) biex ninkoraġġixxu kollaborazzjoni u titjib iterattiv. Biex tikkontribwixxi, tipprovdi feedback, jew taqsam politiki addizzjonali għas-sigurtà taż-żgħażagħ, żur ir-repożitorju GitHub tal-RMC.⁠(jinfetaħ f’tieqa ġdida)

L-iżviluppaturi u l-organizzazzjonijiet jistgħu jadattaw dawn il-politiki għall-applikazzjonijiet speċifiċi tagħhom, jittraduċuhom f’lingwi differenti, u jestenduhom biex ikopru oqsma ta’ riskju addizzjonali. Maż-żmien, nittamaw li dan jikkontribwixxi għal pedament aktar robust u kondiviż għall-implimentazzjoni ta’ politiki tas-sigurtà fis-sistemi tal-AI.

Biex tibda b’gpt-oss-safeguard, niżżlu minn Hugging Face⁠(jinfetaħ f’tieqa ġdida).

Kompli aqra

Ara kollox

GPT-5.5 Bio Bug Bounty

Sigurtà9 ta’ Lul, 2026

Insaħħu s-sikurezza u l-opportunità taż-żgħażagħ permezz ta’ tmexxija globali

Affarijiet Globali2 ta’ Ġun, 2026

Gwida komuni għal evalwazzjonijiet affidabbli minn partijiet terzi

Sigurtà29 ta’ Mej, 2026