Marso 24, 2026

Tumutulong sa pagbuo ng mas ligtas na AI para sa mga tinedyer

Ipinapakilala ang hanay ng mga patakaran sa kaligtasan para sa mga tinedyer na naka-format bilang mga prompt para sa gpt-oss-safeguard

Naglo-load…

Ngayon, inilalabas namin ang mga patakaran sa kaligtasan⁠(magbubukas sa bagong window) na nakabatay sa prompt para tulungan ang mga developer na gumawa ng mga proteksyong naaangkop sa edad para sa mga kabataan. Binuo para gumawa kasama ng aming open-weight na modelo ng kaligtasan, gpt-oss-safeguard⁠(magbubukas sa bagong window), pinapasimple ng mga patakarang ito kung paano ginagawang magagamit na mga classifier ng mga developer ang mga kinakailangan sa kaligtasan para sa mga system sa totoong mundo.

Inilabas namin ang mga open weight na modelo para bigyang-laya ang pag-access sa powerful na AI at suportahan ang malawak na inobasyon. Kasabay nito, naniniwala kami na magkasabay ang kaligtasan at inobasyon, at na dapat magkaroon ng access ang mga developer sa mga may kakayahang modelo pati na rin sa mga tool at patakaran para mai-deploy ang mga ito nang ligtas at responsable. Dinevelop namin ang mga patakarang ito para suportahan ang mga developer sa kanilang mga pagsisikap sa kaligtasan para protektahan ang mga batang user, sa tulong ng input mula sa mga pinagkakatiwalaang external na organisasyon kabilang ang Common Sense Media⁠(magbubukas sa bagong window) at everyone.ai⁠(magbubukas sa bagong window).

Kinikilala namin na may magkakaibang pangangailangan ang mga tinedyer at mga adulto, at na kailangan ng mga tinedyer ng mga karagdagang proteksyon. Idinisenyo ang mga patakarang ito para tulungan ang mga developer na isaalang-alang ang mga pagkakaibang iyon at bumuo ng mga karanasang kapwa nagpapalakas at naaangkop para sa mga mas batang user.

Pagpapatuloy ng aming mas malawak na gawain para protektahan ang mga kabataan

Matagal na kaming nakatuon sa pagbuo ng AI na nagpapalawak ng mga oportunidad para sa mga kabataan habang pinananatili silang ligtas. Bilang bahagi ng gawaing ito, in-update namin ang aming Spec ng Modelo⁠(magbubukas sa bagong window)—ang mga alituntuning tumutukoy sa nilalayong paggawi ng mga modelo ng OpenAI—para isama ang Mga Prinsipyo para sa mga wala pang 18 taong gulang (U18)⁠(magbubukas sa bagong window), at nagpakilala ng mga pananggalang sa antas ng produkto tulad ng kontrol ng magulang⁠ at pagtataya ng edad⁠ para mas maprotektahan ang mga mas batang user. Nanawagan din kami para sa mga proteksyong sumasaklaw sa buong industriya sa pamamagitan ng aming Teen Safety Blueprint⁠.

Ang inilalabas ngayon ay bumubuo sa pundasyong iyon. Ginagawa naming available ang mga patakaran sa kaligtasan na ito sa mga developer para suportahan sila sa pagpapatupad ng mga proteksyon sa kaligtasan para sa mga tinedyer at makatulong na gawing mas demokratiko ang access sa buong open weights ecosystem.

Pagsasalin ng kaligtasan ng mga kabataan tungo sa malinaw, magagamit na mga patakaran

Bagaman kayang mag-detect ng mga classifier sa kaligtasan tulad ng gpt-oss-safeguard ng nakakapinsalang content, nakadepende ang mga ito sa malinaw na depinisyon kung ano ang bumubuo sa content na iyon. Sa pagsasagawa, isa sa pinakamalalaking hamon na kinahaharap ng mga developer ang pagtukoy ng mga patakaran na tumpak na sumasaklaw sa mga panganib na partikular sa mga tinedyer at maaaring patuloy na mailapat sa mga tunay na system.

Kahit ang mga may karanasang team ay madalas pa ring nahihirapang isalin ang mga layuning pangkaligtasan na mataas ang antas tungo sa mga tumpak at operasyonal na tuntunin, lalo na dahil nangangailangan ito ng parehong kadalubhasaan sa paksa at malalim na kaalaman sa AI. Puwede itong humantong sa mga kakulangan sa proteksyon, hindi pare-parehong pagpapatupad, o sobrang malawak na pag-filter. Malinaw at maayos na saklaw na mga patakaran ang pundasyon ng epektibong mga safety system.

Pagtulong sa mga developer na isakatuparan ang kaligtasan ng mga tinedyer

Para matugunan ang hamong ito, naglulunsad kami ng hanay ng mga patakaran sa kaligtasan⁠(magbubukas sa bagong window) na iniakma sa mga karaniwang panganib na kinahaharap ng mga tinedyer at binuo batay sa masusing pagsusuri sa umiiral na pananaliksik tungkol sa mga natatanging pagkakaiba sa pag-unlad ng mga tinedyer. Nakaayos ang mga patakarang ito bilang mga prompt na puwedeng direktang gamitin sa gpt-oss-safeguard⁠(magbubukas sa bagong window) at iba pang mga reasoning model, para mas madaling maipatupad ng mga developer ang pare-parehong safety standard sa kanilang mga system.

Kasama sa paunang release ang mga patakarang sumasaklaw sa:

Grapikong marahas na content
Grapikong sekswal na nilalaman
Mga nakapipinsalang ideyal sa katawan at mga pag-uugali
Mapanganib na mga aktibidad at hamon
Romantiko o marahas na pagganap ng papel
Mga produkto at serbisyong may limitasyon sa edad

Puwedeng gamitin ang mga patakarang ito para sa real-time na pag-filter ng nilalaman, pati na rin sa offline na pagsusuri ng nilalamang binuo ng user.

Sa pamamagitan ng pag-istruktura ng mga patakaran bilang mga prompt, mas madaling maisasama ng mga developer ang mga ito sa mga umiiral nang workflow, maiakma ang mga ito sa kanilang mga use case, at paulit-ulit na pagbutihin ang mga ito sa paglipas ng panahon.

Diagram na nagpapakita ng mga kategorya ng patakaran sa kaligtasan ng mga tinedyer at nilalamang may kaugnayan sa mga tinedyer na ipinapasok sa safeguard system ng GPT-OSS, na gumagawa ng mga desisyon sa patakaran na may batayan sa panloob na pangangatwiran.

Binuo sa tulong ng input mula sa mga panlabas na eksperto

Nakipagtulungan kami sa mga external na organisasyon, kabilang ang Common Sense Media⁠(magbubukas sa bagong window) at everyone.ai⁠(magbubukas sa bagong window), para makatulong sa pagbuo ng mga patakarang ito. Nakatulong ang kanilang kadalubhasaan sa paghubog ng saklaw ng content na dapat masaklaw, sa pagpapatibay ng istruktura ng mga prompt, at sa pag-aayos ng mga edge case na dapat isaalang-alang kapag sinusuri ang mga ito.

Ang gawaing ito ay sumasalamin sa patuloy na pagsisikap na makipagtulungan sa mga eksperto at sa mas malawak na ecosystem upang mapabuti kung paano sinusuportahan ng mga sistema ng AI ang mga kabataan.

“Isa sa pinakamalalaking puwang sa kaligtasan ng AI para sa mga tinedyer ay ang kakulangan ng malinaw at naipapatupad na mga patakaran na puwedeng pagbatayan ng mga developer. Madalas, nagsisimula ang mga developer mula sa simula. Tumutulong ang mga prompt-based na patakarang ito na magtakda ng matibay na safety baseline sa ecosystem, at dahil open source ang mga ito, puwede pa itong iangkop at pagbutihin sa paglipas ng panahon. Masaya kaming makita na ang ganitong uri ng imprastruktura ay mas malawak nang naa-access, at umaasa kami na mag-uudyok ito ng mas maraming magkakaparehong panimulang pamantayan para sa kaligtasan ng kabataan sa industriya."

—Robbie Torney, Head of AI & Digital Assessments ng Common Sense Media

“Mahalaga ang mga pagsisikap na tulad nito na ginagawang mas operasyonal ang mga patakaran sa kaligtasan ng kabataan, dahil nakatutulong ang mga ito na maisalin ang kaalamang eksperto tungo sa gabay na magagamit sa mga aktuwal na sistema. Ang mga patakaran sa content ay isang mahalagang unang hakbang, at nagbubukas din ang mga ito ng mas malawak na gawain kung paano nahuhubog ng asal ng modelo ang mga panganib na may kinalaman sa kabataan sa paglipas ng panahon. Dahil sa inspirasyon mula sa gawaing ito at sa sarili naming pananaliksik, everyone.ai⁠(magbubukas sa bagong window) ay nakabuo rin ng paunang behavioral policy na nakatuon sa mga panganib tulad ng exclusivity at labis na pagdepende.”

—Dr. Mathilde Cerioli, Punong Siyentipiko sa everyone.AI

Panimulang punto, hindi isang kumpletong solusyon

Ang mga patakaran ay nilalayong magsilbing panimulang punto, hindi bilang komprehensibo o pinal na depinisyon o garantiya ng kaligtasan ng mga tinedyer. Bawat application ay may kani-kaniyang natatanging panganib, audience, at konteksto, at ang mga developer ang pinakaangkop na makakaunawa sa mga panganib na maaaring idulot ng kanilang mga produkto at AI integration. Mahigpit naming hinihikayat ang mga developer na iangkop at palawakin ang mga patakarang ito batay sa kanilang mga partikular na pangangailangan at pagsamahin ang mga ito sa iba pang mga pananggalang tulad ng mga desisyon sa disenyo ng produkto, mga kontrol ng user, transparency na angkop para sa mga tinedyer, mga sistema ng pagsubaybay, at maalalahanin at mga tugong naaangkop sa edad.

Naniniwala kami na ang naka-layer na defense in depth⁠⁠ na diskarte ay mahalaga sa pagbuo ng mas ligtas na mga AI system. Nakabatay ang mga patakarang ito sa aming panloob na karanasan, pero hindi nito ipinapakita ang buong lawak ng mga panloob na patakaran o pananggalang ng OpenAI.

Ang landas sa hinaharap

Inilalabas namin ang mga patakarang ito bilang open source sa pamamagitan ng Komunidad ng ROOST Modelo⁠(magbubukas sa bagong window) para hikayatin ang kolaborasyon at pag-uulit. Para mag-ambag, magbigay ng feedback, o magbahagi ng mga karagdagang patakaran sa kaligtasan ng mga tinedyer, bisitahin ang RMC GitHub repository.⁠(magbubukas sa bagong window)

Puwedeng iakma ng mga developer at organisasyon ang mga patakarang ito sa kanilang mga partikular na application, isalin ang mga ito sa iba't ibang wika, at palawakin ang mga ito para masaklaw ang mga karagdagang larangan ng panganib. Sa paglipas ng panahon, umaasa kami na makatutulong ito sa mas matatag at pinagsasaluhang pundasyon para sa pagpapatupad ng mga patakaran sa kaligtasan sa mga AI system.

Para makapagsimula sa gpt-oss-safeguard, i-download ito mula sa Hugging Face⁠(magbubukas sa bagong window).

Magpatuloy sa pagbabasa

Tingnan lahat

Kaligtasan at alignment sa panahon ng long-horizon na mga modelo

KaligtasanHul 20, 2026

Why teens deserve access to safe AI — card image

Bakit dapat ma-access ng mga teen ang ligtas na AI

KaligtasanHul 16, 2026

GPT-Red: Pagbubukas ng Self-Improvement para sa Katatagan

KaligtasanHul 15, 2026