24 Maret 2026

Mbantu pangembang nggawe pengalaman AI sing luwih aman kanggo remaja

Ngenalake sakumpulan kabijakan keamanan remaja awujud prompt kanggo gpt-oss-safeguard

Lagi dimuat…

Dina iki, kami ngrilis kabijakan keamanan⁠(mbukak ing jendhela anyar) adhedhasar prompt kanggo mbantu pangembang nggawe perlindungan sing cocog karo umur kanggo para remaja. Dibangun supaya bisa digunakake bareng model keamanan open weight kami, gpt-oss-safeguard⁠(mbukak ing jendhela anyar), kabijakan iki nyederhanakake cara pangembang ngowahi syarat keamanan dadi classifier sing bisa digunakake kanggo sistem nyata.

Kami ngrilis model bobot mbukak kanggo ndemokratisasi akses marang AI sing kuat lan ndhukung inovasi sing jembar. Ing wektu sing padha, kami percaya yen keamanan lan inovasi iku saling gandhengan, lan pangembang kudu nduweni akses marang model sing mumpuni uga alat lan kabijakan kanggo ngetrapake kanthi aman lan tanggung jawab. Kami ngembangake kabijakan iki kanggo ndhukung upaya keamanan pangembang kanggo nglindhungi pangguna enom, kanthi masukan saka organisasi eksternal sing dipercaya kalebu Common Sense Media⁠(mbukak ing jendhela anyar) lan everyone.ai⁠(mbukak ing jendhela anyar).

Kami ngerti yen remaja lan wong diwasa nduweni kabutuhan sing beda, lan remaja butuh perlindungan tambahan. Kabijakan iki dirancang kanggo mbantu pangembang nggatekake bedane kasebut lan mbangun pengalaman sing nguatake sekaligus cocog kanggo pangguna sing luwih enom.

Mbiyantu karya luwih jembar kanggo nglindhungi wong enom

Wis suwe kami nduweni komitmen kanggo mbangun AI sing ngembangake kesempatan kanggo wong enom nalika tetep njaga keamanan. Minangka bagean saka karya iki, kami nganyari Model Spec⁠(mbukak ing jendhela anyar)—pandhuan sing netepake prilaku sing dikarepake saka model OpenAI—supaya kalebu prinsip Under-18 (U18)⁠(mbukak ing jendhela anyar), lan ngenalake perlindungan tingkat produk kayata kontrol wong tuwa⁠ lan prediksi umur⁠ kanggo luwih nglindhungi pangguna sing luwih enom. Kami uga wis nyuarakake perlindungan sakindustri liwat Teen Safety Blueprint⁠ kami.

Rilisan dina iki nerusake pondasi kasebut. Kami nyedhiyakake kabijakan keamanan iki kanggo pangembang supaya ndhukung dheweke nalika ngetrapake perlindungan keamanan kanggo remaja lan mbantu ndemokratisasi akses ing ekosistem open weights.

Nerjemahake keamanan remaja dadi kabijakan sing cetha lan migunani

Sanajan classifier keamanan kaya gpt-oss-safeguard bisa ndeteksi konten sing mbebayani, classifier kasebut gumantung marang definisi sing cetha babagan apa isi kasebut. Ing praktik, salah siji tantangan paling gedhe sing diadhepi pangembang yaiku netepake kabijakan sing kanthi akurat nyekel risiko khusus remaja lan bisa ditrapake kanthi konsisten ing sistem nyata.

Malah tim sing wis pengalaman kerep angel nerjemahake tujuan keamanan tingkat dhuwur dadi aturan operasional sing presisi, luwih-luwih amarga iki mbutuhake keahlian materi lan kawruh AI sing jero. Iki bisa nyebabake celah perlindungan, penegakan sing ora konsisten, utawa panyaringan sing kakehan amba. Kabijakan sing cetha lan ruang lingkupe pas dadi pondasi kritis kanggo sistem keamanan sing efektif.

Mbantu pangembang ngoperasionalake keamanan remaja

Kanggo ngatasi tantangan iki, kami ngrilis sakumpulan kabijakan keamanan⁠(mbukak ing jendhela anyar), sing disesuaikan karo risiko umum sing diadhepi remaja lan didhasarake tinjauan sing teliti marang riset sing wis ana babagan bedane perkembangan unik para remaja. Kabijakan iki disusun minangka prompt sing bisa langsung digunakake karo gpt-oss-safeguard⁠(mbukak ing jendhela anyar) lan model nalar liyane, saengga pangembang luwih gampang ngetrapake standar keamanan sing konsisten ing kabeh sistemé.

Rilisan awal iki kalebu kabijakan sing nyakup:

Konten kekerasan grafis
Konten seksual grafis
Cita-cita lan prilaku awak sing mbebayani
Kegiatan lan tantangan sing mbebayani
Roleplay romantis utawa kasar
Barang lan layanan sing diwatesi miturut umur

Kabijakan iki bisa digunakake kanggo nyaring konten sacara wektu nyata, uga kanggo analisis offline marang konten sing digawe pangguna.

Kanthi nyusun kabijakan minangka prompt, pangembang bisa luwih gampang ngintegrasikake menyang alur kerja sing wis ana, nyesuaikake kanggo kasus panggunaan dhewe, lan ngiterasi saka wektu ke wektu.

Diagram sing nggambarake kategori kabijakan keamanan remaja lan konten terkait remaja sing dadi input menyang sistem perlindungan GPT-OSS, sing ngasilake keputusan kabijakan adhedhasar nalar internal.

Dikembangake kanthi masukan saka para ahli eksternal

Kami kerja bareng organisasi eksternal kalebu Common Sense Media⁠(mbukak ing jendhela anyar) lan everyone.ai⁠(mbukak ing jendhela anyar) kanggo menehi masukan ing pangembangan kabijakan iki. Keahlian dheweke mbantu mbentuk cakupan konten sing kudu dicakup, nguwatake struktur prompt, lan nyampurnakake kasus pinggiran sing kudu digatekake nalika ngevaluasi.

Karya iki nggambarake upaya sing terus lumaku kanggo kolaborasi karo para ahli lan ekosistem sing luwih jembar supaya ningkatake cara sistem AI ndhukung wong enom.

“Salah siji kesenjangan paling gedhe ing keamanan AI kanggo remaja yaiku kurangé kabijakan operasional sing cetha sing bisa dadi dhasar kanggo pangembang. Asring, pangembang miwiti saka nol. Kabijakan adhedhasar prompt iki mbantu netepake standar keamanan dhasar sing migunani ing saindenging ekosistem, lan amarga dirilis minangka open source, kabijakan iki bisa diadaptasi lan ditingkatake saka wektu ke wektu. Kami seneng ndeleng infrastruktur kaya iki disedhiyakake kanthi jembar, lan kami ngarep iki bisa nyurung luwih akeh titik wiwitan keamanan remaja sing dienggo bareng ing saindenging industri.”

—Robbie Torney, Head of AI & Digital Assessments, Common Sense Media

“Upaya kaya iki sing nggawe kabijakan keamanan anak muda luwih operasional iku migunani amarga mbantu nerjemahake kawruh para ahli dadi pandhuan sing bisa digunakake ing sistem nyata. Kabijakan konten minangka langkah awal sing penting, lan uga mbukak lawang kanggo karya sing luwih jembar babagan carane prilaku model bisa mbentuk risiko sing relevan kanggo anak muda saka wektu ke wektu. Diilhami dening karya iki lan riset kami dhewe, everyone.ai⁠(mbukak ing jendhela anyar) uga wis nggawe kabijakan prilaku awal sing fokus marang risiko kaya eksklusivitas lan ketergantungan berlebihan."

—Dr. Mathilde Cerioli, Chief Scientist at everyone.AI

Titik wiwitan, dudu solusi sing lengkap

Kabijakan iki dimaksudake minangka titik wiwitan, dudu definisi lengkap utawa final, uga dudu jaminan keamanan remaja. Saben aplikasi nduweni risiko, audiens, lan konteks sing unik, lan pangembang paling ngerti risiko sing bisa ditimbulake dening produk lan integrasi AI sing digawe. Kami banget nyaranake pangembang supaya nyesuaikake lan ngembangake kabijakan iki adhedhasar kabutuhan spesifik lan nggabungake karo perlindungan liyane kayata keputusan desain produk, kontrol pangguna, transparansi sing ramah remaja, sistem pemantauan, lan tanggapan sing dipikirake kanthi mateng lan cocog karo umur.

Kami percaya pendekatan defense in depth⁠⁠ berlapis iku penting kanggo mbangun sistem AI sing luwih aman. Kabijakan iki dijupuk saka pengalaman internal kami, nanging ora nggambarake sakabèhé kabijakan utawa perlindungan internal OpenAI.

Dalane ke ngarep

Kami ngrilis kabijakan iki minangka open source liwat ROOST Model Community⁠(mbukak ing jendhela anyar) kanggo nyengkuyung kolaborasi lan iterasi. Kanggo kontribusi, menehi masukan, utawa nuduhake kabijakan keamanan remaja tambahan, bukak gudang kode GitHub RMC.⁠(mbukak ing jendhela anyar)

Pangembang lan organisasi bisa nyesuaikake kabijakan iki kanggo aplikasi spesifik, nerjemahake menyang macem-macem basa, lan ngembangake supaya nyakup area risiko tambahan. Sakwisé wektu, kami ngarep iki bakal nyumbang marang pondasi sing luwih kuwat lan dienggo bareng kanggo ngetrapake kabijakan keamanan ing sistem AI.

Kanggo miwiti nganggo gpt-oss-safeguard, undhuh saka Hugging Face⁠(mbukak ing jendhela anyar).

Terus maca

Deleng kabeh

GPT-5.5 Bio Bug Bounty

Keselamatan9 Jul 2026

Majokake kaslametan lan kesempatan para mudha liwat kepemimpinan global

Urusan Global2 Jun 2026

Pandhuan bareng kanggo evaluasi pihak katelu sing bisa dipercaya

Keselamatan29 Mei 2026