Langsung ke konten utama
OpenAI

24 Maret 2026

Keselamatan

Membantu pengembang menciptakan AI yang lebih aman bagi remaja

Memperkenalkan serangkaian kebijakan keamanan remaja yang diformat sebagai prompt untuk gpt-oss-safeguard

Memuat…

Hari ini, kami merilis kebijakan keamanan(terbuka di jendela baru) berbasis prompt untuk membantu pengembang membuat perlindungan yang sesuai usia bagi remaja. Dibuat untuk bekerja dengan model keamanan open weight kami, gpt-oss-safeguard(terbuka di jendela baru), kebijakan ini menyederhanakan cara pengembang mengubah persyaratan keamanan menjadi pengklasifikasi yang dapat digunakan untuk sistem dunia nyata.

Kami merilis model open weight untuk menyebarkan akses ke AI yang canggih dan mendukung inovasi yang luas. Pada saat yang sama, kami percaya bahwa keamanan dan inovasi berjalan beriringan, dan bahwa para pengembang harus memiliki akses ke model yang mumpuni serta alat dan kebijakan untuk menerapkannya dengan aman dan bertanggung jawab. Kami mengembangkan kebijakan ini untuk mendukung pengembang dalam upaya keamanan mereka guna melindungi pengguna muda, dengan masukan dari organisasi eksternal tepercaya termasuk Common Sense Media(terbuka di jendela baru) dan everyone.ai(terbuka di jendela baru).

Kami menyadari bahwa remaja dan orang dewasa memiliki kebutuhan yang berbeda, dan bahwa remaja memerlukan perlindungan tambahan. Kebijakan ini dirancang untuk membantu pengembang memperhitungkan perbedaan tersebut dan membangun pengalaman yang memberdayakan sekaligus sesuai bagi pengguna yang lebih muda.

Melanjutkan upaya kami yang lebih luas untuk melindungi kaum muda

Kami telah lama berkomitmen untuk membangun AI yang memperluas peluang bagi generasi muda sambil menjaga mereka tetap aman. Sebagai bagian dari upaya ini, kami memperbarui Spesifikasi Model(terbuka di jendela baru)—pedoman yang mendefinisikan perilaku yang dimaksudkan untuk model OpenAI—dengan menyertakan prinsip Under-18 (U18)(terbuka di jendela baru), serta memperkenalkan perlindungan di tingkat produk seperti pengawasan orang tua dan prediksi usia untuk melindungi pengguna yang lebih muda dengan lebih baik. Kami juga telah menyerukan perlindungan di seluruh industri melalui Cetak Biru Keamanan Remaja.

Rilis hari ini dibangun berdasarkan fondasi tersebut. Kami menyediakan kebijakan keamanan ini bagi pengembang untuk mendukung mereka dalam menerapkan perlindungan keamanan bagi remaja dan membantu menyebarkan akses di seluruh ekosistem open weight.

Mewujudkan prinsip keamanan remaja ke dalam kebijakan yang jelas dan praktis

Meskipun pengklasifikasi keamanan seperti gpt-oss-safeguard dapat mendeteksi konten berbahaya, pengklasifikasi tersebut bergantung pada definisi yang jelas tentang apa yang dimaksud dengan konten tersebut. Dalam praktiknya, salah satu tantangan terbesar yang dihadapi pengembang adalah menetapkan kebijakan yang mencerminkan risiko khusus remaja secara akurat dan dapat diterapkan secara konsisten dalam sistem nyata.

Bahkan tim yang berpengalaman pun sering kesulitan mewujudkan tujuan keamanan tingkat tinggi ke dalam aturan operasional yang presisi, terutama karena hal tersebut menuntut baik keahlian di bidang terkait maupun pengetahuan AI yang mendalam. Hal ini dapat menyebabkan celah dalam perlindungan, penegakan yang tidak konsisten, atau pemfilteran yang terlalu luas. Kebijakan yang jelas dan memiliki cakupan yang tepat merupakan fondasi yang sangat penting bagi sistem keamanan yang efektif.

Membantu pengembang menerapkan keamanan remaja

Untuk mengatasi tantangan ini, kami merilis serangkaian kebijakan keamanan(terbuka di jendela baru), yang disesuaikan dengan risiko yang umumnya dihadapi remaja dan didasarkan pada peninjauan cermat terhadap riset yang ada tentang perbedaan perkembangan unik remaja. Kebijakan ini disusun sebagai prompt yang dapat langsung digunakan dengan gpt-oss-safeguard(terbuka di jendela baru) dan model penalaran lainnya, sehingga pengembang dapat lebih mudah menerapkan standar keamanan yang konsisten di seluruh sistem mereka.

Rilis awal mencakup kebijakan berikut:

  • Konten kekerasan yang eksplisit
  • Konten seksual yang eksplisit
  • Citra tubuh ideal dan perilaku yang berbahaya
  • Aktivitas dan tantangan yang berbahaya
  • Permainan peran romantis atau kekerasan
  • Barang dan layanan yang dibatasi usia

Kebijakan ini dapat digunakan untuk memfilter konten secara real time, serta sebagai analisis offline terhadap konten yang dihasilkan oleh pengguna.

Dengan menyusun kebijakan sebagai prompt, pengembang dapat lebih mudah mengintegrasikannya ke dalam alur kerja yang sudah ada, mengadaptasikannya ke kasus penggunaan mereka, dan melakukan iterasi seiring waktu.

Diagram yang menggambarkan kategori kebijakan keamanan remaja dan konten terkait remaja yang dimasukkan ke sistem pengaman GPT-OSS, yang menghasilkan keputusan kebijakan berdasarkan penalaran internal

Dikembangkan dengan masukan dari para ahli eksternal

Kami bekerja sama dengan organisasi eksternal termasuk Common Sense Media(terbuka di jendela baru) dan everyone.ai(terbuka di jendela baru) untuk memberikan informasi dalam pengembangan kebijakan ini. Keahlian mereka membantu menentukan cakupan konten yang perlu dicakup, memperkuat struktur prompt, dan menyempurnakan kasus tepi yang perlu dipertimbangkan saat mengevaluasinya. 

Upaya ini mencerminkan upaya berkelanjutan untuk berkolaborasi dengan para pakar dan ekosistem yang lebih luas guna meningkatkan cara sistem AI mendukung anak muda.

“Salah satu kesenjangan terbesar dalam keamanan AI bagi remaja adalah kurangnya kebijakan operasional yang jelas yang dapat dijadikan landasan oleh pengembang. Sering kali, pengembang memulai dari awal. Kebijakan berbasis prompt ini membantu menetapkan tingkat dasar keamanan yang berarti di seluruh ekosistem, dan karena dirilis sebagai sumber terbuka, kebijakan ini dapat disesuaikan dan ditingkatkan dari waktu ke waktu. Kami merasa sangat antusias melihat infrastruktur semacam ini tersedia secara luas, dan kami berharap hal ini mendorong lebih banyak titik awal bersama terkait keamanan anak muda di seluruh industri.”

Robbie Torney, Kepala AI & Asesmen Digital di Common Sense Media

“Upaya seperti ini yang membuat kebijakan keamanan remaja lebih operasional sangat berharga karena membantu mengubah pengetahuan ahli menjadi panduan yang dapat digunakan dalam sistem nyata. Kebijakan konten merupakan langkah awal yang penting, dan juga membuka jalan bagi upaya yang lebih luas tentang bagaimana perilaku model dapat membentuk risiko yang relevan bagi remaja dari waktu ke waktu. Terinspirasi oleh upaya ini dan riset kami sendiri, everyone.ai(terbuka di jendela baru) juga telah membuat kebijakan perilaku awal yang berfokus pada risiko seperti eksklusivitas dan ketergantungan berlebihan."

Dr. Mathilde Cerioli, Kepala Ilmuwan di everyone.AI

Sebuah titik awal, bukan solusi yang lengkap

Kebijakan ini dimaksudkan sebagai titik awal, bukan sebagai definisi atau jaminan keamanan remaja yang komprehensif atau final. Setiap aplikasi memiliki risiko, audiens, dan konteks yang unik, dan pengembang berada pada posisi terbaik untuk memahami risiko yang dapat ditimbulkan oleh produk dan integrasi AI mereka. Kami sangat mendorong para pengembang untuk menyesuaikan dan memperluas kebijakan ini berdasarkan kebutuhan spesifik mereka serta menggabungkannya dengan perlindungan lain seperti keputusan desain produk, kontrol pengguna, transparansi yang ramah bagi remaja, sistem pemantauan, dan respons yang bijaksana serta sesuai dengan usia. 

Kami percaya pendekatan pertahanan berlapis mendalam⁠ sangat penting untuk membangun sistem AI yang lebih aman. Kebijakan ini diambil dari pengalaman internal kami, tetapi tidak mencerminkan keseluruhan kebijakan internal atau langkah perlindungan OpenAI.

Jalan ke depan

Kami merilis kebijakan ini sebagai sumber terbuka melalui Komunitas Model ROOST(terbuka di jendela baru) untuk mendorong kolaborasi dan iterasi. Untuk berkontribusi, memberikan masukan, atau membagikan kebijakan tambahan tentang keamanan remaja, kunjungi repositori GitHub RMC.(terbuka di jendela baru)

Pengembang dan organisasi dapat menyesuaikan kebijakan ini dengan aplikasi spesifik mereka, menerjemahkannya ke dalam berbagai bahasa, dan memperluasnya agar mencakup area risiko tambahan. Seiring berjalannya waktu, kami berharap hal ini berkontribusi pada landasan yang lebih kokoh dan bersifat bersama bagi penerapan kebijakan keamanan dalam sistem AI.

Untuk mulai menggunakan gpt-oss-safeguard, unduh dari Hugging Face(terbuka di jendela baru).