Ana içeriğe atla
OpenAI

24 Mart 2026

Güvenlik

Gençler için güvenli AI deneyimleri oluşturulmasını sağlıyoruz

Gpt-oss-safeguard için komut formatında sunulan genç güvenliği politikalarını tanıtıyoruz

Yükleniyor...

Bugün, geliştiricilerin gençler için yaşa uygun korumalar oluşturmasını desteklemek amacıyla komut tabanlı güvenlik politikalarını(yeni bir pencerede açılır) yayınlıyoruz. Açık ağırlıklı güvenlik modelimiz gpt-oss-safeguard(yeni bir pencerede açılır) ile birlikte çalışacak şekilde tasarlanan bu politikalar, geliştiricilerin güvenlik gereksinimlerini gerçek dünya sistemlerinde kullanılabilecek sınıflandırıcılara dönüştürmesini kolaylaştırır.

Güçlü yapay zekaya erişimi demokratikleştirmek ve geniş çaplı inovasyonu desteklemek için açık ağırlıklı modeller yayımladık. Aynı zamanda güvenlik ile inovasyonun birlikte ilerlemesi gerektiğine inanıyoruz. Geliştiricilerin, güçlü modellere olduğu kadar bunları güvenli ve sorumlu biçimde kullanmaya yönelik araçlara ve politikalara da erişebilmesi gerektiğini düşünüyoruz. Bu politikaları, geliştiricilerin genç kullanıcıları korumaya yönelik güvenlik çalışmalarını desteklemek amacıyla Common Sense Media(yeni bir pencerede açılır) ve everyone.ai(yeni bir pencerede açılır) gibi güvenilir dış kuruluşların katkılarıyla geliştirdik.

Gençlerin ve yetişkinlerin ihtiyaçlarının farklı olduğunu, gençlerin ek korumalara ihtiyaç duyduğunu kabul ediyoruz. Bu politikalar, geliştiricilerin bu farklılıkları dikkate almasına ve daha genç kullanıcılar için hem güçlendirici hem de yaşlarına uygun deneyimler oluşturmasına yardımcı olmak üzere tasarlanmıştır.

Gençleri korumaya yönelik daha geniş kapsamlı çalışmalarımızın üzerine inşa ediyoruz

Uzun süredir, gençlerin fırsatlarını genişletirken aynı zamanda onların güvenliğini koruyan yapay zeka sistemleri geliştirmeye kararlıyız. Bu çalışmalar kapsamında, OpenAI modellerinin amaçlanan davranışını tanımlayan Model Spesifikasyonumuzu(yeni bir pencerede açılır) güncelledik. Buna 18 yaş altına (U18) yönelik ilkeleri(yeni bir pencerede açılır) ekledik ve daha genç kullanıcıları korumak için ebeveyn kontrolleri ile yaş tahmini gibi ürün düzeyinde güvenlik önlemleri getirdik. Ayrıca Teen Safety Blueprint girişimimiz aracılığıyla sektör genelinde daha güçlü korumalar için çağrıda bulunduk.

Bugünkü duyuru da bu temelin üzerine inşa ediliyor. Bu güvenlik politikalarını geliştiricilere sunarak, gençler için güvenlik önlemlerini devreye almalarını desteklemeyi ve açık ağırlıklı ekosistemde erişimin demokratikleşmesine katkı sağlamayı amaçlıyoruz.

Genç güvenliğini açık ve uygulanabilir politikalara dönüştürüyoruz

Gpt-oss-safeguard gibi güvenlik sınıflandırıcıları zararlı içerikleri tespit edebilir, ancak bunu yapabilmeleri neyin zararlı olduğuna dair net tanımlara dayanır. Pratikte geliştiricilerin karşılaştığı en büyük zorluklardan biri, gençlere özgü riskleri doğru biçimde tanımlayan ve gerçek sistemlerde tutarlı şekilde uygulanabilen politikalar oluşturmaktır.

Deneyimli ekipler bile üst düzey güvenlik hedeflerini net ve uygulanabilir kurallara dönüştürmekte zorlanabilir; özellikle de bunun hem alan uzmanlığı hem de derin yapay zeka bilgisi gerektirdiği durumlarda. Bu da korumada boşluklara, tutarsız uygulamalara veya aşırı geniş filtrelemeye yol açabilir. Açık ve iyi tanımlanmış politikalar, etkili güvenlik sistemlerinin temelini oluşturur.

Geliştiricilerin genç güvenliğini hayata geçirmesine yardımcı oluyoruz

Bu zorluğu ele almak için, gençlerin karşılaştığı yaygın risklere göre uyarlanmış ve gençlerin kendine özgü gelişimsel farklılıklarına ilişkin mevcut araştırmaların dikkatli biçimde incelenmesiyle şekillendirilmiş bir güvenlik politikaları(yeni bir pencerede açılır) seti yayımlıyoruz. Bu politikalar, doğrudan gpt-oss-safeguard(yeni bir pencerede açılır) ve diğer akıl yürütme modelleriyle kullanılabilen komutlar biçiminde yapılandırılmıştır. Böylece geliştiriciler, sistemleri genelinde tutarlı güvenlik standartlarını daha kolay uygulayabilir.

İlk sürüm, aşağıdaki alanları kapsayan politikaları içerir:

  • Şiddet içeren görseller
  • Cinsel içerikli görseller
  • Zararlı beden algıları ve davranışlar
  • Tehlikeli etkinlikler ve meydan okumalar
  • Romantik veya şiddet içeren rol yapma
  • Yaşa bağlı kısıtlamaya tabi ürün ve hizmetler

Bu politikalar, gerçek zamanlı içerik filtrelemede ve kullanıcı tarafından üretilen içeriklerin offline analizinde kullanılabilir.

Politikaların komut biçiminde yapılandırılması sayesinde geliştiriciler bunları mevcut iş akışlarına daha kolay entegre edebilir, kendi kullanım senaryolarına uyarlayabilir ve zaman içinde geliştirebilir.

Gençlere yönelik güvenlik politikası kategorilerini ve gençlerle ilgili içeriklerin GPT-OSS güvenlik sistemine nasıl aktarıldığını gösteren diyagram. Bu sistem, kurum içi akıl yürütmeye dayalı politika kararları üretir.

Kurum dışındaki uzmanların katkılarıyla geliştirildi

Bu politikaların geliştirilmesine yön vermek için Common Sense Media(yeni bir pencerede açılır) ve everyone.ai(yeni bir pencerede açılır) gibi dış kuruluşlarla birlikte çalıştık. Bu kuruluşların uzmanlığı, kapsanacak içerik alanlarının belirlenmesine, komut yapısının güçlendirilmesine ve değerlendirme sırasında dikkate alınacak uç durumların netleştirilmesine yardımcı oldu. 

Bu çalışma, yapay zeka sistemlerinin gençleri nasıl daha iyi destekleyebileceğini geliştirmek amacıyla uzmanlarla ve daha geniş ekosistemle iş birliği yapmaya yönelik süregelen çabanın bir parçasını yansıtıyor.

"Gençlere yönelik yapay zeka güvenliğindeki en büyük açıklardan biri, geliştiricilerin üzerine inşa edebileceği açık ve uygulanabilir politikaların eksikliği oldu. Geliştiriciler çoğu zaman işe sıfırdan başlıyor. Komut tabanlı bu politikalar, ekosistem genelinde anlamlı bir asgari güvenlik standardı oluşturmaya yardımcı oluyor. Açık kaynak olarak yayınlandıkları için de zaman içinde uyarlanabiliyor ve geliştirilebiliyor. Bu tür bir altyapının geniş ölçekte erişilebilir hale gelmesini memnuniyetle karşılıyoruz ve bunun, sektör genelinde genç güvenliği için daha fazla ortak başlangıç noktası oluşturmasını umuyoruz."

- Robbie Torney, Yapay Zeka ve Dijital Değerlendirmeler Başkanı, Common Sense Media

"Genç güvenliği politikalarını daha uygulanabilir hale getiren bu tür çalışmalar değerli, çünkü uzman bilgisini gerçek sistemlerde kullanılabilecek rehberliğe dönüştürmeye yardımcı oluyor. İçerik politikaları önemli bir ilk adım ve zaman içinde model davranışının gençlerle ilgili riskleri nasıl şekillendirebileceğine dair daha geniş kapsamlı çalışmalara da kapı aralıyor. Bu çalışmadan ve kendi araştırmalarımızdan ilham alan everyone.ai(yeni bir pencerede açılır) da dışlayıcılık ve aşırı bağımlılık gibi risklere odaklanan ilk davranışsal politika taslağını oluşturdu."

-Dr. Mathilde Cerioli, everyone.AI'da Bilim Direktörü

Eksiksiz bir çözüm değil, bir başlangıç noktası

Bu politikalar, genç güvenliği için kapsamlı ya da nihai bir tanım veya garanti olarak değil, bir başlangıç noktası olarak tasarlanmıştır. Her uygulamanın kendine özgü riskleri, hedef kitleleri ve bağlamları vardır; geliştiriciler, ürünlerinin ve yapay zeka entegrasyonlarının ne tür riskler doğurabileceğini en iyi değerlendirebilecek konumdadır. Geliştiricileri, bu politikaları kendi ihtiyaçlarına göre uyarlamaya ve genişletmeye; ayrıca bunları ürün tasarımı kararları, kullanıcı kontrolleri, genç dostu şeffaflık uygulamaları, izleme sistemleri ve yaşa uygun, özenli yanıtlar gibi diğer güvenlik önlemleriyle birleştirmeye güçlü biçimde teşvik ediyoruz. 

Daha güvenli yapay zeka sistemleri oluşturmak için katmanlı bir savunma yaklaşımının kritik olduğuna inanıyoruz. Bu politikalar, kurum içi deneyimimizden yararlanıyor; ancak OpenAI'ın kurum içi politika ve güvenlik önlemlerinin tamamını yansıtmıyor.

İleriye dönük yol

İş birliğini ve sürekli geliştirmeyi teşvik etmek amacıyla ROOST Model Community(yeni bir pencerede açılır) aracılığıyla bu politikaları açık kaynak olarak yayınlıyoruz. Katkıda bulunmak, geri bildirim vermek veya genç güvenliğine ilişkin ek politikalar paylaşmak için RMC GitHub deposunu(yeni bir pencerede açılır) ziyaret edin.

Geliştiriciler ve kuruluşlar, bu politikaları kendi uygulamalarına uyarlayabilir, farklı dillere çevirebilir ve ek risk alanlarını kapsayacak şekilde genişletebilir. Zamanla bunun, yapay zeka sistemlerinde güvenlik politikalarının uygulanması için daha sağlam ve ortak bir temel oluşmasına katkı sağlamasını umuyoruz.

Gpt-oss-safeguard'ı kullanmaya başlamak için modeli Hugging Face(yeni bir pencerede açılır) üzerinden indirebilirsiniz.