Bugün OpenAI, ürünlerimiz genelinde yapay zeka kötüye kullanım ve güvenlik risklerini tespit etmeye odaklanan, herkese açık bir Güvenlik ve Kötüye Kullanım Riskleri Ödül Programı(yeni bir pencerede açılır) başlatıyor. Yapay zeka teknolojisi hızla geliştikçe, kötüye kullanılma biçimleri de çeşitleniyor. Amacımız, sistemlerimizin somut zarara yol açabilecek kötüye kullanım ve suistimallere karşı güvenli kalmasını sağlamak.
Bu yeni program, OpenAI'ın Güvenlik Açığı Ödül Programını(yeni bir pencerede açılır) tamamlayıcı niteliktedir ve klasik anlamda bir güvenlik açığı sayılmasa bile, anlamlı kötüye kullanım ve güvenlik riskleri doğuran sorunları kapsar. Bu program aracılığıyla, geleneksel güvenlik açığı kapsamına girmese bile gerçek risk oluşturan sorunları belirlemek ve gidermek için güvenlik ve kötüye kullanım riskleri araştırmacılarıyla iş birliğimizi sürdürmeyi amaçlıyoruz. Başvurular, OpenAI'ın Güvenlik ve Kötüye Kullanım Riskleri Ödül Programı ekipleri tarafından değerlendirilecek; kapsam ve sorumluluk alanına göre iki program arasında yönlendirilebilecektir.
Yeni Güvenlik ve Kötüye Kullanım Riskleri Ödül Programı(yeni bir pencerede açılır), aşağıda listelenen yapay zekaya özgü güvenlik senaryolarına odaklanır:
MCP Dahil Otonom Ajan Tabanlı Riskler
- Üçüncü taraflarca komutlara kötü amaçlı müdahale ve veri sızdırma: Saldırgan tarafından yerleştirilen metnin, bir kurbanın otonom ajanını (Tarayıcı, ChatGPT Otonom Aracısı ve benzeri otonom ajan tabanlı ürünler dahil) güvenilir biçimde ele geçirerek zararlı bir eylem gerçekleştirmeye yönlendirmesi veya kullanıcının hassas bilgilerini sızdırması. Bu davranışın en az %50 oranında tekrarlanabilir olması gerekir.
- Bir OpenAI otonom ajan ürünü, OpenAI'ın web sitesinde geniş ölçekli biçimde izin verilmeyen bir eylem gerçekleştirir.
- Bir OpenAI otonom ajan ürünü, yukarıda listelenmemiş olsa da potansiyel olarak zararlı bir eylem gerçekleştirir. Bu kapsamda yapılan geçerli bildirimlerin, makul ve somut bir zarara işaret etmesi gerekir.
- MCP riskine ilişkin tüm testler, ilgili üçüncü tarafların hizmet şartlarına uygun olmalıdır.
OpenAI'a Ait Özel Bilgiler
- Akıl yürütmeyle ilgili OpenAI'a ait özel bilgileri getiren model çıktıları.
- OpenAI'a ait diğer özel bilgileri açığa çıkaran güvenlik açıkları.
Hesap ve Platform Bütünlüğü
- Hesap bütünlüğü ve platform büyünlüğü sinyallerine yönelik güvenlik açıkları; örneğin, otomasyon karşıtı kontrollerin aşılması, hesap güven sinyallerinin manipüle edilmesi, hesap kısıtlamalarının/askıya almaların/yasakların atlatılması ve benzeri durumlar.
- Kullanıcıların yetkili izinlerin ötesinde özelliklere, verilere veya işlevlere erişmesine olanak tanıyan sorunlar, Güvenlik Açığı Ödül Programı(yeni bir pencerede açılır)'na bildirilmelidir.
Jailbreak'ler bu programın kapsamı dışında olsa da, belirli zarar türlerine odaklanan özel hata ödül programı kampanyalarını düzenli olarak yürütüyoruz; buna ChatGPT Otonom Ajanı ve GPT‑5.2'deki biyolojik risk içerikleri örnek olarak verilebilir. Bu programlar açıldığında, ilgilenen araştırmacıları başvurmaya davet ediyoruz.
Yukarıda listelenen kategorilerin dışında da, araştırmacılar kullanıcıya doğrudan zarar verme yollarını mümkün kılan ve uygulanabilir, somut düzeltme adımları içeren açıklar tespit ederse, bu bildirimler duruma göre ödül kapsamında değerlendirilebilir. Güvenlik veya kötüye kullanım açısından somut bir etki göstermeyen genel içerik politikası ihlalleri ise bu programın kapsamı dışındadır. Örneğin, modelin kaba bir dil kullanmasına yol açan ya da arama motorlarıyla kolayca bulunabilecek bilgileri getirmesini sağlayan "jailbreak" girişimleri, kapsam dışı kabul edilir.
Katılmak isteyen araştırmacılar, Güvenlik ve Kötüye Kullanım Riskleri Ödül Programımız(yeni bir pencerede açılır) üzerinden başvuru yapabilir. Güvenli bir yapay zeka ekosistemi oluşturma hedefi doğrultusunda, araştırmacılar, etik hacker'lar ve güvenlik ve kötüye kullanım riskleri topluluğuyla birlikte çalışmayı sabırsızlıkla bekliyoruz.


