22 Nisan 2026

OpenAI Privacy Filter ile tanışın

Metinlerde kişisel tanımlayıcı bilgilerini (PII) maskelemeye yönelik son teknoloji modelimiz

Yükleniyor...

Bugün, metinlerdeki kişisel tanımlayıcı bilgilerini (PII) tespit edip maskeleyen açık ağırlıklı bir modeli, OpenAI Privacy Filter'ı kullanıma sunuyoruz. Bu lansman, geliştiricilere yapay zekayı güvenli şekilde kullanabilecekleri pratik altyapılar sunarak daha dayanıklı bir yazılım ekosistemi oluşturma yönündeki daha geniş kapsamlı çalışmalarımızın bir parçasıdır. Bu kapsamda, güçlü gizlilik ve güvenlik önlemlerini en baştan uygulamayı kolaylaştıran araçlar⁠ ve modeller⁠ geliştiriyoruz.

Privacy Filter, küçük boyutuna rağmen en üst seviye kişisel veri tespiti yeteneğine sahip bir modeldir. Yüksek işlem kapasitesine sahip gizlilik iş akışları için tasarlanmıştır ve yapılandırılmamış metinlerde bağlamı dikkate alarak PII tespiti yapabilir. Yerel olarak çalışabilir; bu sayede kişisel veriler, cihazınızdan çıkmadan maskelenebilir veya sansürlenebilir. Uzun metinleri verimli şekilde işleyerek, hızlı ve tek geçişte maskeleme kararları alır.

OpenAI olarak, gizliliği koruyan iş akışlarımızda Privacy Filter'ın ince ayar yapılmış bir versiyonunu kullanıyoruz. Privacy Filter’ı, en yeni yapay zeka yetenekleri sayesinde gizlilik standardını piyasada mevcut olan çözümlerin ötesine taşıyabileceğimize inandığımız için geliştirdik. Bugün sunduğumuz Privacy Filter sürümü, değerlendirme sırasında tespit ettiğimiz etiketleme sorunları düzeltildiğinde, PII-Masking-300k kıyaslamasında son teknoloji düzeyinde performans sergiliyor.

Bu sürümle birlikte geliştiriciler, Privacy Filter'ı kendi ortamlarında çalıştırabilir, kendi kullanım senaryolarına göre ince ayar yapabilir ve eğitim, dizin oluşturma, günlük kaydı ve inceleme süreçlerine daha güçlü gizlilik korumaları entegre edebilir.

En üst seviye kişisel veri tespiti yeteneğine sahip kompakt bir model

Modern yapay zeka sistemlerinde gizliliği korumak, yalnızca örüntü eşleştirmeye dayanmaz. Geleneksel PII tespit araçları genellikle telefon numarası veya e-posta adresi gibi formatlara dayalı, önceden tanımlı kurallarla çalışır. Bu yöntemler belirli senaryolarda etkili olsa da daha örtük kişisel bilgileri kaçırabilir ve bağlamı anlamakta zorlanır.

Privacy Filter, daha incelikli ve isabetli sonuçlar elde etmek için gelişmiş dil ve bağlam anlayışıyla tasarlanmıştır. Güçlü dil anlama yeteneğini, gizliliğe özel bir etiketleme sistemiyle birleştirerek, yapılandırılmamış metinlerde daha geniş bir PII yelpazesini tespit edebilir; özellikle doğru kararın bağlama bağlı olduğu durumlarda etkili sonuçlar verir. Kamuya açık olduğu için korunması gereken bilgiler ile özel bir kişiye ait olduğu için maskelenmesi veya redakte edilmesi gereken bilgileri daha doğru şekilde ayırt edebilir.

Ortaya çıkan model, en üst seviye gizlilik filtreleme performansını sunacak kadar güçlüdür. Aynı zamanda, yeterince küçük olduğu için yerel olarak çalıştırılabilir; bu da henüz filtrelenmemiş verinin bir sunucuya gönderilmesine gerek kalmadan cihaz üzerinde kalmasını sağlar ve veri sızıntısı riskini azaltır.

Modele genel bakış

Privacy Filter, span çözümleme kullanan çift yönlü bir token sınıflandırma modelidir. Otoregresif bir ön eğitimli modelden başlar ve ardından sabit bir gizlilik etiketleri taksonomisi üzerinde token sınıflandırıcı olarak uyarlanır. Metni token'lar halinde üretmek yerine, girdiyi tek geçişte etiketler ve ardından kısıtlı bir Viterbi yöntemiyle tutarlı span'leri çözümler.

Bu mimari, Privacy Filte'’a canlı ortamda kullanım için önemli avantajlar kazandırır:

Hızlı ve verimli: Tüm token'lar tek bir ileri geçişte etiketlenir.
Bağlama duyarlı: Dil modeli ön bilgisi sayesinde, PII içeren span'ler, çevresindeki bağlama göre tespit edilir.
Uzun bağlam desteği: Yayınlanan model, 128.000 token'a kadar bağlamı destekler.
Yapılandırılabilir: Geliştiriciler, kendi iş akışlarına göre duyarlılık ile kesinlik arasında denge kuracak şekilde modeli ayarlayabilir.

Yayınlanan model toplam 1,5 milyar parametreye sahiptir; bunun 50 milyonu aktiftir.

Privacy Filter, span'leri sekiz kategoride tahmin eder:

private_person
private_address
private_email
private_phone
private_url
private_date
account_number
secret

account_number kategorisi; kredi kartı ve banka hesap numaraları gibi finansal bilgiler dahil olmak üzere çok çeşitli hesap numaralarını maskelemeye yardımcı olur. secret kategorisi ise parola ve API anahtarları gibi hassas bilgilerin maskelenmesini sağlar.

Bu etiketler, BIOES span etiketleri kullanılarak çözülür; bu da daha temiz ve tutarlı maskeleme sınırları elde edilmesine yardımcı olur.

Girdi metni örneği

Konu: 2. Çeyrek Planlama Takibi

Merhaba Jordan,

Bugün yaptığımız görüşme için tekrar teşekkürler. 2. çeyrek lansmanı için güncellenmiş takvimi paylaşmak ve ürün lansmanı tarihinin 18 Eylül 2026 olarak planlandığını teyit etmek istedim. Proje dosyasının 4829-1037-5581 altında yer aldığını bilginize sunarım. Sizin tarafınızda herhangi bir değişiklik olursa buradan maya.chen@example.com adresine yanıt verebilir veya +1 (415) 555-0124 numaralı telefondan bana ulaşabilirsiniz.

Saygılarımla,

Maya Chen

Kişisel tanımlayıcılar maskelendikten sonraki metin

Konu: 2. Çeyrek Planlama Takibi

Merhaba [PRIVATE_PERSON],

Bugün yaptığımız görüşme için tekrar teşekkürler. 2. çeyrek lansmanı için güncellenmiş takvimi paylaşmak ve ürün lansmanı tarihinin [PRIVATE_DATE] olarak planlandığını teyit etmek istedim. Proje dosyasının [ACCOUNT_NUMBER] altında yer aldığını bilginize sunarım. Sizin tarafınızda herhangi bir değişiklik olursa buradan [PRIVATE_EMAIL] adresine yanıt verebilir veya [PRIVATE_PHONE] numaralı telefondan bana ulaşabilirsiniz.

Saygılarımla,

[PRIVATE_PERSON]

Nasıl geliştirildi?

Privacy Filter'ı birkaç aşamada geliştirdik.

İlk olarak, modelin tespit etmesi gereken span'leri tanımlayan bir gizlilik taksonomisi oluşturduk. Bu kapsamda; kişisel tanımlayıcılar, iletişim bilgileri, adresler, özel tarihler, kredi kartı ve banka bilgileri gibi çeşitli hesap numarası türleri ve API anahtarları ile parolalar gibi gizli bilgiler yer alır.

İkinci olarak, önceden eğitilmiş bir dil modelini, dil modelleme katmanını token sınıflandırma katmanıyla değiştirerek çift yönlü bir token sınıflandırıcıya dönüştürdük ve denetimli bir sınıflandırma hedefiyle yeniden eğittik.

Üçüncü olarak, hem gerçekçi metinleri hem de zorlayıcı gizlilik örüntülerini kapsayacak şekilde tasarlanmış, herkese açık ve sentetik verilerin bir karışımıyla modeli eğittik. Herkese açık verinin etiketlerinin eksik olduğu bölümlerde, kapsama alanını artırmak için model destekli etiketleme ve gözden geçirme yöntemlerinden yararlandık. Ayrıca, farklı formatlar, bağlamlar ve gizlilik alt türleri arasında çeşitliliği artırmak amacıyla sentetik örnekler ürettik.

Çıkarım aşamasında, modelin token düzeyindeki tahminleri, kısıtlı dizi çözümleme yöntemiyle tutarlı metin parçalarına dönüştürülür. Bu yaklaşım, önceden eğitilmiş modelin güçlü dil anlama yeteneğini korurken onu gizlilik tespiti için özelleştirir.

Privacy Filter'ın performansı

Privacy Filter'ı, standart kıyaslamaların yanı sıra daha zor ve bağlama daha duyarlı senaryoları ölçmek için tasarlanmış ek sentetik ve sohbet tarzı değerlendirmelerde test ettik.

PII-Masking-300k⁠(yeni bir pencerede açılır) kıyaslamasında Privacy Filter, %96 F1 skoru elde ediyor (%94,04 kesinlik ve %98,04 duyarlılık). Değerlendirme sırasında tespit edilmiş veri seti etiketleme sorunlarını düzelten bir versiyonda ise F1 skoru %97,43'e çıkıyor (%96,79 kesinlik ve %98,08 duyarlılık).

Modelin verimli şekilde uyarlanabildiğini de gözlemledik. Küçük miktarda veriyle yapılan ince ayar bile alan özelindeki görevlerde doğruluğu hızla artırıyor; F1 skoru %54'ten %96'ya yükseliyor ve değerlendirdiğimiz alan uyarlama kıyaslamasında doygunluk seviyesine yaklaşıyor.

Kıyaslama sonuçlarının ötesinde, Privacy Filter gürültülü ve gerçek dünya metinlerinde pratik gizlilik filtreleme için tasarlanmıştır. Bu kapsamda; uzun belgeler, belirsiz referanslar, farklı formatların bir arada olduğu metinler ve yazılıma ait gizli bilgiler de yer alır. Model kartıbnda ⁠(yeni bir pencerede açılır)ayrıca, kod tabanlarında gizli bilgi tespiti için hedeflenmiş değerlendirmeler ve çok dilli, karşıt ve bağlama duyarlı örnekler üzerinde stres testleri de raporlanmaktadır.

Sınırlamalar

Privacy Filter bir anonimleştirme aracı, bir uyumluluk sertifikası ya da kritik kullanım senaryolarında politika incelemesinin yerine geçecek bir çözüm değildir. Daha kapsamlı bir "gizlilik odaklı tasarım" yaklaşımının yalnızca bir bileşenidir.

Davranışı, eğitildiği etiket taksonomisi ve karar sınırlarıyla şekillenir. Farklı kuruluşlar, farklı tespit veya maskeleme politikalarına ihtiyaç duyabilir; bu politikalar da alan içi değerlendirme veya ek ince ayar gerektirebilir. Performans, eğitim verisinden farklılık gösteren diller, alfabeler, isimlendirme alışkanlıkları ve alanlara göre değişebilir.

Tüm modeller gibi Privacy Filter da hata yapabilir. Nadir kullanılan tanımlayıcıları veya belirsiz özel referansları kaçırabilir; özellikle kısa metinlerde bağlamın sınırlı olduğu durumlarda bazı varlıkları gereğinden fazla ya da yetersiz şekilde maskeleyebilir. Hukuk, sağlık ve finans gibi yüksek hassasiyet gerektiren alanlarda, insan denetimi ile alan özelinde değerlendirme ve ince ayar önemini korur.

Kullanılabilirlik

OpenAI Privacy Filter'ı ekosistem genelinde daha güçlü gizlilik koruma yöntemlerini desteklemek amacıyla kullanıma sunuyoruz.

Model, bugün itibarıyla Apache 2.0 lisansı kapsamında Hugging Face⁠(yeni bir pencerede açılır) ve Github⁠(yeni bir pencerede açılır) üzerinden erişime açıktır. Deneysel kullanım, özelleştirme ve ticari olarak devreye alım için tasarlanmıştır; farklı veri dağılımlarına ve gizlilik politikalarına göre ince ayar yapılabilir.

Modelle birlikte model mimarisi, etiket taksonomisi, çözümleme kontrolleri, kullanım senaryoları, değerlendirme yöntemi ve bilinen sınırlamalar gibi konuları kapsayan dokümantasyonu da paylaşıyoruz. Ekipler bu dokümantasyonu kullanarak modelin güçlü yönlerini ve dikkatli kullanılması gereken durumları daha iyi anlayabilir.

Geleceğe bakış

Yapay zeka sistemlerinde gizlilik koruması; araştırma, ürün tasarımı, değerlendirme ve devreye alım süreçlerini kapsayan sürekli bir çalışmadır.

Privacy Filter, bize göre önemli bir yönü temsil ediyor: gerçek dünya yapay zeka sistemleri için kritik olan, dar tanımlı görevlerde en üst seviye performansı sunan küçük ve verimli modeller. Bu modeli yayınlıyoruz çünkü gizliliği koruyan altyapıların daha kolay incelenebilmesi, çalıştırılabilmesi, uyarlanabilmesi ve geliştirilebilmesi gerektiğine inanıyoruz.

Hedefimiz, modellerin dünyayı öğrenmesi; özel bireyler hakkında veri edinmesi değil. Privacy Filter bunu mümkün kılmaya yardımcı oluyor.

Privacy Filter’ın bu önizleme sürümünü, araştırma ve gizlilik topluluğundan geri bildirim almak ve model performansını daha da geliştirmek amacıyla paylaşıyoruz.

Yazar

OpenAI

Okumaya devam et

Tümünü görüntüle

OpenAI ve Hugging Face güvenlik olayını ele alıyor

Güvenlik21 Tem 2026

GPT-5.6: Hedefleriniz büyüdükçe ölçeklenen en üst seviye zeka

Ürün9 Tem 2026

Kodlama değerlendirmelerinde sinyali gürültüden ayırmak

Araştırma8 Tem 2026