22 April 2026

Ngenalake OpenAI Privacy Filter

Model paling mutakhir kanggo nutupi informasi identitas pribadi (PII) ing teks

Lagi dimuat…

Dina iki, kita ngluncurake OpenAI Privacy Filter, model open-weight kanggo ndeteksi lan nyunting informasi identitas pribadi (PII) ing teks. Rilis iki dadi bagéan saka upaya luwih jembar kanggo ndhukung ekosistem piranti lunak sing luwih tangguh kanthi nyedhiyakake infrastruktur praktis kanggo para pangembang supaya bisa mbangun nganggo AI kanthi aman, kalebu piranti⁠ lan model⁠ sing nggampangake nerapake proteksi privasi lan keamanan sing kuwat wiwit awal.

Privacy Filter yaiku model cilik kanthi kapabilitas deteksi data pribadi tercanggih. Model iki dirancang kanggo alur kerja privasi kanthi kapasitas pangolahan dhuwur, lan bisa nindakake deteksi PII sing peka konteks ing teks ora terstruktur. Model iki bisa mlaku sacara lokal, tegese PII bisa ditutupi utawa disunting tanpa ninggalake mesinemu. Model iki ngolah input dawa kanthi efisien, nggawe keputusan penyuntingan kanthi cepet sajrone siji lintasan.

Ing OpenAI, kita nggunakake versi Privacy Filter sing wis di-fine-tune ing alur kerja kita dhewe sing njaga privasi. Kita ngembangake Privacy Filter amarga kita yakin yen kanthi kapabilitas AI paling anyar, kita bisa ningkatake standar privasi ngluwihi apa sing wis ana ing pasar. Versi Privacy Filter sing dirilis dina iki nggayuh kinerja paling mutakhir ing benchmark PII-Masking-300k, sawise didandani adhedhasar masalah anotasi sing kita temokake nalika evaluasi.

Kanthi rilis iki, para pangembang bisa mbukak Privacy Filter ing lingkungané dhewe, fine-tune kanggo kasus panggunaané dhewe, lan mbangun proteksi privasi sing luwih kuwat ing pipeline pelatihan, pengindeksan, logging, lan review.

Model cilik kanthi kapabilitas deteksi data pribadi tercanggih

Proteksi privasi ing sistem AI modern gumantung marang luwih saka mung pencocokan pola. Piranti deteksi PII tradisional asring gumantung marang aturan deterministik kanggo format kaya nomer telpon lan alamat email. Piranti kasebut bisa mlaku apik kanggo kasus sing sempit, nanging asring luput informasi pribadi sing luwih alus lan angel nangani konteks.

Privacy Filter dibangun kanthi pemahaman basa lan konteks sing luwih jero kanggo kinerja sing luwih nuansa. Kanthi nggabungake pemahaman basa sing kuwat karo sistem pelabelan khusus privasi, model iki bisa ndeteksi rentang PII sing luwih amba ing teks ora terstruktur, kalebu kasus nalika keputusan sing pas gumantung marang konteks. Model iki luwih bisa mbedakake antarane informasi sing kudu dipertahanke amarga sifaté publik, lan informasi sing kudu ditutupi utawa disunting amarga gegayutan karo individu privat.

Asilé yaiku model sing cukup kuwat kanggo menehi kinerja panyaringan privasi tingkat tercanggih. Ing wektu sing padha, model iki cukup cilik kanggo mlaku sacara lokal–tegese data sing durung disaring bisa tetep ana ing piranti, kanthi risiko paparan sing luwih cilik, tinimbang kudu dikirim menyang server kanggo de-identifikasi.

Ringkesan model

Privacy Filter yaiku model klasifikasi token bidirectional kanthi dekoding span. Model iki diwiwiti saka checkpoint pralatih autoregresif lan banjur diadaptasi dadi klasifikator token liwat taksonomi tetep kanggo label privasi. Tinimbang ngasilake teks token demi token, model iki menehi label marang urutan input sajrone siji lintasan lan banjur ngedekode span sing koheren kanthi prosedur Viterbi sing diwatesi.

Arsitektur iki menehi Privacy Filter sawatara sifat migunani kanggo panggunaan produksi:

Cepet lan efisien: kabeh token diwenehi label sajrone siji lintasan maju.
Peka konteks: prior basa ndadekake span PII bisa dideteksi adhedhasar konteks sakupenge.
Konteks dawa: model sing dirilis ndhukung nganti 128.000 token konteks.
Bisa diatur: pangembang bisa nyetel titik operasi kanggo ngimbangi recall lan precision gumantung alur kerjane.

Model sing dirilis nduweni total 1,5B parameter kanthi 50M parameter aktif.

Privacy Filter prédhiksi span ing wolung kategori:

private_person
private_address
private_email
private_phone
private_url
private_date
account_number
secret

Kategori account_number mbantu nutupi manéka warna nomer akun, kalebu info perbankan kaya nomer kertu kredit lan nomer rekening bank, déné secret mbantu nutupi bab kaya sandhi lan kunci API.

Label-label iki didekode nganggo tag span BIOES, sing mbantu ngasilake wates masking sing luwih resik lan luwih koheren.

Tuladha teks input

Subjek: Tindak lanjut Perencanaan Q2

Hai Jordan,

Matur nuwun maneh wis ketemu luwih dhisik dina iki. Aku pengin nindakaké tindak lanjut babagan jadwal wektu sing wis direvisi kanggo peluncuran Q2 lan ngonfirmasi manawa peluncuran produk dijadwalaké tanggal 18 September 2026. Kanggo referensi, file proyek kacathet ing 4829-1037-5581. Yen ana owah-owahan saka sisihmu, aja sungkan mbales ing kéné ing maya.chen@example.com utawa nelpon aku ing +1 (415) 555-0124.

Sugeng,

Maya Chen

Teks sawise pengenal pribadi ditutupi

Subjek: Tindak lanjut Perencanaan Q2

Hai [PRIVATE_PERSON],

Matur nuwun maneh wis ketemu luwih dhisik dina iki. Aku pengin nindakaké tindak lanjut babagan jadwal wektu sing wis direvisi kanggo peluncuran Q2 lan ngonfirmasi manawa peluncuran produk dijadwalaké tanggal [PRIVATE_DATE]. Kanggo referensi, file proyek kacathet ing [ACCOUNT_NUMBER]. Yen ana owah-owahan saka sisihmu, aja sungkan mbales ing kéné ing [PRIVATE_EMAIL] utawa nelpon aku ing [PRIVATE_PHONE].

Sugeng,

[PRIVATE_PERSON]

Cara kita mbangune

Kita ngembangake Privacy Filter ing sawetara tahap.

Kaping pisan, kita mbangun taksonomi privasi sing nemtokake jinis span sing kudu dideteksi model. Iki kalebu pengenal pribadi, rincian kontak, alamat, tanggal privat, manéka warna nomer akun kayata informasi kredit lan perbankan, lan rahasia kayata kunci API lan sandhi.

Kaping loro, kita ngowahi model basa pralatih dadi klasifikator token bidirectional kanthi ngganti head pemodelan basa nganggo head klasifikasi token lan nindakake post-training nganggo objektif klasifikasi terawasi.

Kaping telu, kita nglatih model nganggo campuran data publik sing kasedhiya lan data sintetis sing dirancang kanggo nyekel teks realistis lan pola privasi sing angel. Ing sawetara bagéan data publik sing labelé durung lengkap, kita nggunakake anotasi lan review sing dibantu model kanggo ningkatake cakupan. Kita uga ngasilake conto sintetis kanggo nambah keragaman format, konteks, lan subtipe privasi.

Nalika inferensi, prédhiksi tingkat token saka model didekode dadi span sing koheren nganggo dekoding urutan sing diwatesi. Pendekatan iki njaga pemahaman basa sing jembar saka model pralatih nalika sekaligus ngkhususake kanggo deteksi privasi.

Kinerja Privacy Filter

Kita ngevaluasi Privacy Filter ing benchmark standar lan uga ing evaluasi sintetis tambahan lan gaya obrolan sing dirancang kanggo nguji kasus sing luwih angel lan luwih peka konteks.

Ing benchmark PII-Masking-300k⁠(mbukak ing jendhela anyar), Privacy Filter nggayuh skor F1 96% (precision 94,04% lan recall 98,04%). Ing versi benchmark sing wis didandani lan ngetung masalah anotasi dataset sing ditemokake nalika review, skor F1 dadi 97,43% (precision 96,79% lan recall 98,08%).

Kita uga nemokake yen model iki bisa diadaptasi kanthi efisien. Fine-tuning sanajan mung nganggo data sithik bisa cepet ningkatake akurasi ing tugas khusus domain, nambah skor F1 saka 54% dadi 96% lan meh nyedhaki saturasi ing benchmark adaptasi domain sing kita evaluasi.

Ngluwihi kinerja benchmark, Privacy Filter dirancang kanggo panyaringan privasi praktis ing teks nyata sing rame. Iki kalebu dokumen dawa, referensi ambigu, string format campuran, lan rahasia sing gegandhengan karo piranti lunak. kertu model ⁠(mbukak ing jendhela anyar)uga nglaporake evaluasi terarah kanggo deteksi rahasia ing codebase lan stress test ing conto multibasa, adversarial, lan sing gumantung konteks.

Watesan

Privacy Filter dudu piranti anonimisasi, dudu sertifikasi kepatuhan, lan dudu pengganti review kebijakan ing setelan sing berisiko dhuwur. Model iki mung salah siji komponen ing sistem privacy-by-design sing luwih jembar.

Prilakune nggambarake taksonomi label lan wates keputusan sing digunakake nalika latihan. Organisasi sing beda bisa uga pengin kabijakan deteksi utawa masking sing beda, lan kabijakan kasebut bisa uga mbutuhake evaluasi ing domain dhewe utawa fine-tuning luwih lanjut. Kinerja uga bisa beda-beda antarane basa, aksara, konvensi penamaan, lan domain sing beda karo distribusi pelatihan.

Kaya kabeh model, Privacy Filter bisa nggawe kesalahan. Model iki bisa luput pengenal sing ora umum utawa referensi privat sing ambigu, lan bisa nyunting kakehan utawa kurang kanggo entitas nalika konteks winates, utamane ing urutan sing cekak. Ing domain kanthi sensitivitas dhuwur kayata alur kerja hukum, medis, lan keuangan, review manungsa lan evaluasi lan fine-tuning khusus domain tetep penting.

Kasedhiyan

Kita ngluncurake OpenAI Privacy Filter kanggo ndhukung proteksi privasi sing luwih kuwat ing saindenging ekosistem.

Model iki wis kasedhiya dina iki miturut lisensi Apache 2.0 ing Hugging Face⁠(mbukak ing jendhela anyar) lan Github⁠(mbukak ing jendhela anyar). Model iki ditujokake kanggo eksperimen, kustomisasi, lan deployment komersial, lan bisa di-fine-tune kanggo distribusi data lan kabijakan privasi sing beda-beda.

Bebarengan karo model iki, kita uga nuduhake dokumentasi sing nyakup arsitektur model, taksonomi label, kontrol dekoding, kasus panggunaan sing dituju, setelan evaluasi, lan watesan sing wis dingerteni, supaya tim bisa ngerti apa sing ditindakake model iki kanthi apik lan ing endi panggunaane kudu luwih ati-ati.

Ndelok mangsa ngarep

Proteksi privasi kanggo sistem AI iku upaya sing terus lumaku ing riset, desain produk, evaluasi, lan deployment.

Privacy Filter nggambarake salah siji arah sing kita anggep penting: model cilik lan efisien kanthi kapabilitas tercanggih ing tugas sing ditemtokake kanthi sempit nanging penting kanggo sistem AI ing donya nyata. Kita ngrilis model iki amarga kita yakin infrastruktur sing njaga privasi kudu luwih gampang dipriksa, dijalanke, diadaptasi, lan dandan.

Tujuan kita yaiku supaya model sinau babagan jagad, dudu babagan individu privat. Privacy Filter mbantu ndadekake iku bisa.

Kita ngrilis pratayang Privacy Filter iki kanggo nampa umpan balik saka komunitas riset lan privasi lan terus ngiterasi kinerja model.