Пређите на главни садржај
OpenAI

Predstavljamo OpenAI Privacy Filter

Naš najsavremeniji model za maskiranje ličnih podataka (PII) u tekstu

Учитавање…

Danas objavljujemo OpenAI Privacy Filter, model otvorenih težina za otkrivanje i redigovanje ličnih podataka (PII) u tekstu. Ovo izdanje je deo naših širih napora da podržimo otporniji softverski ekosistem pružajući programerima praktičnu infrastrukturu za bezbednu izgradnju uz AI, uključujući alate i modele koji od početka olakšavaju primenu snažne zaštite privatnosti i bezbednosti.

Privacy Filter je mali model sa graničnim sposobnostima za otkrivanje ličnih podataka. Dizajniran je za radne tokove privatnosti velike propusne moći i može da vrši kontekstualno svesno otkrivanje PII u nestrukturisanom tekstu. Može da radi lokalno, što znači da PII može biti maskiran ili redigovan bez napuštanja vašeg računara. Efikasno obrađuje duge ulaze, donoseći odluke o redigovanju u jednom brzom prolazu.

U OpenAI-ju koristimo fino podešenu verziju Privacy Filter-a u sopstvenim radnim tokovima za očuvanje privatnosti. Razvili smo Privacy Filter jer verujemo da uz najnovije AI mogućnosti možemo podići standard privatnosti iznad onoga što je već postojalo na tržištu. Verzija Privacy Filter-a koju danas objavljujemo postiže najsavremenije performanse na reperu PII-Masking-300k, kada se ispravi za probleme sa anotacijama koje smo identifikovali tokom evaluacije.

Ovim izdanjem programeri mogu da pokreću Privacy Filter u svojim okruženjima, fino ga podešavaju za sopstvene slučajeve upotrebe i ugrađuju snažniju zaštitu privatnosti u tokove za obuku, indeksiranje, evidentiranje i pregled.

Mali model sa graničnim sposobnostima za otkrivanje ličnih podataka

Zaštita privatnosti u savremenim AI sistemima zavisi od više od prostog uparivanja obrazaca. Tradicionalni alati za otkrivanje PII često se oslanjaju na deterministička pravila za formate poput brojeva telefona i imejl adresa. Mogu dobro da rade za uske slučajeve, ali često propuštaju suptilnije lične informacije i imaju poteškoća sa kontekstom.

Privacy Filter je izgrađen sa dubljim razumevanjem jezika i konteksta radi nijansiranijih performansi. Kombinovanjem snažnog razumevanja jezika sa sistemom označavanja specifičnim za privatnost, može da otkrije širi opseg PII u nestrukturisanom tekstu, uključujući slučajeve u kojima prava odluka zavisi od konteksta. Može bolje da razlikuje informacije koje treba zadržati zato što su javne od informacija koje treba maskirati ili redigovati zato što se odnose na privatno lice.

Rezultat je model koji je dovoljno snažan da pruži granične performanse filtriranja privatnosti. Istovremeno, model je dovoljno mali da može da se pokreće lokalno – što znači da podaci koji tek treba da budu filtrirani mogu ostati na uređaju, uz manji rizik od izlaganja, umesto da moraju da se šalju na server radi deidentifikacije. 

Pregled modela

Privacy Filter je dvosmerni model za klasifikaciju tokena sa dekodiranjem raspona. Počinje od autoregresivne unapred obučene kontrolne tačke, a zatim se prilagođava u klasifikator tokena nad fiksnom taksonomijom oznaka privatnosti. Umesto generisanja teksta token po token, on označava ulaznu sekvencu u jednom prolazu, a zatim dekodira koherentne raspone pomoću ograničenog Viterbi postupka.

Ova arhitektura daje Privacy Filter-u nekoliko korisnih svojstava za produkcionu upotrebu:

  • Brz i efikasan: svi tokeni se označavaju u jednom prolazu unapred.
  • Svestan konteksta: jezički prior omogućava otkrivanje PII raspona na osnovu okolnog konteksta.
  • Dug kontekst: objavljeni model podržava do 128.000 токена konteksta.
  • Konfigurabilan: programeri mogu da podešavaju radne tačke kako bi pravili kompromis između odziva i preciznosti u skladu sa svojim radnim tokom.

Objavljeni model ima ukupno 1,5B parametara, od čega je 50M aktivnih parametara.

Privacy Filter predviđa raspone u osam kategorija:

  • private_person
  • private_address
  • private_email
  • private_phone
  • private_url
  • private_date
  • account_number
  • secret

Kategorija account_number pomaže u maskiranju širokog spektra brojeva naloga, uključujući bankarske informacije poput brojeva kreditnih kartica i brojeva bankovnih računa, dok secret pomaže u maskiranju stvari poput lozinki i API ključeva.

Ove oznake se dekodiraju pomoću BIOES oznaka raspona, što pomaže da se dobiju čistije i koherentnije granice maskiranja.

Primer ulaznog teksta

Predmet: Naknadni nastavak planiranja za Q2

Zdravo Jordan,

Još jednom hvala na sastanku ranije danas. Želeo/la sam da se javim u vezi sa revidiranim vremenskim okvirom za uvođenje u Q2 i da potvrdim da je lansiranje proizvoda zakazano za 18. septembar 2026. Za referencu, projektni fajl je naveden pod 4829-1037-5581. Ako se bilo šta promeni sa vaše strane, slobodno odgovorite ovde na maya.chen@example.com ili me pozovite na +1 (415) 555-0124.

Srdačno,

Maya Chen

Tekst nakon maskiranja ličnih identifikatora

Predmet: Naknadni nastavak planiranja za Q2

Zdravo [PRIVATE_PERSON],

Još jednom hvala na sastanku ranije danas. Želeo/la sam da se javim u vezi sa revidiranim vremenskim okvirom za uvođenje u Q2 i da potvrdim da je lansiranje proizvoda zakazano za [PRIVATE_DATE]. Za referencu, projektni fajl je naveden pod [ACCOUNT_NUMBER]. Ako se bilo šta promeni sa vaše strane, slobodno odgovorite ovde na [PRIVATE_EMAIL] ili me pozovite na [PRIVATE_PHONE].

Srdačno,

[PRIVATE_PERSON]

Kako smo ga napravili

Razvili smo Privacy Filter u nekoliko faza.

Prvo smo izgradili taksonomiju privatnosti koja definiše tipove raspona koje model treba da otkriva. To uključuje lične identifikatore, kontakt podatke, adrese, privatne datume, mnogo različitih vrsta brojeva naloga kao što su kreditne i bankarske informacije, kao i tajne poput API ključeva i lozinki.

Drugo, pretvorili smo unapred obučeni jezički model u dvosmerni klasifikator tokena zamenom glave za jezičko modeliranje glavom za klasifikaciju tokena i dodatno ga obučili uz nadzirani cilj klasifikacije. 

Treće, obučavali smo na mešavini javno dostupnih i sintetičkih podataka osmišljenih da obuhvate i realističan tekst i teške obrasce privatnosti. U delovima javnih podataka gde oznake nisu bile potpune, koristili smo anotaciju i pregled uz pomoć modela da poboljšamo pokrivenost. Takođe smo generisali sintetičke primere da povećamo raznovrsnost formata, konteksta i podtipova privatnosti.

U vreme inferencije, predviđanja modela na nivou tokena dekodiraju se u koherentne raspone pomoću ograničenog sekvencijalnog dekodiranja. Ovaj pristup čuva široko jezičko razumevanje unapred obučenog modela, a istovremeno ga specijalizuje za otkrivanje privatnosti.

Kako se Privacy Filter pokazao

Evaluirali smo Privacy Filter na standardnim reperima, kao i na dodatnim sintetičkim i evaluacijama u stilu ćaskanja osmišljenim da testiraju teže slučajeve osetljivije na kontekst.

Na reperu PII-Masking-300k(отвара се у новом прозору), Privacy Filter postiže F1 skor od 96% (94,04% preciznosti i 98,04% odziva). Na ispravljenoj verziji repera koja uzima u obzir probleme sa anotacijama skupa podataka identifikovane tokom pregleda, F1 skor je 97,43% (96,79% preciznosti i 98,08% odziva).

Takođe smo utvrdili da model može efikasno da se prilagodi. Fino podešavanje čak i na maloj količini podataka brzo poboljšava tačnost na zadacima specifičnim za domen, povećavajući F1 skor sa 54% na 96%, i približava se zasićenju na reperu prilagođavanja domenu koji smo evaluirali.

Pored performansi na reperima, Privacy Filter je dizajniran za praktično filtriranje privatnosti u bučnom tekstu iz stvarnog sveta. To uključuje duge dokumente, dvosmislene reference, niske mešovitog formata i tajne povezane sa softverom. Kartica modela (отвара се у новом прозору)takođe sadrži ciljanu evaluaciju otkrivanja tajni u bazama koda i stres testove kroz višejezične, protivničke i od konteksta zavisne primere.

Ograničenja

Privacy Filter nije alat za anonimizaciju, sertifikat usklađenosti niti zamena za pregled politika u okruženjima sa visokim ulozima. On je jedna komponenta u širem sistemu privatnosti po dizajnu.

Njegovo ponašanje odražava taksonomiju oznaka i granice odlučivanja na kojima je obučen. Različite organizacije mogu želeti različite politike otkrivanja ili maskiranja, a te politike mogu zahtevati evaluaciju u domenu ili dodatno fino podešavanje. Performanse takođe mogu varirati među jezicima, pismima, konvencijama imenovanja i domenima koji se razlikuju od distribucije obuke.

Kao i svi modeli, Privacy Filter može da greši. Može da propusti neuobičajene identifikatore ili dvosmislene privatne reference, a može i previše ili premalo da rediguje entitete kada je kontekst ograničen, posebno u kratkim sekvencama. U domenima visoke osetljivosti kao što su pravni, medicinski i finansijski radni tokovi, ljudski pregled i evaluacija i fino podešavanje specifični za domen ostaju važni.

Dostupnost

Objavljujemo OpenAI Privacy Filter da bismo podržali snažniju zaštitu privatnosti širom ekosistema.

Model je od danas dostupan pod licencom Apache 2.0 na platformama Hugging Face(отвара се у новом прозору) i Github(отвара се у новом прозору). Namenjen je eksperimentisanju, prilagođavanju i komercijalnoj primeni, a može se fino podešavati za različite distribucije podataka i politike privatnosti.

Uz model delimo i dokumentaciju koja pokriva arhitekturu modela, taksonomiju oznaka, kontrole dekodiranja, predviđene slučajeve upotrebe, postavku evaluacije i poznata ograničenja, kako bi timovi mogli da razumeju i šta model radi dobro i gde ga treba pažljivo koristiti.

Pogled unapred

Zaštita privatnosti za AI sisteme je stalan napor kroz istraživanje, dizajn proizvoda, evaluaciju i primenu.

Privacy Filter odražava jedan pravac za koji verujemo da je važan: male, efikasne modele sa graničnim sposobnostima u usko definisanim zadacima koji su važni za AI sisteme iz stvarnog sveta. Objavljujemo ga zato što mislimo da bi infrastrukturu za očuvanje privatnosti trebalo biti lakše pregledati, pokretati, prilagođavati i unapređivati.

Naš cilj je da modeli uče o svetu, a ne o privatnim pojedincima. Privacy Filter pomaže da to bude moguće.

Objavljujemo ovaj pregled Privacy Filter-a kako bismo dobili povratne informacije od istraživačke zajednice i zajednice za privatnost i dalje unapređivali performanse modela.