Fara beint í aðalefni
OpenAI

Við kynnum OpenAI Privacy Filter

Háþróaða líkanið okkar til að fela persónugreinanlegar upplýsingar í texta

Hleður inn...

Í dag erum við að gefa út OpenAI Privacy Filter, opið vigtarlíkan til að greina og afmá persónugreinanlegar upplýsingar í texta. Þessi útgáfa er hluti af víðtækari viðleitni okkar til að styðja við seigara hugbúnaðarvistkerfi með því að veita forriturum hagnýta innviði til að byggja með gervigreind á öruggan hátt, þar á meðal verkfæri og líkön sem gera öfluga persónuvernd og öryggi auðveldari í innleiðingu frá upphafi.

Privacy Filter er lítið líkan með framarlega getu til að greina persónuupplýsingar. Það er hannað fyrir persónuverndarferla með miklum afköstum og getur greint PII í óskipulögðum texta með tilliti til samhengis. Það er hægt að keyra það staðbundið, sem þýðir að hægt er að dulkóða eða afmá PII án þess að það yfirgefi tölvuna þína. Það vinnur löng inntök á skilvirkan hátt og tekur ákvarðanir um afmáun í einni hraðri yfirferð.

Hjá OpenAI notum við fínstillta útgáfu af Privacy Filter í okkar eigin vinnuflæði sem vernda persónuvernd. Við þróuðum Privacy Filter vegna þess að við trúðum því að með nýjustu getu gervigreindar gætum við hækkað viðmiðin fyrir persónuvernd umfram það sem þegar var á markaðnum. Útgáfan af Privacy Filter sem við gefum út í dag nær framúrskarandi árangri á PII-Masking-300k-viðmiðinu, þegar leiðrétt er fyrir vandamálum í merkingum sem við greindum við matið.

Með þessari útgáfu geta forritarar keyrt Privacy Filter í eigin umhverfum, fínstillt það að sínum eigin notkunartilfellum og byggt upp öflugri persónuvernd í þjálfunar-, flokkunar-, skráningar- og yfirferðarferlum.

Lítið líkan með framarlega getu til að greina persónuupplýsingar

Persónuvernd í nútímalegum gervigreindarkerfum byggist á meira en mynstrasamsvörun. Hefðbundin PII-greiningarverkfæri reiða sig oft á ákvarðandi reglur fyrir snið eins og símanúmer og netföng. Þau geta virkað vel fyrir afmörkuð tilvik, en þau missa oft af fínlegri persónuupplýsingum og eiga í erfiðleikum með samhengi.

Privacy Filter er byggð með dýpri skilningi á tungumáli og samhengi fyrir blæbrigðaríkari frammistöðu. Með því að sameina öflugan málskilning og merkingarkerfi sem er sérsniðið að persónuvernd getur það greint fjölbreyttara svið PII í óskipulögðum texta, þar á meðal tilvik þar sem rétt ákvörðun ræðst af samhengi. Það getur greint betur á milli upplýsinga sem ætti að varðveita vegna þess að þær eru opinberar, og upplýsinga sem ætti að hylja eða afmá vegna þess að þær varða einkaaðila.

Niðurstaðan er líkan sem er nógu öflugt til að skila persónuverndarsíunarframmistöðu á framarlega sviði. Á sama tíma er líkanið nógu lítið til að hægt sé að keyra það staðbundið—þannig að gögn sem á eftir að sía má geyma í tækinu, með minni hættu á upplýsingaleka, í stað þess að þurfa að senda þau á netþjón til afauðkenningar. 

Yfirlit yfir líkan

Privacy Filter er tvíátta tókaflokkunarlíkan með afkóðunarsviði. Það byrjar frá sjálfframsæknum forþjálfuðum stöðupunkti og er síðan aðlagað sem tókaflokkari með föstu flokkunarkerfi persónuverndarmerkja. Í stað þess að búa til textatóka hvern fyrir sig merkir það inntaksröð í einni umferð og afkóðar síðan samhangandi hluta með skorðaðri Viterbi-aðferð.

Þessi högun gefur Privacy Filter nokkra gagnlega eiginleika til notkunar í framleiðslu:

  • Hratt og skilvirkt: allir tókar eru merkti í einni áframkeyrslu.
  • Meðvitund um samhengi: fyrri tungumálalíkan gerir kleift að greina PII-svæði út frá nærliggjandi samhengi.
  • Langt samhengi: útgefna líkanið styður allt að 128.000 tóka í samhengi.
  • Stillanlegt: forritarar geta stillt rekstrarpunkta til að vega og meta milli endurheimt og nákvæmni eftir vinnuferli sínu.

Útgefna líkanið hefur 1,5 milljarða heildarfæribreytur og 50 milljónir virkar færibreytur.

Privacy Filter spáir fyrir um átta flokka:

  • private_person
  • private_address
  • private_email
  • private_phone
  • private_url
  • private_date
  • account_number
  • secret

Flokkurinn account_number hjálpar til við að hylja margvísleg reikningsnúmer, þar á meðal bankaupplýsingar eins og kreditkortanúmer og bankareikningsnúmer, en secret hjálpar til við að hylja hluti eins og lykilorð og API-lykla.

Þessi merki eru afkóðuð með BIOES span-merkingum, sem hjálpar til við að mynda skýrari og samræmdari mörk fyrir yfirbreiðslu.

Dæmi um innsláttartexta

Efni: Eftirfylgni áætlanagerðar fyrir 2. ársfjórðung

Hæ Jordan,

Takk aftur fyrir fundinn fyrr í dag. Mig langaði að fylgja eftir með endurskoðaðri áætlun fyrir innleiðinguna á öðrum ársfjórðungi og staðfesta að vörukynningin sé áætluð 18. september 2026. Til viðmiðunar er verkefnaskráin skráð undir 4829-1037-5581. Ef eitthvað breytist hjá þér máttu endilega svara hér á maya.chen@example.com eða hringja í mig í númerið +1 (415) 555-0124.

Bestu kveðjur,

Maya Chen

Texti eftir að persónuauðkenni hafa verið hulin

Efni: Eftirfylgni áætlanagerðar fyrir 2. ársfjórðung

[PRIVATE_PERSON],

Takk aftur fyrir fundinn fyrr í dag. Mig langaði að fylgja eftir með endurskoðaðri áætlun fyrir innleiðinguna á öðrum ársfjórðungi og staðfesta að vörukynningin sé áætluð [PRIVATE_DATE]. Til viðmiðunar er verkefnaskráin skráð undir [ACCOUNT_NUMBER]. Ef eitthvað breytist hjá þér máttu endilega svara hér á [PRIVATE_EMAIL] eða hringja í mig í númerið [PRIVATE_PHONE].

Bestu kveðjur,

[PRIVATE_PERSON]

Hvernig við smíðuðum það

Við þróuðum Privacy Filter í nokkrum áföngum.

Fyrst bjuggum við til flokkun persónuverndar sem skilgreinir þær tegundir textabila sem líkanið á að greina. Þetta felur í sér persónugreinanleg auðkenni, samskiptaupplýsingar, heimilisföng, einkadagsetningar, margs konar reikningsnúmer, svo sem kreditkorta- og bankaupplýsingar, og leyndarmál á borð við API-lykla og lykilorð.

Í öðru lagi breyttum við fyrirfram þjálfuðu tungumálalíkani í tvíátta flokkara fyrir tóka með því að skipta út haus tungumálalíkansins fyrir flokkunarhaus og fínstilla það síðan með yfirsettu flokkunarmarkmiði. 

Í þriðja lagi þjálfuðum við líkan á blöndu af opinberlega aðgengilegum og tilbúnum gögnum sem var hönnuð til að ná bæði yfir raunhæfan texta og flókin persónuverndarmynstur. Í þeim hlutum opinberu gagnanna þar sem merkingar voru ófullnægjandi notuðum við merkingar og yfirferð studd af líkani til að bæta þekju. Við bjuggum einnig til tilbúin dæmi til að auka fjölbreytni í sniðum, samhengi og undirflokkum persónuverndar.

Við úrvinnslu eru spár líkansins á tókastigi afkóðaðar í samhangandi hluta með skorðaðri raðafkóðun. Þessi nálgun varðveitir víðtækan tungumálaskilning forþjálfaða líkansins og sérhæfir það til að greina persónuvernd.

Hvernig Privacy Filter stendur sig

Við mátum Privacy Filter á stöðluðum viðmiðum og á viðbótarmötum af tilbúnu tagi og í spjallstíl sem voru hönnuð til að prófa erfiðari tilvik sem eru næmari fyrir samhengi.

Á PII-Masking-300k(opnast í nýjum glugga) viðmiðinu nær Privacy Filter F1-stiginu 96% (94,04% nákvæmni og 98,04% endurheimt). Í leiðréttri útgáfu af viðmiðunarstaðlinum sem tekur tillit til vandamála við merkingar gagnasafns sem komu í ljós við yfirferð er F1-stigið 97,43% (96,79% nákvæmni og 98,08% endurheimt).

Við komumst einnig að því að megi aðlaga líkanið á skilvirkan hátt. Fínstilling á jafnvel litlu magni gagna bætir fljótt nákvæmni í verkefnum á tilteknu sviði, hækkar F1-stig úr 54% í 96% og nær nærri mettun á viðmiði fyrir aðlögun að sviði sem við mátum.

Umfram frammistöðu í viðmiðum er Privacy Filter hannað fyrir hagnýta persónuverndarsíun í raunverulegum texta með miklum truflunum. Það felur í sér löng skjöl, óljósar tilvísanir, strengi á blönduðu sniði og leyndarmál tengd hugbúnaði. Líkanskort (opnast í nýjum glugga)greinir einnig frá markvissu mati á greiningu leyndarmála í kóðagrunnum og álagsprófum á fjöltyngdum, andstæðingslegum og samhengisháðum dæmum.

Takmarkanir

Privacy Filter er ekki nafnleyndarverkfæri, vottun um reglufylgni eða staðgengill fyrir endurskoðun stefnu í háhættuaðstæðum. Það er einn þáttur í víðtækara kerfi sem byggir á persónuvernd frá upphafi.

Hegðun þess endurspeglar flokkunarkerfi merkinga og ákvarðanamörkin sem það var þjálfað á. Mismunandi stofnanir kunna að vilja ólíkar reglur um greiningu eða huldun, og þær reglur gætu krafist mats innan viðkomandi sviðs eða frekari fínstillingar. Frammistaða getur einnig verið breytileg eftir tungumálum, ritkerfum, nafnavenjum og sviðum sem eru frábrugðin þjálfunardreifingunni.

Eins og öll líkön getur Privacy Filter gert mistök. Það getur misst af óalgengum auðkennum eða óljósum persónugreinanlegum tilvísunum, og það getur afmáð verur of mikið eða of lítið þegar samhengi er takmarkað, sérstaklega í stuttum runum. Á viðkvæmum sviðum eins og í lagalegum, læknisfræðilegum og fjármálatengdum verkferlum eru mannleg yfirferð og sviðssértækt mat og fínstilling enn mikilvæg.

Aðgengi

Við kynnum OpenAI Privacy Filter til að styðja við öflugri persónuvernd í vistkerfinu.

Líkanið er í boði frá og með deginum í dag undir Apache 2.0-leyfinu á Hugging Face(opnast í nýjum glugga) og Github(opnast í nýjum glugga). Það er ætlað til tilrauna, sérsniðningar og notkunar í atvinnuskyni, og hægt er að fínstilla það fyrir mismunandi gagnadreifingar og persónuverndarstefnu.

Samhliða líkaninu deilum við skjölum sem fjalla um gerð líkansins, flokkunarfræði merkimiða, stýringar fyrir afkóðun, fyrirhuguð notkunartilvik, uppsetningu mats og þekktar takmarkanir svo teymi geti skilið bæði hvað líkanið gerir vel og hvar beri að gæta varúðar við notkun þess.

Horft fram á veginn

Persónuvernd gervigreindarkerfa er viðvarandi viðfangsefni í rannsóknum, vöruhönnun, mati og dreifingu.

Privacy Filter endurspeglar eina stefnu sem við teljum mikilvæga: lítil og skilvirk líkön með framarlega getu í þröngt skilgreindum verkefnum sem skipta máli fyrir gervigreindarkerfi í raunheimum. Við erum að gefa það út vegna þess að við teljum að innviðir sem vernda friðhelgi einkalífsins ættu að vera auðveldari að skoða, keyra, aðlaga og bæta.

Markmið okkar er að líkön læri um heiminn, ekki um einstaklinga. Privacy Filter hjálpar til við að gera það mögulegt.

Við erum að gefa út þessa forskoðun á Privacy Filter til að fá endurgjöf frá rannsóknar- og persónuverndarsamfélaginu og bæta enn frekar frammistöðu líkansins.