OpenAI प्राइवेसी फ़िल्टर का परिचय
टेक्स्ट में व्यक्तिगत पहचान योग्य जानकारी (PII) छिपाने के लिए हमारा अत्याधुनिक मॉडल
आज हम OpenAI Privacy Filter जारी कर रहे हैं, जो टेक्स्ट में व्यक्तिगत पहचान योग्य जानकारी (PII) का पता लगाने और उसे रिडैक्ट करने के लिए एक ओपन वेट मॉडल्स है. यह रिलीज़ हमारी व्यापक कोशिश का हिस्सा है, जिसका उद्देश्य डेवलपर्स को AI के साथ सुरक्षित तरीके से निर्माण करने के लिए व्यावहारिक इन्फ्रास्ट्रक्चर उपलब्ध कराकर एक ज़्यादा रेज़िलिएंट सॉफ़्टवेयर इकोसिस्टम को सपोर्ट करना है. इसमें टूल्स और मॉडल शामिल हैं, जो शुरुआत से ही मज़बूत प्राइवेसी और सिक्योरिटी सुरक्षा उपायों को लागू करना आसान बनाते हैं.
Privacy Filter एक छोटा मॉडल है जिसमें व्यक्तिगत डेटा का पता लगाने की अत्याधुनिक क्षमता है. इसे हाई-थ्रूपुट प्राइवेसी वर्कफ़्लोज़ के लिए डिज़ाइन किया गया है और यह असंरचित टेक्स्ट में PII का कॉन्टेक्स्ट-अवेयर डिटेक्शन करने में सक्षम है. यह लोकल रूप से चल सकता है, जिसका मतलब है कि PII को आपकी मशीन से बाहर गए बिना मास्क या रिडैक्ट किया जा सकता है. यह लंबे इनपुट को कुशलतापूर्वक प्रोसेस करता है, जिससे एक ही तेज़ पास में रिडैक्शन से जुड़े निर्णय लिए जा सकते हैं.
OpenAI में, हम अपने गोपनीयता-संरक्षित वर्कफ़्लो में Privacy Filter के फ़ाइन-ट्यून किए गए संस्करण का उपयोग करते हैं. हमने Privacy Filter विकसित किया क्योंकि हमारा मानना था कि AI की नवीनतम क्षमताओं के साथ, हम प्राइवेसी के मानक को बाज़ार में पहले से मौजूद विकल्पों से भी आगे ऊंचा उठा सकते हैं. Privacy Filter का जो संस्करण हम आज जारी कर रहे हैं, वह PII-Masking-300k बेंचमार्क पर अत्याधुनिक प्रदर्शन करता है, जब इसे उन एनोटेशन समस्याओं के लिए ठीक किया जाता है जिन्हें हमने मूल्यांकन के दौरान पहचाना.
इस रिलीज़ के साथ, डेवलपर्स अपने खुद के एन्वायर्नमेंट्स में प्राइवेसी फ़िल्टर चला सकते हैं, उसे अपने उपयोग मामलों के अनुसार फ़ाइन-ट्यून कर सकते हैं, और ट्रेनिंग, इंडेक्सिंग, लॉगिंग और रिव्यू पाइपलाइन्स में और मज़बूत प्राइवेसी सुरक्षा तैयार कर सकते हैं.
आधुनिक AI सिस्टम्स में प्राइवेसी प्रोटेक्शन सिर्फ पैटर्न मैचिंग पर निर्भर नहीं करती, बल्कि उससे कहीं अधिक पर निर्भर करती है. पारंपरिक PII डिटेक्शन टूल अक्सर फोन नंबर और ईमेल एड्रेस जैसे फ़ॉर्मैट के लिए निर्धारित नियमों (deterministic rules) पर निर्भर करते हैं. वे सीमित मामलों में अच्छी तरह काम कर सकते हैं, लेकिन वे अक्सर अधिक सूक्ष्म व्यक्तिगत जानकारी को नहीं पहचान पाते और संदर्भ को समझने में संघर्ष करते हैं.
Privacy Filter को भाषा और संदर्भ की गहरी समझ के साथ बनाया गया है, ताकि यह और भी बेहतर प्रदर्शन कर सके. भाषा की गहरी समझ को प्राइवेसी-विशिष्ट लेबलिंग सिस्टम के साथ मिलाकर, यह असंरचित टेक्स्ट में PII की अधिक व्यापक रेंज का पता लगा सकता है, उन मामलों सहित, जहाँ सही निर्णय संदर्भ पर निर्भर करता है. यह सार्वजनिक होने के कारण सुरक्षित रखी जानी चाहिए वाली जानकारी और किसी निजी व्यक्ति से संबंधित होने के कारण छिपाई या संपादित की जानी चाहिए वाली जानकारी के बीच बेहतर अंतर कर सकता है.
नतीजा एक ऐसा मॉडल है जो अत्याधुनिक प्राइवेसी फ़िल्टरिंग प्रदर्शन देने के लिए पर्याप्त रूप से मज़बूत है. साथ ही, मॉडल इतना छोटा है कि इसे लोकल तौर पर चलाया जा सके—यानी जिस डेटा को अभी फ़िल्टर करना बाकी है, वह डी-आइडेंटिफ़िकेशन के लिए सर्वर पर भेजने के बजाय डिवाइस पर ही रह सकता है, जिससे उसके उजागर होने का जोखिम कम हो जाता है.
Privacy Filter स्पैन डिकोडिंग के साथ एक द्विदिश टोकन-क्लासिफिकेशन मॉडल है. यह एक ऑटोरिग्रेसिव प्रीट्रेंड चेकपॉइंट से शुरू होता है और फिर प्राइवेसी लेबल्स की एक निश्चित टैक्सोनॉमी पर एक टोकन क्लासिफ़ायर में अनुकूलित किया जाता है. टेक्स्ट को टोकन दर टोकन जनरेट करने के बजाय, यह एक ही पास में इनपुट सीक्वेंस को लेबल करता है और फिर एक सीमित (constrained) Viterbi प्रक्रिया के साथ सुसंगत स्पैन डिकोड करता है.
यह आर्किटेक्चर Privacy Filter को प्रोडक्शन उपयोग के लिए कुछ उपयोगी विशेषताएँ देता है:
- तेज़ और कुशल: सभी टोकन को एक ही फॉरवर्ड पास में लेबल किया जाता है.
- कॉन्टेक्स्ट के प्रति जागरूक: भाषा प्रायर आसपास के संदर्भ के आधार पर PII स्पैन का पता लगाने में सक्षम बनाता है.
- लंबा संदर्भ: रिलीज़ किया गया मॉडल 128,000 टोकन तक के संदर्भ का समर्थन करता है.
- कॉन्फ़िगर करने योग्य: डेवलपर्स अपने वर्कफ़्लो के अनुसार रिकॉल और प्रिसिजन के बीच संतुलन बनाने के लिए ऑपरेटिंग पॉइंट्स को समायोजित कर सकते हैं.
जारी किए गए मॉडल में 1.5B कुल पैरामीटर्स हैं, जिनमें 50M एक्टिव पैरामीटर्स हैं.
Privacy Filter आठ श्रेणियों में स्पैन की पहचान करता है:
निजी_व्यक्तिनिजी_पतानिजी_ईमेलनिजी_फ़ोनprivate_urlprivate_dateखाता नंबरगुप्त
account_number श्रेणी विभिन्न प्रकार की अकाउंट संख्याओं को छिपाने में मदद करती है, जिनमें क्रेडिट कार्ड नंबर और बैंक अकाउंट नंबर जैसी बैंकिंग जानकारी शामिल होती है, जबकि secret पासवर्ड और API की जैसी चीज़ों को छिपाने में मदद करता है.
इन लेबल्स को BIOES span tags के साथ डिकोड किया जाता है, जो साफ़ और सुसंगत masking boundaries तैयार करने में मदद करता है.
उदाहरण के लिए इनपुट टेक्स्ट
विषय: Q2 योजना फॉलो-अप
नमस्ते जॉर्डन,
आज सुबह मिलने के लिए एक बार फिर धन्यवाद. मैं Q2 रोलआउट के लिए संशोधित टाइमलाइन साझा कर रहा/रही हूँ और पुष्टि करना चाहता/चाहती हूँ कि प्रॉडक्ट लॉन्च 18 सितंबर, 2026 को निर्धारित है. संदर्भ के लिए, प्रोजेक्ट फाइल 4829-1037-5581 के अंतर्गत सूचीबद्ध है. अगर आपकी तरफ़ से कुछ बदलता है, तो आप यहीं maya.chen@example.com पर जवाब दे सकते हैं या मुझे +1 (415) 555-0124 पर कॉल कर सकते हैं.
सादर,
Maya Chen
व्यक्तिगत पहचानकर्ताओं को मास्क करने के बाद का टेक्स्ट.
विषय: Q2 योजना फॉलो-अप
नमस्ते [PRIVATE_PERSON],
आज पहले मिलने के लिए एक बार फिर धन्यवाद. मैं Q2 रोलआउट की संशोधित टाइमलाइन के बारे में फ़ॉलो अप करना चाहता था और पुष्टि करना चाहता था कि प्रॉडक्ट लॉन्च [PRIVATE_DATE] के लिए निर्धारित है. संदर्भ के लिए, प्रोजेक्ट फाइल [ACCOUNT_NUMBER] के अंतर्गत सूचीबद्ध है. अगर आपकी ओर से कुछ बदलता है, तो बेझिझक यहां [PRIVATE_EMAIL] पर जवाब दें या मुझे [PRIVATE_PHONE] पर कॉल करें.
सर्वोत्तम,
[PRIVATE_PERSON]
हमने प्राइवेसी फ़िल्टर को कई चरणों में विकसित किया.
सबसे पहले, हमने एक प्राइवेसी वर्गीकरण बनाया जो उन स्पैन के प्रकारों को परिभाषित करता है जिन्हें मॉडल को पहचानना चाहिए. इसमें व्यक्तिगत पहचान संबंधी जानकारी, संपर्क विवरण, पते, निजी तिथियाँ, क्रेडिट और बैंकिंग जानकारी जैसे कई अलग-अलग प्रकार के अकाउंट नंबर, और API की तथा पासवर्ड जैसी गुप्त जानकारियाँ शामिल हैं.
दूसरा, हमने एक प्रीट्रेंड लैंग्वेज मॉडल को लैंग्वेज मॉडलिंग हेड को टोकन-क्लासिफ़िकेशन हेड से बदलकर और उसे एक सुपरवाइज़्ड क्लासिफ़िकेशन ऑब्जेक्टिव के साथ पोस्ट-ट्रेन करके एक द्विदिश टोकन क्लासिफ़ायर में परिवर्तित किया.
तीसरा, हमने सार्वजनिक रूप से उपलब्ध और सिंथेटिक डेटा के मिश्रण पर प्रशिक्षण किया, जिसे यथार्थवादी टेक्स्ट और जटिल प्राइवेसी पैटर्न दोनों को कैप्चर करने के लिए डिज़ाइन किया गया था. सार्वजनिक डेटा के उन हिस्सों में, जहाँ लेबल अधूरे थे, हमने कवरेज बेहतर बनाने के लिए मॉडल-सहायित एनोटेशन और समीक्षा का उपयोग किया. हमने फ़ॉर्मैट्स, कॉन्टेक्स्ट्स और प्राइवेसी के उपप्रकारों में विविधता बढ़ाने के लिए सिंथेटिक उदाहरण भी जनरेट किए.
इन्फ़रेंस के समय, मॉडल की टोकन-स्तरीय भविष्यवाणियों को प्रतिबंधित अनुक्रम डिकोडिंग का उपयोग करके सुसंगत स्पैन में डिकोड किया जाता है. यह दृष्टिकोण पूर्व-प्रशिक्षित मॉडल की व्यापक भाषा समझ को बनाए रखते हुए इसे गोपनीयता पहचान के लिए विशिष्ट बनाता है.
हमने Privacy Filter का मूल्यांकन स्टैंडर्ड बेंचमार्क्स और अतिरिक्त सिंथेटिक और चैट-स्टाइल एवल्यूएशन्स पर किया, जिन्हें अधिक कठिन और संदर्भ-संवेदनशील मामलों का परीक्षण करने के लिए डिज़ाइन किया गया था.
PII-Masking-300k(एक नई विंडो में खुलेगा) बेंचमार्क पर, Privacy Filter 96% का F1 स्कोर हासिल करता है (94.04% सटीकता और 98.04% पुनः प्राप्ति). बेंचमार्क के एक करेक्टेड वर्ज़न पर, जो रिव्यू के दौरान पहचानी गई डेटासेट एनोटेशन संबंधी समस्याओं को ध्यान में रखता है, F1 स्कोर 97.43% है (96.79% सटीकता और 98.08% पुनः प्राप्ति).
हमने यह भी पाया कि मॉडल को कुशलता से एडैप्ट किया जा सकता है. कम डेटा पर भी फ़ाइन-ट्यूनिंग करने से डोमेन-स्पेसिफ़िक टास्क पर एक्यूरेसी तेज़ी से बेहतर होती है: F1 स्कोर 54% से 96% तक बढ़ जाता है, और हमारे द्वारा आंके गए डोमेन-अडैप्शन बेंचमार्क पर यह लगभग सैचुरेशन के करीब पहुँच जाता है.
बेंचमार्क प्रदर्शन से आगे, Privacy Filter को शोरयुक्त, वास्तविक दुनिया के टेक्स्ट में व्यावहारिक प्राइवेसी फ़िल्टरिंग के लिए डिज़ाइन किया गया है. इसमें लंबे दस्तावेज़, अस्पष्ट संदर्भ, मिश्रित-फ़ॉर्मैट स्ट्रिंग्स, और सॉफ़्टवेयर से जुड़े रहस्य शामिल हैं. मॉडल कार्ड (एक नई विंडो में खुलेगा)में कोडबेस में रहस्य पहचान पर लक्षित मूल्यांकन और बहुभाषी, प्रतिकूल, और संदर्भ-निर्भर उदाहरणों पर तनाव परीक्षण की रिपोर्ट भी दी गई है.
Privacy Filter कोई अनामीकरण टूल, अनुपालन प्रमाणन, या उच्च-जोखिम वाली परिस्थितियों में नीति समीक्षा का विकल्प नहीं है. यह एक व्यापक प्राइवेसी-बाय-डिज़ाइन सिस्टम का हिस्सा है.
इसका व्यवहार उस लेबल टैक्सोनॉमी और निर्णय सीमाओं को दर्शाता है, जिस पर इसे ट्रेन किया गया था. अलग-अलग संगठन अलग-अलग डिटेक्शन या मास्किंग नीतियां चाह सकते हैं, और उन नीतियों के लिए इन-डोमेन मूल्यांकन या आगे और फ़ाइन-ट्यूनिंग की ज़रूरत पड़ सकती है. प्रदर्शन भाषाओं, लिपियों, नामकरण परंपराओं और उन डोमेन्स में भी अलग-अलग हो सकता है, जो ट्रेनिंग डिस्ट्रीब्यूशन से भिन्न हैं.
सभी मॉडलों की तरह, Privacy Filter गलतियाँ कर सकता है. यह असामान्य पहचानकर्ताओं या अस्पष्ट निजी संदर्भों को छोड़ सकता है, और जब संदर्भ सीमित हो, तो यह इकाइयों को अधिक या कम रिडैक्ट कर सकता है, विशेष रूप से छोटे अनुक्रमों में. उच्च-संवेदनशीलता वाले क्षेत्रों जैसे कानूनी, चिकित्सा, और वित्तीय कार्यप्रवाहों में, मानवीय समीक्षा और डोमेन-विशिष्ट मूल्यांकन और फाइन-ट्यूनिंग महत्वपूर्ण बने रहते हैं.
हम पूरे इकोसिस्टम में अधिक मजबूत गोपनीयता सुरक्षा का समर्थन करने के लिए OpenAI Privacy Filter जारी कर रहे हैं.
मॉडल आज Apache 2.0 लाइसेंस के तहत Hugging Face(एक नई विंडो में खुलेगा) और Github(एक नई विंडो में खुलेगा) पर उपलब्ध है. यह प्रयोग, अनुकूलन और व्यावसायिक परिनियोजन के लिए अभिप्रेत है, और इसे अलग-अलग डेटा वितरणों और प्राइवेसी पॉलिसी के लिए फ़ाइन-ट्यून किया जा सकता है.
मॉडल के साथ, हम दस्तावेज़ीकरण साझा कर रहे हैं जिसमें मॉडल आर्किटेक्चर, लेबल टैक्सोनॉमी, डिकोडिंग नियंत्रण, इच्छित उपयोग के मामले, मूल्यांकन सेटअप और ज्ञात सीमाएँ शामिल हैं, ताकि टीमें समझ सकें कि मॉडल क्या अच्छा करता है और इसे कहाँ सावधानी से उपयोग करना चाहिए.
AI सिस्टम्स के लिए प्राइवेसी की सुरक्षा रिसर्च, प्रॉडक्ट डिज़ाइन, मूल्यांकन और डिप्लॉयमेंट में एक सतत प्रयास है.
Privacy Filter एक ऐसी दिशा को दर्शाता है जिसे हम महत्वपूर्ण मानते हैं: छोटे, दक्ष मॉडल जिनमें वास्तविक दुनिया के AI सिस्टम्स के लिए मायने रखने वाले स्पष्ट रूप से परिभाषित कार्यों में अत्याधुनिक क्षमताएँ हों. हम इसे जारी कर रहे हैं क्योंकि हमें लगता है कि प्राइवेसी-संरक्षित इन्फ्रास्ट्रक्चर को इंस्पेक्ट करना, रन करना, अडैप्ट करना और बेहतर बनाना आसान होना चाहिए.
हमारा लक्ष्य यह है कि मॉडल दुनिया के बारे में सीखें, न कि निजी व्यक्तियों के बारे में. Privacy Filter इसे मुमकिन बनाता है.
हम रिसर्च और प्राइवेसी कम्युनिटी से फ़ीडबैक पाने और मॉडल के परफ़ॉर्मेंस पर आगे और सुधार करने के लिए Privacy Filter का यह प्रीव्यू रिलीज़ कर रहे हैं.


