تخطي إلى المحتوى الرئيسي
OpenAI

إطلاق OpenAI Privacy Filter

نموذجنا الرائد لإخفاء معلومات تحديد الهوية الشخصية (PII) في النص

جاري التحميل...

نطرح اليوم OpenAI Privacy Filter، وهو نموذج بأوزان مفتوحة لاكتشاف معلومات تحديد الهوية الشخصية (PII) في النصوص وحجبها. ويأتي هذا الإصدار ضمن جهودنا الأوسع لدعم منظومة برمجية أكثر متانة، من خلال تزويد المطورين ببنية عملية تساعدهم على البناء بالذكاء الاصطناعي بأمان، بما في ذلك الأدوات والنماذج التي تجعل تطبيق ضوابط الخصوصية والأمان القوية أسهل منذ البداية.

يُعد Privacy Filter نموذجًا صغيرًا يتمتع بقدرات متقدمة في اكتشاف البيانات الشخصية. وقد صُمم ليلائم مسارات العمل التي تتطلب معالجة كثيفة في مجال الخصوصية، كما يستطيع اكتشاف معلومات تحديد الهوية الشخصية في النصوص غير المهيكلة مع مراعاة السياق. ويمكن تشغيله محليًا، ما يعني أن إخفاء هذه المعلومات أو حجبها يتم من دون أن تغادر جهازك. كذلك، يعالج المدخلات الطويلة بكفاءة، ويتخذ قرارات الحجب بسرعة وفي تمريرة واحدة.

وفي OpenAI، نستخدم نسخة مضبوطة من Privacy Filter ضمن مسارات العمل الخاصة بنا التي تراعي الحفاظ على الخصوصية. وقد طورنا Privacy Filter لأننا نؤمن بأن أحدث قدرات الذكاء الاصطناعي يمكنها رفع معيار الخصوصية إلى مستوى يتجاوز ما كان متاحًا في السوق. والنسخة التي نطلقها اليوم تحقق أداءً من طراز رائد على مقياس PII-Masking-300k، بعد تصحيح مشكلات في الوسم اكتشفناها أثناء التقييم.

ومع هذا الإصدار، بات بإمكان المطورين تشغيل Privacy Filter داخل بيئاتهم الخاصة، ومواءمته مع حالات الاستخدام لديهم، وبناء ضوابط خصوصية أقوى ضمن مسارات التدريب، والفهرسة، والتسجيل، والمراجعة.

نموذج صغير بقدرات رائدة في اكتشاف البيانات الشخصية

تعتمد حماية الخصوصية في أنظمة الذكاء الاصطناعي الحديثة على ما هو أكثر من مجرد مطابقة الأنماط. فالأدوات التقليدية لاكتشاف معلومات تحديد الهوية الشخصية تعتمد غالبًا على قواعد ثابتة لصيغ مثل أرقام الهواتف وعناوين البريد الإلكتروني. وقد تنجح هذه الأدوات في الحالات المحدودة، لكنها كثيرًا ما تفوّت المعلومات الشخصية الأكثر دقة، كما تواجه صعوبة في فهم السياق.

وقد صُمم Privacy Filter على فهم أعمق للغة والسياق، بما يتيح أداءً أكثر دقة. فمن خلال الجمع بين فهم قوي للغة ونظام وسم مخصص للخصوصية، يستطيع اكتشاف نطاق أوسع من معلومات تحديد الهوية الشخصية في النصوص غير المهيكلة، بما في ذلك الحالات التي يعتمد فيها القرار الصحيح على السياق. كما يميّز بشكل أفضل بين المعلومات التي ينبغي الإبقاء عليها لأنها متاحة للعامة، والمعلومات التي يجب إخفاؤها أو حجبها لأنها تخص فردًا بعينه.

والنتيجة هي نموذج قوي بما يكفي لتقديم أداء متقدم في تصفية البيانات الحساسة المتعلقة بالخصوصية. وفي الوقت نفسه، يظل صغيرًا بالقدر الذي يسمح بتشغيله محليًا، ما يعني أن البيانات التي لم تُصفَّ بعد يمكن أن تبقى على الجهاز نفسه، مع تقليل مخاطر التعرض، بدلًا من الحاجة إلى إرسالها إلى خادم لإزالة الهوية عنها. 

نظرة عامة على النموذج

Privacy Filter هو نموذج ثنائي الاتجاه لتصنيف الرموز مع فك ترميز المقاطع. وينطلق من نقطة تحقق مدرّبة مسبقًا بأسلوب التوليد الذاتي، ثم يُكيَّف ليصبح مصنّفًا للرموز وفق تصنيف ثابت لوسوم الخصوصية. وبدلًا من توليد النص رمزًا تلو الآخر، يوسم تسلسل الإدخال في تمريرة واحدة، ثم يفك ترميز المقاطع المتماسكة باستخدام إجراء Viterbi مقيّد.

وتمنح هذه البنية Privacy Filter عددًا من الخصائص المفيدة للاستخدام في بيئات الإنتاج:

  • سريع وفعّال: تُوسم جميع الرموز في تمريرة أمامية واحدة.
  • مدرك للسياق: تتيح المعرفة اللغوية المسبقة اكتشاف مقاطع معلومات تحديد الهوية الشخصية استنادًا إلى السياق المحيط.
  • السياق الطويل: يدعم النموذج المطروح ما يصل إلى 128,000 رمز من السياق.
  • قابل للضبط: يمكن للمطورين مواءمة نقاط التشغيل لتحقيق التوازن بين الاسترجاع والدقة بحسب مسار العمل لديهم.

يضم النموذج المطروح 1.5 مليار معلمة إجمالية، منها 50 مليون معلمة نشطة.

ويتنبأ Privacy Filter بالمقاطع عبر ثماني فئات:

  • private_person
  • private_address
  • private_email
  • private_phone
  • private_url
  • private_date
  • account_number
  • secret

وتساعد فئة account_number في إخفاء طيف واسع من أرقام الحسابات، بما في ذلك البيانات المصرفية مثل أرقام بطاقات الائتمان وأرقام الحسابات البنكية، في حين تساعد فئة secret في إخفاء عناصر مثل كلمات المرور ومفاتيح API.

وتُفك هذه الوسوم باستخدام علامات المقاطع BIOES، مما يساعد على إنتاج حدود إخفاء أكثر نظافة واتساقًا.

مثال على النص المدخل

الموضوع: متابعة تخطيط الربع الثاني

مرحبًا جوردان،

شكرًا لك مرة أخرى على اجتماعنا اليوم. أردت أن أتابع معك بخصوص الجدول الزمني المعدّل لطرح الربع الثاني، وأن أؤكد أن إطلاق المنتج مقرر ف 18 سبتمبر 2026. وللرجوع إليه، فإن ملف المشروع مُدرج تحت ‎4829-1037-5581. وإذا طرأ أي تغيير من جانبكم، فلا تتردد في الرد هنا على maya.chen@example.com أو الاتصال بي على ‎+1 (415) 555-0124.

مع أطيب التحيات،

مايا تشين

النص بعد إخفاء المعلومات الشخصية

الموضوع: متابعة تخطيط الربع الثاني

مرحبًا [PRIVATE_PERSON]،

شكرًا مرة أخرى على اجتماعنا اليوم. أردت أن أتابع معك بخصوص الجدول الزمني المعدّل لطرح الربع الثاني، وأن أؤكد أن إطلاق المنتج مقرر في [PRIVATE_DATE]. وللرجوع إليه، فإن ملف المشروع مُدرج تحت [ACCOUNT_NUMBER]. وإذا طرأ أي تغيير من جانبك، فلا تتردد في الرد هنا على [PRIVATE_EMAIL] أو الاتصال بي على [PRIVATE_PHONE].

مع أطيب التحيات،

[PRIVATE_PERSON]

كيف صممناه

طوّرنا Privacy Filter عبر عدة مراحل.

أولًا، بنينا تصنيفًا للخصوصية يحدد أنواع المقاطع التي ينبغي للنموذج اكتشافها. ويشمل ذلك المعرّفات الشخصية، وبيانات الاتصال، والعناوين، والتواريخ الخاصة، وأنواعًا متعددة من أرقام الحسابات مثل بيانات بطاقات الائتمان والمعلومات البنكية، إلى جانب الأسرار مثل مفاتيح API وكلمات المرور.

ثانيًا، حوّلنا نموذجًا لغويًا مدرّبًا مسبقًا إلى مصنّف ثنائي الاتجاه للرموز، وذلك عبر استبدال رأس النمذجة اللغوية برأس مخصص لتصنيف الرموز، ثم إخضاعه لتدريب لاحق بهدف تصنيفي خاضع للإشراف. 

ثالثًا، درّبنا النموذج على مزيج من البيانات المتاحة علنًا والبيانات الاصطناعية، صُمم لالتقاط النصوص الواقعية وأنماط الخصوصية الصعبة معًا. وفي أجزاء من البيانات العامة التي كانت وسومها غير مكتملة، استخدمنا وسمًا ومراجعة بمساعدة النموذج لتحسين التغطية. كما أنشأنا أمثلة اصطناعية لزيادة التنوع عبر الصيغ، والسياقات، والأنواع الفرعية للخصوصية.

وعند الاستدلال، تُفك تنبؤات النموذج على مستوى الرموز إلى مقاطع متماسكة باستخدام فك ترميز مقيّد للتسلسلات. ويحافظ هذا النهج على الفهم اللغوي الواسع للنموذج المدرّب مسبقًا، مع تخصيصه في الوقت نفسه لاكتشاف عناصر الخصوصية.

كيف يعمل Privacy Filter

قيّمنا Privacy Filter على المقاييس المعيارية القياسية وكذلك على تقييمات إضافية اصطناعية بأسلوب المحادثة والمصممة لاختبار الحالات الأصعب والأكثر حساسية للسياق.

وعلى معيار PII-Masking-300k(يفتح في نافذة جديدة) ، يحقق Privacy Filter درجة F1 تبلغ 96% (94.04% للدقة و98.04% للاسترجاع). وفي النسخة المصحّحة من المعيار المرجعي تراعي مشكلات في توصيف بيانات مجموعة البيانات جرى تحديدها أثناء المراجعة، بلغت درجة F1 نسبة 97.43% (بدقة بلغت 96.79% واسترجاع بلغ 98.08%).

ووجدنا أيضًا أن النموذج يمكن تكييفه بكفاءة. فحتى الضبط الدقيق على كمية صغيرة من البيانات يحسن سريعًا الدقة في المهام المتخصصة حسب المجال، إذ يرفع درجة F1 من 54% إلى 96%، ويقترب من حد الإشباع على معيار التكيّف مع المجال الذي قيّمناه.

وإلى جانب الأداء على المعايير، صُمم Privacy Filter لتصفية الخصوصية بصورة عملية في النصوص الواقعية المليئة بالتشويش. ويشمل ذلك المستندات الطويلة، والإشارات الملتبسة، والسلاسل ذات الصيغ المختلطة، والأسرار المرتبطة بالبرمجيات. كما تعرض بطاقة النموذج (يفتح في نافذة جديدة)أيضًا تقييمات موجهة لاكتشاف الأسرار داخل قواعد الشيفرة، واختبارات ضغط عبر أمثلة متعددة اللغات، وعدائية، ومعتمدة على السياق.

القيود

Privacy Filter ليس أداة لإخفاء الهوية، ولا شهادة امتثال، ولا بديلًا عن مراجعة السياسات في البيئات عالية الحساسية. بل هو مكوّن واحد ضمن منظومة أوسع للخصوصية وفق التصميم.

ويعكس سلوكه تصنيف الوسوم وحدود القرار التي دُرّب عليها. وقد تحتاج المؤسسات المختلفة إلى سياسات مختلفة للاكتشاف أو الإخفاء، وقد تتطلب هذه السياسات تقييمًا داخل المجال أو مزيدًا من الضبط الدقيق. كما قد يختلف الأداء باختلاف اللغات، وأنظمة الكتابة، واصطلاحات التسمية، والمجالات التي تختلف عن توزيع بيانات التدريب.

وكما هو الحال مع جميع النماذج، قد يخطئ Privacy Filter. فقد يفوّت معرّفات غير شائعة أو إشارات خاصة ملتبسة، وقد يبالغ في الحجب أو يقلل منه عندما يكون السياق محدودًا، ولا سيما في التسلسلات القصيرة. وفي المجالات عالية الحساسية مثل المسارات القانونية والطبية والمالية، تظل المراجعة البشرية والتقييم والضبط الدقيق الخاصان بالمجال أمرين مهمين.

التوفّر

نطرح OpenAI Privacy Filter لدعم ضوابط خصوصية أقوى عبر المنظومة.

يتوفر النموذج اليوم بموجب ترخيص Apache 2.0 على Hugging Face(يفتح في نافذة جديدة) و Github(يفتح في نافذة جديدة). وقد صُمم لأغراض التجريب، والتخصيص، والنشر التجاري، كما يمكن ضبطه دقيقًا ليتلاءم مع توزيعات بيانات مختلفة وسياسات خصوصية متنوعة.

وبالتوازي مع النموذج، نشارك وثائق تغطي بنية النموذج، وتصنيف الوسوم، وعناصر التحكم في فك الترميز، وحالات الاستخدام المستهدفة، ومنهجية التقييم، والقيود المعروفة، حتى تتمكن الفرق من فهم ما الذي يجيده النموذج، وأين ينبغي استخدامه بحذر.

نظرة إلى المستقبل

إن حماية الخصوصية في أنظمة الذكاء الاصطناعي جهد مستمر يمتد عبر البحث، وتصميم المنتجات، والتقييم، والنشر.

ويعكس Privacy Filter أحد الاتجاهات التي نراها مهمة: نماذج صغيرة وفعّالة تمتلك قدرات متقدمة في مهام محددة بدقة، لكنها مهمة لأنظمة الذكاء الاصطناعي في العالم الواقعي. ونحن نطرحه لأننا نرى أن البنية التحتية الحافظة للخصوصية ينبغي أن تكون أسهل في الفحص، والتشغيل، والتكييف، والتحسين.

وهدفنا أن تتعلم النماذج عن العالم، لا عن الأفراد وبياناتهم الخاصة. ويساعد Privacy Filter في جعل ذلك ممكنًا.

ونطرح هذه المعاينة من Privacy Filter من أجل تلقي الملاحظات من مجتمعَي البحث والخصوصية، ومواصلة تحسين أداء النموذج بصورة متدرجة.