ಮುಖ್ಯ ವಿಷಯಕ್ಕೆ ನೇರವಾಗಿ ಹೋಗಿ
OpenAI

OpenAI ಗೌಪ್ಯತೆ ಫಿಲ್ಟರ್ ಅನ್ನು ಪರಿಚಯಿಸುತ್ತಿದೆ

ಪಠ್ಯದಲ್ಲಿನ ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮಾಹಿತಿಯನ್ನು (PII) ಮರೆಮಾಡುವ ನಮ್ಮ ಅತ್ಯಾಧುನಿಕ ಮಾಡೆಲ್

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

ಇಂದು ನಾವು ಪಠ್ಯದಲ್ಲಿನ ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮಾಹಿತಿಯನ್ನು (PII) ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಮರೆಮಾಡಲು ಬಳಸುವ ಓಪನ್ ವೇಟ್ ಮಾಡೆಲ್‌ಗಳು ಆದ OpenAI Privacy Filter ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ. ಈ ಬಿಡುಗಡೆ, ಸಾಧನಗಳು ಮತ್ತು ಮಾಡೆಲ್‌ಗಳು ಸೇರಿದಂತೆ, ಆರಂಭದಿಂದಲೇ ಬಲವಾದ ಗೌಪ್ಯತೆ ಮತ್ತು ಭದ್ರತಾ ರಕ್ಷಣೆಗಳನ್ನು ಜಾರಿಗೊಳಿಸಲು ಸುಲಭವಾಗುವಂತೆ AI ಯೊಂದಿಗೆ ಸುರಕ್ಷಿತವಾಗಿ ನಿರ್ಮಿಸಲು ಡೆವಲಪರ್‌ಗಳಿಗೆ ಪ್ರಾಯೋಗಿಕ ಮೂಲಸೌಕರ್ಯವನ್ನು ಒದಗಿಸುವ ಮೂಲಕ, ಹೆಚ್ಚು ಸ್ಥಿತಿಸ್ಥಾಪಕ ಸಾಫ್ಟ್‌ವೇರ್ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯನ್ನು ಬೆಂಬಲಿಸುವ ನಮ್ಮ ವ್ಯಾಪಕ ಪ್ರಯತ್ನದ ಭಾಗವಾಗಿದೆ.

Privacy Filter ಅತ್ಯಾಧುನಿಕ ವೈಯಕ್ತಿಕ ಡೇಟಾವನ್ನು ಪತ್ತೆಹಚ್ಚುವ ಸಾಮರ್ಥ್ಯ ಹೊಂದಿರುವ ಸಣ್ಣ ಮಾಡೆಲ್ ಆಗಿದೆ. ಇದು ಹೈ-ಥ್ರೂಪುಟ್ ಗೌಪ್ಯತೆ ವರ್ಕ್‌ಫ್ಲೋಗಳಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಮತ್ತು ಅಸಂರಚಿತ ಪಠ್ಯದಲ್ಲಿನ PII ಅನ್ನು ಸಂದರ್ಭ-ಅರಿವುಳ್ಳ ರೀತಿಯಲ್ಲಿ ಪತ್ತೆಹಚ್ಚಲು ಸಮರ್ಥವಾಗಿದೆ. ಇದು ಸ್ಥಳೀಯವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದು, ಅಂದರೆ PII ಅನ್ನು ನಿಮ್ಮ ಯಂತ್ರದಿಂದ ಹೊರಗೆ ಹೋಗದೆ ಮರೆಮಾಡಬಹುದು ಅಥವಾ ಅಳಿಸಬಹುದು. ಇದು ದೀರ್ಘ ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ದಕ್ಷವಾಗಿ ಸಂಸ್ಕರಿಸಿ, ಒಂದೇ ವೇಗವಾದ ಪಾಸ್‌ನಲ್ಲಿ ರಿಡ್ಯಾಕ್ಷನ್ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.

OpenAI ನಲ್ಲಿ, ನಾವು ಗೌಪ್ಯತೆಯನ್ನು ಸಂರಕ್ಷಿಸುವ ನಮ್ಮ ಸ್ವಂತ ವರ್ಕ್‌ಫ್ಲೋಗಳಲ್ಲಿ Privacy Filter ಎಂಬ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿದ ಆವೃತ್ತಿಯನ್ನು ಬಳಸುತ್ತೇವೆ. ನಾವು Privacy Filter ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ ಏಕೆಂದರೆ ಇತ್ತೀಚಿನ AI ಸಾಮರ್ಥ್ಯಗಳೊಂದಿಗೆ, ಮಾರುಕಟ್ಟೆಯಲ್ಲಿ ಈಗಾಗಲೇ ಲಭ್ಯವಿದ್ದುದಕ್ಕಿಂತ ಮೇಲಿನ ಮಟ್ಟಕ್ಕೆ ಗೌಪ್ಯತೆಯ ಮಾನದಂಡವನ್ನು ಹೆಚ್ಚಿಸಬಹುದು ಎಂದು ನಾವು ನಂಬುತ್ತೇವೆ. ನಾವು ಇಂದು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿರುವ Privacy Filter ಆವೃತ್ತಿಯು, ಮೌಲ್ಯಮಾಪನದ ವೇಳೆ ನಾವು ಗುರುತಿಸಿದ ಅನೋಟೇಶನ್ ಸಮಸ್ಯೆಗಳನ್ನು ಸರಿಪಡಿಸಿದಾಗ, PII-Masking-300k ಬೆಂಚ್ಮಾರ್ಕ್‌ನಲ್ಲಿ ಅತ್ಯಾಧುನಿಕ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಾಧಿಸುತ್ತದೆ.

ಈ ಬಿಡುಗಡೆ ಮೂಲಕ, ಡೆವಲಪರ್‌ಗಳು ತಮ್ಮದೇ ಪರಿಸರಗಳಲ್ಲಿ Privacy Filter ಅನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದು, ತಮ್ಮದೇ ಬಳಕೆಯ ಸಂದರ್ಭಗಳಿಗೆ ಅದನ್ನು ಸೂಕ್ಷ್ಮವಾಗಿ ಹೊಂದಿಸಬಹುದು, ಮತ್ತು ತರಬೇತಿ, ಇಂಡೆಕ್ಸಿಂಗ್, ಲಾಗಿಂಗ್ ಮತ್ತು ಪರಿಶೀಲನಾ ಪೈಪ್‌ಲೈನ್‌ಗಳಲ್ಲಿ ಬಲವಾದ ಗೌಪ್ಯತಾ ರಕ್ಷಣೆಗಳನ್ನು ನಿರ್ಮಿಸಬಹುದು.

ವೈಯಕ್ತಿಕ ಡೇಟಾ ಪತ್ತೆಹಚ್ಚುವ ಸಾಮರ್ಥ್ಯ ಹೊಂದಿರುವ ಸಣ್ಣ ಅತ್ಯಾಧುನಿಕ ಮಾಡೆಲ್

ಆಧುನಿಕ AI ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಗೌಪ್ಯತೆಯ ರಕ್ಷಣೆ ಕೇವಲ ಪ್ಯಾಟರ್ನ್ ಮ್ಯಾಚಿಂಗ್‌ಗಿಂತ ಹೆಚ್ಚಿನದನ್ನು ಅವಲಂಬಿಸಿದೆ. ಸಾಂಪ್ರದಾಯಿಕ PII ಪತ್ತೆಹಚ್ಚುವ ಸಾಧನಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಫೋನ್ ಸಂಖ್ಯೆಗಳು ಮತ್ತು ಇಮೇಲ್ ವಿಳಾಸಗಳಂತಹ ಸ್ವರೂಪಗಳಿಗೆ ನಿರ್ಧಿಷ್ಟ ನಿಯಮಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತವೆ. ಅವು ಸೀಮಿತ ಸಂದರ್ಭಗಳಲ್ಲಿ ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡಬಹುದು, ಆದರೆ ಅವು ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮವಾದ ವೈಯಕ್ತಿಕ ಮಾಹಿತಿಯನ್ನು ಆಗಾಗ್ಗೆ ತಪ್ಪಿಸಿಕೊಳ್ಳುತ್ತವೆ ಮತ್ತು ಸಂದರ್ಭವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದರಲ್ಲಿ ಕಷ್ಟಪಡುತ್ತವೆ.

ಗೌಪ್ಯತಾ ಫಿಲ್ಟರ್ ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಒದಗಿಸಲು ಆಳವಾದ ಭಾಷಾ ಮತ್ತು ಸಂದರ್ಭ ಜ್ಞಾನದಿಂದ ನಿರ್ಮಿಸಲಾಗಿದೆ. ಬಲವಾದ ಭಾಷಾ ಅರ್ಥೈಸುವಿಕೆಯನ್ನು ಗೌಪ್ಯತೆ-ನಿರ್ದಿಷ್ಟ ಲೇಬಲಿಂಗ್ ವ್ಯವಸ್ಥೆಯೊಂದಿಗೆ ಸಂಯೋಜಿಸುವ ಮೂಲಕ, ಇದು ಅಸಂರಚಿತ ಪಠ್ಯದಲ್ಲಿನ PII ಯ ವಿಶಾಲ ವ್ಯಾಪ್ತಿಯನ್ನು ಪತ್ತೆಹಚ್ಚುತ್ತದೆ, ಇದರಲ್ಲಿ ಸರಿಯಾದ ನಿರ್ಧಾರವು ಸಂದರ್ಭದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ. ಇದು ಸಾರ್ವಜನಿಕವಾಗಿರುವುದರಿಂದ ಸಂರಕ್ಷಿಸಬೇಕಾದ ಮಾಹಿತಿಯನ್ನೂ, ಖಾಸಗಿ ವ್ಯಕ್ತಿಗೆ ಸಂಬಂಧಿಸಿರುವುದರಿಂದ ಮರೆಮಾಡಬೇಕಾದ ಅಥವಾ ಅಳಿಸಬೇಕಾದ ಮಾಹಿತಿಯನ್ನೂ ಚೆನ್ನಾಗಿ ವ್ಯತ್ಯಾಸಪಡಿಸುತ್ತದೆ.

ಫಲಿತಾಂಶವಾಗಿ, ಅತ್ಯಾಧುನಿಕ ಮಟ್ಟದ ಗೌಪ್ಯತೆ ಫಿಲ್ಟರಿಂಗ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಒದಗಿಸುವಷ್ಟು ಬಲವಾದ ಮಾಡೆಲ್ ದೊರಕುತ್ತದೆ. ಅದೇ ಸಮಯದಲ್ಲಿ, ಮಾಡೆಲ್ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಮಾಡಲು ಸಾಕಷ್ಟು ಚಿಕ್ಕದಾಗಿದೆ—ಅಂದರೆ, ಇನ್ನೂ ಫಿಲ್ಟರ್ ಮಾಡಬೇಕಿರುವ ಡೇಟಾವನ್ನು ಗುರುತು ತೆಗೆದುಹಾಕುವಿಕೆಗೆ ಸರ್ವರ್‌ಗೆ ಕಳುಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲದೆ ಸಾಧನದಲ್ಲೇ ಉಳಿಸಬಹುದು, ಇದರಿಂದ ಬಹಿರಂಗಗೊಳ್ಳುವ ಅಪಾಯವೂ ಕಡಿಮೆಯಾಗುತ್ತದೆ. 

ಮಾಡೆಲ್ ಅವಲೋಕನ

Privacy Filter ಎಂಬುದು ಸ್ಪ್ಯಾನ್ ಡಿಕೋಡಿಂಗ್ ಹೊಂದಿರುವ ದ್ವಿದಿಶ ಟೋಕನ್ ವರ್ಗೀಕರಣ ಮಾಡೆಲ್ ಆಗಿದೆ. ಇದು ಸ್ವಯಂಪ್ರತಿಗಾಮಿ ಪೂರ್ವತರಬೇತಿ ಪಡೆದ ಚೆಕ್‌ಪಾಯಿಂಟ್‌ನಿಂದ ಪ್ರಾರಂಭವಾಗಿ, ನಂತರ ಗೌಪ್ಯತಾ ಲೇಬಲ್‌ಗಳ ಸ್ಥಿರ ವರ್ಗೀಕರಣ ವ್ಯವಸ್ಥೆಯ ಮೇಲೆ ಟೋಕನ್ ವರ್ಗೀಕರಕವಾಗಿ ಹೊಂದಿಸಲಾಗುತ್ತದೆ. ಪಠ್ಯವನ್ನು ಟೋಕನ್‌ಗಟ್ಟಲೆ ರಚಿಸುವ ಬದಲು, ಇದು ಒಂದೇ ಬಾರಿ ಇನ್‌ಪುಟ್ ಕ್ರಮವನ್ನು ಲೇಬಲ್ ಮಾಡಿ, ನಂತರ ನಿರ್ಬಂಧಿತ ವಿಟರ್ಬಿ ವಿಧಾನವನ್ನು ಬಳಸಿ ಸುಸಂಬದ್ಧ span ಗಳನ್ನು ಡಿಕೋಡ್ ಮಾಡುತ್ತದೆ.

ಈ ಆರ್ಕಿಟೆಕ್ಚರ್ ಪ್ರೊಡಕ್ಷನ್ ಬಳಕೆಗೆ Privacy Filter ಗೆ ಕೆಲವು ಉಪಯುಕ್ತ ಗುಣಲಕ್ಷಣಗಳನ್ನು ನೀಡುತ್ತದೆ:

  • ವೇಗವಾದ ಮತ್ತು ದಕ್ಷ: ಎಲ್ಲಾ ಟೋಕನ್‌ಗಳಿಗೆ ಒಂದೇ ಫಾರ್ವರ್ಡ್ ಪಾಸ್‌ನಲ್ಲಿ ಲೇಬಲ್ ಮಾಡಲಾಗುತ್ತದೆ.
  • ಸಂದರ್ಭ-ಅರಿವುಳ್ಳದ್ದು: ಭಾಷಾ ಪೂರ್ವಧಾರಣೆ ಸುತ್ತಮುತ್ತಲಿನ ಸಂದರ್ಭದ ಆಧಾರದ ಮೇಲೆ PII ವ್ಯಾಪ್ತಿಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.
  • ದೀರ್ಘ ಸಂದರ್ಭ: ಬಿಡುಗಡೆಗೊಂಡ ಮಾಡೆಲ್ ಗರಿಷ್ಠ 1,28,000 ಟೋಕನ್‌ಗಳ ಸಂದರ್ಭವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.
  • ಕಾನ್ಫಿಗರ್ ಮಾಡಬಹುದಾದದು: ಡೆವಲಪರ್‌ಗಳು ತಮ್ಮ ವರ್ಕ್‌ಫ್ಲೋಗೆ ಅನುಗುಣವಾಗಿ ರಿಕಾಲ್ ಮತ್ತು ಪ್ರಿಸಿಷನ್ ನಡುವೆ ಸಮತೋಲನ ಸಾಧಿಸಲು ಆಪರೇಟಿಂಗ್ ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಹೊಂದಿಸಬಹುದು.

ಬಿಡುಗಡೆಯಾದ ಮಾಡೆಲ್ ಒಟ್ಟು 1.5B ನಿಯತಾಂಕಗಳನ್ನು ಹೊಂದಿದ್ದು, ಅವುಗಳಲ್ಲಿ 50M ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳಾಗಿವೆ.

Privacy Filter ಎಂಟು ವರ್ಗಗಳಲ್ಲಿ ವ್ಯಾಪ್ತಿಗಳನ್ನು ಊಹಿಸುತ್ತದೆ:

  • private_person
  • private_address
  • private_email
  • private_phone
  • private_url
  • private_date
  • account_number
  • secret

account_number ವರ್ಗವು ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ ಸಂಖ್ಯೆಗಳು ಮತ್ತು ಬ್ಯಾಂಕ್ ಖಾತೆ ಸಂಖ್ಯೆಗಳಂತಹ ಬ್ಯಾಂಕಿಂಗ್ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಂತೆ ವಿವಿಧ ರೀತಿಯ ಖಾತೆ ಸಂಖ್ಯೆಗಳನ್ನು ಮರೆಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, secret ಪಾಸ್‌ವರ್ಡ್‌ಗಳು ಮತ್ತು API ಕೀಲಿಗಳಂತಹ ವಿಷಯಗಳನ್ನು ಮರೆಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ಈ ಲೇಬಲ್ಗಳನ್ನು BIOES ಸ್ಪ್ಯಾನ್ ಟ್ಯಾಗ್‌ಗಳೊಂದಿಗೆ ಡಿಕೋಡ್ ಮಾಡಲಾಗುತ್ತದೆ, ಇದು ಹೆಚ್ಚು ಸ್ವಚ್ಛ ಮತ್ತು ಹೆಚ್ಚು ಸಮ್ಮೇಳಿತ ಮಾಸ್ಕಿಂಗ್ ಗಡಿಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ಇನ್‌ಪುಟ್ ಪಠ್ಯದ ಉದಾಹರಣೆ

ವಿಷಯ: Q2 ಯೋಜನೆ ಅನುಸರಣೆ ಕುರಿತು

ಹಾಯ್ ಜೋರ್ಡಾನ್,

ಇಂದು ಮುಂಚಿನ ಭೇಟಿಗಾಗಿ ಮತ್ತೊಮ್ಮೆ ಧನ್ಯವಾದಗಳು. Q2 ರೋಲ್‌ಔಟ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ಪರಿಷ್ಕೃತ ವೇಳಾಪಟ್ಟಿಯನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಮತ್ತು 18.09.2026 ರಂದು ಉತ್ಪನ್ನ ಬಿಡುಗಡೆ ನಿಗದಿಯಾಗಿದೆ ಎಂದು ದೃಢೀಕರಿಸಲು ಬಯಸಿದ್ದೆ. ಉಲ್ಲೇಖಕ್ಕಾಗಿ, ಯೋಜನೆ ಫೈಲ್ 4829-1037-5581 ಅಡಿಯಲ್ಲಿ ಪಟ್ಟಿ ಮಾಡಲಾಗಿದೆ. ನಿಮ್ಮ ಕಡೆ ಯಾವುದಾದರೂ ಬದಲಾವಣೆಗಳಾದರೆ, maya.chen@example.com ಗೆ ಇಲ್ಲಿಯೇ ಪ್ರತಿಕ್ರಿಯಿಸಿ ಅಥವಾ ನನಗೆ +1 (415) 555-0124 ಗೆ ಕರೆ ಮಾಡಿ.

ಶುಭಾಶಯಗಳು,

ಮಾಯಾ ಚೆನ್

ವೈಯಕ್ತಿಕ ಗುರುತುಗಳನ್ನು ಮರೆಮಾಡಿದ ನಂತರದ ಪಠ್ಯ

ವಿಷಯ: Q2 ಯೋಜನೆ ಅನುಸರಣಾ ಕಾರ್ಯ

ನಮಸ್ಕಾರ [PRIVATE_PERSON],

ಇಂದು ದಿನದ ಆರಂಭದಲ್ಲಿ ಭೇಟಿಯಾದಕ್ಕಾಗಿ ಮತ್ತೊಮ್ಮೆ ಧನ್ಯವಾದಗಳು. Q2 ಬಿಡುಗಡೆಗಾಗಿ ಪರಿಷ್ಕೃತ ವೇಳಾಪಟ್ಟಿಯ ಕುರಿತು ಮತ್ತೊಮ್ಮೆ ಸಂಪರ್ಕಿಸಲು ಬಯಸಿದ್ದೆ ಮತ್ತು ಉತ್ಪನ್ನ ಬಿಡುಗಡೆ [PRIVATE_DATE]ಕ್ಕೆ ನಿಗದಿಯಾಗಿದೆ ಎಂದು ದೃಢೀಕರಿಸಲು ಬಯಸಿದ್ದೆ. ಉಲ್ಲೇಖಕ್ಕಾಗಿ, ಯೋಜನೆ ಫೈಲ್ [ACCOUNT_NUMBER] ಅಡಿಯಲ್ಲಿ ಪಟ್ಟಿಮಾಡಲಾಗಿದೆ. ನಿಮ್ಮ ಕಡೆ ಯಾವುದಾದರೂ ಬದಲಾವಣೆಗಳಾದರೆ, ಇಲ್ಲಿಯೇ [PRIVATE_EMAIL] ಗೆ ಉತ್ತರಿಸಲು ಮುಕ್ತವಾಗಿರಿ ಅಥವಾ [PRIVATE_PHONE] ನಲ್ಲಿ ನನಗೆ ಕರೆ ಮಾಡಿ.

ಶುಭಾಶಯಗಳು,

[PRIVATE_PERSON]

ನಾವು ಅದನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸಿದ್ದೇವೆ

ನಾವು ಪ್ರೈವಸಿ ಫಿಲ್ಟರ್ ಅನ್ನು ಹಲವಾರು ಹಂತಗಳಲ್ಲಿ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ.

ಮೊದಲು, ಮಾಡೆಲ್ ಗುರುತಿಸಬೇಕಾದ ಪಠ್ಯ ಭಾಗಗಳ ವಿಧಗಳನ್ನು ನಿರ್ಧರಿಸುವ ಗೌಪ್ಯತೆ ವರ್ಗೀಕರಣ ವ್ಯವಸ್ಥೆಯನ್ನು ನಾವು ನಿರ್ಮಿಸಿದ್ದೇವೆ. ಇದರಲ್ಲಿ ವೈಯಕ್ತಿಕ ಗುರುತುಗಳು, ಸಂಪರ್ಕ ವಿವರಗಳು, ವಿಳಾಸಗಳು, ಖಾಸಗಿ ದಿನಾಂಕಗಳು, ಕ್ರೆಡಿಟ್ ಮತ್ತು ಬ್ಯಾಂಕಿಂಗ್ ಮಾಹಿತಿಯಂತಹ ವಿವಿಧ ರೀತಿಯ ಖಾತೆ ಸಂಖ್ಯೆಗಳು, ಹಾಗು API ಕೀಗಳು ಮತ್ತು ಪಾಸ್‌ವರ್ಡ್‌ಗಳಂತಹ ರಹಸ್ಯಗಳು ಒಳಗೊಂಡಿವೆ.

ಎರಡನೆಯದಾಗಿ, ನಾವು ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ಲ್ಯಾಂಗ್ವೇಜ್ ಮಾಡೆಲಿಂಗ್ ಮಾಡೆಲ್ ಅನ್ನು ದ್ವಿದಿಶ ಟೋಕನ್ ವರ್ಗೀಕರಕವಾಗಿ ಪರಿವರ್ತಿಸಲು, ಲ್ಯಾಂಗ್ವೇಜ್ ಮಾಡೆಲಿಂಗ್ ಹೆಡ್ ಅನ್ನು ಟೋಕನ್ ವರ್ಗೀಕರಣ ಹೆಡ್‌ನಿಂದ ಬದಲಾಯಿಸಿ, ಮೇಲ್ವಿಚಾರಿತ ವರ್ಗೀಕರಣ ಉದ್ದೇಶಕ್ಕಾಗಿ ನಂತರದ ತರಬೇತಿಯನ್ನು ನೀಡಿದೆವು. 

ಮೂರನೆಯದಾಗಿ, ನಾವು ನೈಜ ಪಠ್ಯ ಮತ್ತು ಸಂಕೀರ್ಣ ಗೌಪ್ಯತಾ ಮಾದರಿಗಳೆರಡನ್ನೂ ಒಳಗೊಂಡಂತೆ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿರುವ ಮತ್ತು ಕೃತಕವಾಗಿ ರಚಿಸಲಾದ ಡೇಟಾದ ಮಿಶ್ರಣದ ಮೇಲೆ ತರಬೇತಿ ನೀಡಿದ್ದೇವೆ. ಸಾರ್ವಜನಿಕ ಡೇಟಾದ ಕೆಲವು ಭಾಗಗಳಲ್ಲಿ ಲೇಬಲ್‌ಗಳು ಅಪೂರ್ಣವಾಗಿದ್ದಲ್ಲಿ, ವ್ಯಾಪ್ತಿಯನ್ನು ಸುಧಾರಿಸಲು ನಾವು ಮಾಡೆಲ್-ಸಹಾಯಿತ ಅನೋಟೇಶನ್ ಮತ್ತು ವಿಮರ್ಶೆಯನ್ನು ಬಳಸಿದ್ದೇವೆ. ಸ್ವರೂಪಗಳು, ಸಂದರ್ಭಗಳು ಮತ್ತು ಗೌಪ್ಯತಾ ಉಪಪ್ರಕಾರಗಳಾದ್ಯಂತ ವೈವಿಧ್ಯತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ನಾವು ಕೃತಕ ಉದಾಹರಣೆಗಳನ್ನೂ ರಚಿಸಿದ್ದೇವೆ.

ಇನ್‌ಫರೆನ್ಸ್ ಸಮಯದಲ್ಲಿ, ಮಾಡೆಲ್‌ನ ಟೋಕನ್-ಮಟ್ಟದ ಊಹಿಕೆಗಳನ್ನು ನಿಯಂತ್ರಿತ ಸೀಕ್ವೆನ್ಸ್ ಡಿಕೋಡಿಂಗ್ ಬಳಸಿ ಸುಸಂಬದ್ಧ ಸ್ಪ್ಯಾನ್‌ಗಳಾಗಿ ಡಿಕೋಡ್ ಮಾಡಲಾಗುತ್ತದೆ. ಈ ವಿಧಾನವು ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ಮಾಡೆಲ್‌ನ ವ್ಯಾಪಕ ಭಾಷಾ ಅರಿವನ್ನು ಉಳಿಸಿಕೊಂಡೇ, ಅದನ್ನು ಗೌಪ್ಯತೆ ಪತ್ತೆಹಚ್ಚುವಿಕೆಗೆ ವಿಶೇಷಗೊಳಿಸುತ್ತದೆ.

Privacy Filter ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ

ನಾವು Privacy Filter ಅನ್ನು ಪ್ರಮಾಣಿತ ಬೆಂಚ್ಮಾರ್ಕ್‌ಗಳಲ್ಲಿ ಮತ್ತು ಹೆಚ್ಚು ಕಠಿಣವಾದ, ಸಂದರ್ಭಕ್ಕೆ ಹೆಚ್ಚು ಸಂವೇದನಾಶೀಲವಾದ ಪ್ರಕರಣಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಹೆಚ್ಚುವರಿ ಕೃತಕ ಮತ್ತು ಚಾಟ್-ಶೈಲಿಯ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಿದ್ದೇವೆ.

PII-Masking-300k(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಬೆಂಚ್‌ಮಾರ್ಕ್‌ನಲ್ಲಿ, Privacy Filter 96% ರ F1 ಅಂಕವನ್ನು ಸಾಧಿಸುತ್ತದೆ (94.04% ಪ್ರಿಸಿಷನ್ ಮತ್ತು 98.04% ರಿಕಾಲ್). ಪರಿಶೀಲನೆಯ ವೇಳೆ ಗುರುತಿಸಲಾದ ಡೇಟಾಸೆಟ್ ಅನೋಟೇಶನ್ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಗಣಿಸುವ ಬೆಂಚ್ಮಾರ್ಕ್‌ನ ಸರಿಪಡಿಸಿದ ಆವೃತ್ತಿಯಲ್ಲಿ, F1 ಸ್ಕೋರ್ 97.43% ಆಗಿದೆ (96.79% ಪ್ರಿಸಿಷನ್ ಮತ್ತು 98.08% ರಿಕಾಲ್).

ಇದಲ್ಲದೆ, ಮಾಡೆಲ್ ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಹೊಂದಿಕೊಳ್ಳಬಹುದು. ಸ್ವಲ್ಪ ಪ್ರಮಾಣದ ಡೇಟಾದ ಮೇಲೆಯೂ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮಾಡಿದರೆ, ಡೊಮೇನ್-ನಿರ್ದಿಷ್ಟ ಕಾರ್ಯಗಳಲ್ಲಿ ನಿಖರತೆ ಶೀಘ್ರವಾಗಿ ಸುಧಾರಿಸುತ್ತದೆ; F1 ಸ್ಕೋರ್ 54% ರಿಂದ 96% ಕ್ಕೆ ಹೆಚ್ಚುತ್ತದೆ ಮತ್ತು ನಾವು ಮೌಲ್ಯಮಾಪನ ಮಾಡಿದ ಡೊಮೇನ್-ಅಡಾಪ್ಷನ್ ಬೆಂಚ್‌ಮಾರ್ಕ್‌ನಲ್ಲಿ ಸ್ಯಾಚುರೇಶನ್‌ಗೆ ಸಮೀಪಿಸುತ್ತದೆ.

ಬೆಂಚ್‌ಮಾರ್ಕ್ ಕಾರ್ಯಕ್ಷಮತಿಗಿಂತ ಹೆಚ್ಚಾಗಿ, Privacy Filter ಅನ್ನು ನೈಜ-ಜಗತ್ತಿನ, ಅಸ್ಪಷ್ಟತೆ ಇರುವ ಪಠ್ಯದಲ್ಲಿ ಪ್ರಾಯೋಗಿಕ ಗೌಪ್ಯತೆ ಶೋಧನೆಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಇವುಗಳಲ್ಲಿ ದೀರ್ಘ ದಸ್ತಾವೇಜುಗಳು, ಅಸ್ಪಷ್ಟ ಉಲ್ಲೇಖಗಳು, ಮಿಶ್ರ ಸ್ವರೂಪದ ಸ್ಟ್ರಿಂಗ್‌ಗಳು ಮತ್ತು ಸಾಫ್ಟ್‌ವೇರ್ ಸಂಬಂಧಿತ ರಹಸ್ಯಗಳು ಸೇರಿವೆ. ಮಾಡೆಲ್ ಕಾರ್ಡ್ (ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)ಕೋಡ್‌ಬೇಸ್‌ಗಳಲ್ಲಿ ರಹಸ್ಯ ಪತ್ತೆಹಚ್ಚುವಿಕೆ ಮತ್ತು ಬಹುಭಾಷಾ, ಪ್ರತಿಕೂಲ, ಸಂದರ್ಭ-ಆಧಾರಿತ ಉದಾಹರಣೆಗಳ ಒತ್ತಡ ಪರೀಕ್ಷೆಗಳ ಕುರಿತು ಉದ್ದೇಶಿತ ಮೌಲ್ಯಮಾಪನವನ್ನು ವರದಿ ಮಾಡುತ್ತದೆ.

ಮಿತಿಗಳು

Privacy Filter ಅನಾಮಧೇಯಗೊಳಿಸುವ ಸಾಧನವಲ್ಲ, ಅನುಗುಣತೆ ಪ್ರಮಾಣಪತ್ರವಲ್ಲ ಅಥವಾ ಹೆಚ್ಚಿನ ಪಣವಿರುವ ಸಂದರ್ಭಗಳಲ್ಲಿ ನೀತಿ ಪರಿಶೀಲನೆಗೆ ಪರ್ಯಾಯವೂ ಅಲ್ಲ. ಇದು ವ್ಯಾಪಕವಾದ ವಿನ್ಯಾಸದ ಮೂಲಕ ಗೌಪ್ಯತೆಯನ್ನು ಒದಗಿಸುವ ವ್ಯವಸ್ಥೆಯ ಒಂದು ಘಟಕವಾಗಿದೆ.

ಅದರ ನಡವಳಿಕೆಯು ಅದಕ್ಕೆ ಟ್ರೈನಿಂಗ್ ನೀಡಲಾದ ಲೇಬಲ್ ವರ್ಗೀಕರಣ ಮತ್ತು ನಿರ್ಧಾರದ ಗಡಿಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತದೆ. ವಿಭಿನ್ನ ಸಂಸ್ಥೆಗಳು ವಿಭಿನ್ನ ಪತ್ತೆಹಚ್ಚುವಿಕೆ ಅಥವಾ ಮರೆಮಾಡುವಿಕೆ ನೀತಿಗಳನ್ನು ಬಯಸಬಹುದು, ಮತ್ತು ಆ ನೀತಿಗಳಿಗೆ ಡೊಮೇನ್-ನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಮಾಪನ ಅಥವಾ ಹೆಚ್ಚಿನ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಅಗತ್ಯವಾಗಬಹುದು. ತರಬೇತಿ ವಿತರಣೆಯಿಂದ ಭಿನ್ನವಾಗಿರುವ ಭಾಷೆಗಳು, ಲಿಪಿಗಳು, ಹೆಸರಿಸುವ ಸಂಪ್ರದಾಯಗಳು ಮತ್ತು ಡೊಮೇನ್‌ಗಳಾದ್ಯಂತವೂ ಕಾರ್ಯಕ್ಷಮತೆ ಬದಲಾಗಬಹುದು.

ಎಲ್ಲಾ ಮಾಡೆಲ್‌ಗಳಂತೆ, Privacy Filter ತಪ್ಪುಗಳನ್ನು ಮಾಡಬಹುದು. ಇದು ಅಪರೂಪದ ಗುರುತಿಕೆಗಳನ್ನು ಅಥವಾ ಅಸ್ಪಷ್ಟ ಖಾಸಗಿ ಉಲ್ಲೇಖಗಳನ್ನು ಗಮನಿಸದೇ ಬಿಡಬಹುದು, ಮತ್ತು ಸಂದರ್ಭ ಸೀಮಿತವಾಗಿರುವಾಗ, ವಿಶೇಷವಾಗಿ ಚಿಕ್ಕ ಅನುಕ್ರಮಗಳಲ್ಲಿ, ಘಟಕಗಳನ್ನು ಅಗತ್ಯಕ್ಕಿಂತ ಹೆಚ್ಚು ಅಥವಾ ಕಡಿಮೆ ಮರೆಮಾಡಬಹುದು. ಕಾನೂನು, ವೈದ್ಯಕೀಯ ಮತ್ತು ಹಣಕಾಸು ಕಾರ್ಯಪ್ರವಾಹಗಳಂತಹ ಹೆಚ್ಚಿನ ಸಂವೇದನಾಶೀಲತೆ ಹೊಂದಿರುವ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ, ಮಾನವ ಪರಿಶೀಲನೆ ಹಾಗೂ ಕ್ಷೇತ್ರ-ನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಮಾಪನ ಮತ್ತು ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಇನ್ನೂ ಮಹತ್ವವಾಗಿವೆ.

ಲಭ್ಯತೆ

ಪರಿಸರದಾದ್ಯಂತ ಇನ್ನಷ್ಟು ಬಲವಾದ ಗೌಪ್ಯತಾ ರಕ್ಷಣೆಗಳನ್ನು ಬೆಂಬಲಿಸಲು ನಾವು OpenAI ಗೌಪ್ಯತೆ ಫಿಲ್ಟರ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ.

ಮಾಡೆಲ್ ಇಂದು Apache 2.0 ಲೈಸೆನ್ಸ್ ಅಡಿಯಲ್ಲಿ Hugging Face(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಮತ್ತು Github(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಇದು ಪ್ರಯೋಗ, ಕಸ್ಟಮೈಜೇಶನ್ ಮತ್ತು ವಾಣಿಜ್ಯ ನಿಯೋಜನೆಗಾಗಿ ಉದ್ದೇಶಿಸಲಾಗಿದೆ, ಮತ್ತು ವಿಭಿನ್ನ ಡೇಟಾ ವಿತರಣೆಗಳು ಹಾಗೂ ಪ್ರೈವಸಿ ಪಾಲಿಸಿಗಳಿಗೆ ಅನುಗುಣವಾಗಿ ಇದನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಬಹುದು.

ಮಾಡೆಲ್ ಜೊತೆಗೆ, ಮಾಡೆಲ್ ವಾಸ್ತುಶಿಲ್ಪ, ಲೇಬಲ್ ವರ್ಗೀಕರಣ, ಡಿಕೋಡಿಂಗ್ ನಿಯಂತ್ರಣಗಳು, ಉದ್ದೇಶಿತ ಬಳಕೆ ಸಂದರ್ಭಗಳು, ಮೌಲ್ಯಮಾಪನ ವ್ಯವಸ್ಥೆ ಮತ್ತು ತಿಳಿದಿರುವ ಮಿತಿಗಳನ್ನು ಒಳಗೊಂಡ ದಸ್ತಾವೇಜುಗಳನ್ನು ನಾವು ಹಂಚಿಕೊಳ್ಳುತ್ತಿದ್ದೇವೆ, ಇದರಿಂದ ತಂಡಗಳು ಮಾಡೆಲ್ ಯಾವ ವಿಷಯಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಮಾಡುತ್ತದೆ ಮತ್ತು ಅದನ್ನು ಎಲ್ಲಿ ಎಚ್ಚರಿಕೆಯಿಂದ ಬಳಸಬೇಕು ಎಂಬ ಎರಡನ್ನೂ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು.

ಮುಂದೆ ನೋಡುವುದು

AI ವ್ಯವಸ್ಥೆಗಳಿಗಾಗಿ ಗೌಪ್ಯತೆ ರಕ್ಷಣೆ ಸಂಶೋಧನೆ, ಉತ್ಪನ್ನ ವಿನ್ಯಾಸ, ಮೌಲ್ಯಮಾಪನ ಮತ್ತು ನಿಯೋಜನೆಗಳಾದ್ಯಂತ ನಡೆಯುವ ನಿರಂತರ ಪ್ರಯತ್ನವಾಗಿದೆ.

Privacy Filter ನಾವು ಪ್ರಮುಖವೆಂದು ನಂಬುವ ಒಂದು ದಿಕ್ಕನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತದೆ: ನೈಜ ಜಗತ್ತಿನ AI ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಪ್ರಾಮುಖ್ಯತೆಯುಳ್ಳ, ಸ್ಪಷ್ಟವಾಗಿ ವ್ಯಾಖ್ಯಾನಿಸಲಾದ ಕಾರ್ಯಗಳಲ್ಲಿ ಅತ್ಯಾಧುನಿಕ ಸಾಮರ್ಥ್ಯ ಹೊಂದಿರುವ ಸಣ್ಣ, ಕಾರ್ಯಕ್ಷಮ ಮಾಡೆಲ್‌ಗಳು. ಗೌಪ್ಯತೆಯನ್ನು ಸಂರಕ್ಷಿಸುವ ಮೂಲಸೌಕರ್ಯವನ್ನು ಪರಿಶೀಲಿಸಲು, ಕಾರ್ಯಗತಗೊಳಿಸಲು, ಹೊಂದಿಕೊಳ್ಳಿಸಲು ಮತ್ತು ಸುಧಾರಿಸಲು ಹೆಚ್ಚು ಸುಲಭವಾಗಿರಬೇಕು ಎಂದು ನಾವು ಭಾವಿಸುವುದರಿಂದ, ನಾವು ಇದನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ.

ನಮ್ಮ ಗುರಿಯು ಮಾಡೆಲ್‌ಗಳು ಖಾಸಗಿ ವ್ಯಕ್ತಿಗಳ ಬಗ್ಗೆ ಅಲ್ಲ, ಜಗತ್ತಿನ ಬಗ್ಗೆ ತಿಳಿಯುವುದಾಗಿದೆ. Privacy Filter ಅದನ್ನು ಸಾಧ್ಯವಾಗಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ನಾವು Privacy Filter ನ ಈ ಪೂರ್ವವೀಕ್ಷಣೆಯನ್ನು ಸಂಶೋಧನೆ ಮತ್ತು ಗೌಪ್ಯತಾ ಸಮುದಾಯದಿಂದ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಪಡೆಯಲು ಮತ್ತು ಮಾಡೆಲ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಇನ್ನಷ್ಟು ಸುಧಾರಿಸಲು ಬಿಡುಗಡೆ ಮಾಡುತ್ತಿದ್ದೇವೆ.