ಮುಖ್ಯ ವಿಷಯಕ್ಕೆ ನೇರವಾಗಿ ಹೋಗಿ
OpenAI

OpenAI ಸುರಕ್ಷತಾ ಬಗ್ ಬೌಂಟಿ ಕಾರ್ಯಕ್ರಮವನ್ನು ಪರಿಚಯಿಸುತ್ತಿದ್ದೇವೆ

OpenAI ಯಾದ್ಯಂತ ಸುರಕ್ಷತೆ ಮತ್ತು ದುರುಪಯೋಗ ಸಮಸ್ಯೆಗಳ ಪರೀಕ್ಷೆ

ಇಂದು, OpenAI ನಮ್ಮ ಉತ್ಪನ್ನಗಳಾದ್ಯಂತ AI ದುರುಪಯೋಗ ಮತ್ತು ಸುರಕ್ಷತಾ ಅಪಾಯಗಳನ್ನು ಗುರುತಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದ ಸಾರ್ವಜನಿಕ ಸುರಕ್ಷತಾ ಬಗ್ ಬೌಂಟಿ ಕಾರ್ಯಕ್ರಮವನ್ನು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಪ್ರಾರಂಭಿಸುತ್ತಿದೆ. AI ತಂತ್ರಜ್ಞಾನವು ವೇಗವಾಗಿ ವಿಕಸನಗೊಳ್ಳುತ್ತಿದ್ದಂತೆ, ಅದನ್ನು ದುರುಪಯೋಗಪಡಿಸಿಕೊಳ್ಳಬಹುದಾದ ಸಂಭಾವ್ಯ ಮಾರ್ಗಗಳು ಕೂಡ ಹೆಚ್ಚುತ್ತವೆ. ನಮ್ಮ ಗುರಿಯು ನೈಜ ಹಾನಿಗೆ ಕಾರಣವಾಗಬಹುದಾದ ದುರ್ಬಳಕೆ ಅಥವಾ ದುರುಪಯೋಗದ ವಿರುದ್ಧ ನಮ್ಮ ವ್ಯವಸ್ಥೆಗಳು ಸುರಕ್ಷಿತವಾಗಿಯೂ ಭದ್ರವಾಗಿಯೂ ಉಳಿಯುವಂತೆ ಖಚಿತಪಡಿಸುವುದಾಗಿದೆ. 

ಈ ಹೊಸ ಕಾರ್ಯಕ್ರಮವು OpenAI ಯ ಭದ್ರತಾ ಬಗ್ ಬೌಂಟಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)ಗೆ ಪೂರಕವಾಗಿರುತ್ತದೆ. ಇದು ಭದ್ರತಾ ದುರ್ಬಲತೆಗೆ ಸಂಬಂಧಿಸಿದ ಮಾನದಂಡಗಳನ್ನು ಪೂರೈಸದಿದ್ದರೂ ಸಹ, ಗಮನಾರ್ಹ ದುರುಪಯೋಗ ಮತ್ತು ಸುರಕ್ಷತಾ ಅಪಾಯಗಳನ್ನು ಉಂಟುಮಾಡುವ ಸಮಸ್ಯೆಗಳನ್ನು ಸ್ವೀಕರಿಸುತ್ತದೆ. ಈ ಕಾರ್ಯಕ್ರಮದ ಮೂಲಕ, ಸಾಂಪ್ರದಾಯಿಕ ಭದ್ರತಾ ದುರ್ಬಲತೆಗಳ ವ್ಯಾಪ್ತಿಗೆ ಬಾರದಿದ್ದರೂ ಸಹ ನೈಜ ಅಪಾಯಗಳನ್ನು ಉಂಟುಮಾಡುವ ಸಮಸ್ಯೆಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ಪರಿಹರಿಸಲು ನಮಗೆ ಸಹಾಯ ಮಾಡುವ ಸುರಕ್ಷತೆ ಮತ್ತು ಭದ್ರತಾ ಸಂಶೋಧಕರೊಂದಿಗೆ ಸಹಭಾಗಿತ್ವವನ್ನು ಮುಂದುವರಿಸಲು ನಾವು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ. ಸಲ್ಲಿಕೆಗಳನ್ನು OpenAI ಯ ಸೇಫ್ಟಿ ಮತ್ತು ಸೆಕ್ಯುರಿಟಿ ಬಗ್ ಬೌಂಟಿ ತಂಡಗಳು ಪ್ರಾಥಮಿಕವಾಗಿ ಪರಿಶೀಲಿಸುತ್ತವೆ ಮತ್ತು ವ್ಯಾಪ್ತಿ ಹಾಗೂ ಮಾಲೀಕತ್ವವನ್ನು ಅವಲಂಬಿಸಿ ಅವುಗಳನ್ನು ಎರಡು ಕಾರ್ಯಕ್ರಮಗಳ ನಡುವೆ ಮರುನಿರ್ದೇಶಿಸಬಹುದು.

ಕಾರ್ಯಕ್ರಮ ಅವಲೋಕನ

ಹೊಸ ಸುರಕ್ಷತಾ ಬಗ್ ಬೌಂಟಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಕಾರ್ಯಕ್ರಮವು ಕೆಳಗೆ ಪಟ್ಟಿ ಮಾಡಲಾದ AI-ನಿರ್ದಿಷ್ಟ ಸುರಕ್ಷತಾ ಸನ್ನಿವೇಶಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ:

MCP ಸೇರಿದಂತೆ ಏಜೆಂಟಿಕ್ ಅಪಾಯಗಳು

  • ಮೂರನೇ ವ್ಯಕ್ತಿಯ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಮತ್ತು ಡೇಟಾ ಎಕ್ಸ್‌ಫಿಲ್ಟ್ರೇಷನ್: ದಾಳಿಕೋರನ ಪಠ್ಯವು ಬಲಿಪಶುವಿನ ಏಜೆಂಟ್ (ಬ್ರೌಸರ್, ChatGPT ಏಜೆಂಟ್ ಮತ್ತು ಇತರ ಸಮಾನ ಏಜೆಂಟಿಕ್ ಉತ್ಪನ್ನಗಳನ್ನು ಒಳಗೊಂಡಂತೆ) ನಿಯಂತ್ರಣವನ್ನು ಕಬಳಿಸಿ, ಅದನ್ನು ಹಾನಿಕಾರಕ ಕ್ರಿಯೆಯನ್ನು ಮಾಡಲು ಅಥವಾ ಬಳಕೆದಾರರ ಸಂವೇದನಾಶೀಲ ಮಾಹಿತಿಯನ್ನು ಸೋರಿಸಲು ಮೋಸಗೊಳಿಸುವ ಸಂದರ್ಭ. ಈ ನಡವಳಿಕೆ ಕನಿಷ್ಠ 50% ಸಮಯದಲ್ಲಿ ಪುನರುತ್ಪಾದಿಸಬಹುದಾದದ್ದಾಗಿರಬೇಕು. 
  • ಏಜೆಂಟಿಕ್ (ಸ್ವಾಯತ್ತ) OpenAI ಉತ್ಪನ್ನವು OpenAI ಯ ವೆಬ್‌ಸೈಟ್‌ನಲ್ಲಿ ವ್ಯಾಪಕ ಮಟ್ಟದಲ್ಲಿ ಅನುಮತಿಸದ ಕ್ರಿಯೆಯನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ.
  • ಏಜೆಂಟಿಕ್ OpenAI ಉತ್ಪನ್ನವು ಮೇಲೆ ಪಟ್ಟಿ ಮಾಡದ ಕೆಲವು ಸಂಭವನೀಯ ಹಾನಿಕಾರಕ ಕ್ರಮವನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ. ಇಲ್ಲಿನ ಮಾನ್ಯ ವರದಿಗಳು ಸಂಭವನೀಯ ಮತ್ತು ಗಂಭೀರ ಹಾನಿಯನ್ನು ಸೂಚಿಸಬೇಕು.
  • MCP ಅಪಾಯಕ್ಕಾಗಿ ಯಾವುದೇ ಪರೀಕ್ಷೆಯು ಯಾವುದೇ ಮೂರನೇ ವ್ಯಕ್ತಿಗಳ ಸೇವಾ ನಿಯಮಗಳನ್ನು ಪಾಲಿಸಬೇಕು.

OpenAI ಸ್ವಾಮ್ಯ ಮಾಹಿತಿ

  • ರೀಜನಿಂಗ್‌ಗೆ ಸಂಬಂಧಿಸಿದ ಸ್ವಾಮ್ಯದ ಮಾಹಿತಿಯನ್ನು ಹಿಂತಿರುಗಿಸುವ ಮಾಡೆಲ್ ರಚನೆಗಳು.
  • ಇತರೆ OpenAI ಸ್ವಂತ ಮಾಹಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸುವ ದುರ್ಬಲತೆಗಳು.

ಖಾತೆ ಮತ್ತು ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಸಮಗ್ರತೆ

  • ಖಾತೆ ಸಮಗ್ರತೆ ಮತ್ತು ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಸಮಗ್ರತೆ ಸಂಕೇತಗಳಲ್ಲಿ ದುರ್ಬಲತೆಗಳು, ಉದಾಹರಣೆಗೆ ಸ್ವಯಂಚಾಲನೆ-ನಿರೋಧಕ ನಿಯಂತ್ರಣಗಳನ್ನು ಬಿಟ್ಟುಹೋಗುವುದು, ಖಾತೆ ವಿಶ್ವಾಸ ಸಂಕೇತಗಳನ್ನು ತಿರುಚುವುದು, ಖಾತೆ ನಿರ್ಬಂಧಗಳು/ಅಮಾನತುಗಳು/ನಿಷೇಧಗಳನ್ನು ತಪ್ಪಿಸಿಕೊಳ್ಳುವುದು ಮತ್ತು ಇತರ ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳು.
  • ಅಧಿಕೃತ ಅನುಮತಿಗಳನ್ನು ಮೀರಿ ವೈಶಿಷ್ಟ್ಯಗಳು, ಡೇಟಾ ಅಥವಾ ಕಾರ್ಯಕ್ಷಮತೆಗಳಿಗೆ ಪ್ರವೇಶಿಸಲು ಅವಕಾಶ ನೀಡುವ ಸಮಸ್ಯೆಗಳನ್ನು ಸುರಕ್ಷತಾ ಬಗ್ ಬೌಂಟಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)ಗೆ ವರದಿ ಮಾಡಬೇಕು.

ಜೈಲ್‌ಬ್ರೇಕ್‌ಗಳು ಈ ಕಾರ್ಯಕ್ರಮದ ವ್ಯಾಪ್ತಿಗೆ ಹೊರತಾಗಿದ್ದರೂ, ನಾವು ಕಾಲಕಾಲಕ್ಕೆ ChatGPT Agent ಮತ್ತು GPT‑5 ನಲ್ಲಿ ಜೈವಿಕ ಅಪಾಯದ ವಿಷಯ ಸಂಬಂಧಿತ ಸಮಸ್ಯೆಗಳಂತಹ ಕೆಲವು ಹಾನಿಯ ವಿಧಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದ ಖಾಸಗಿ ಬಗ್ ಬೌಂಟಿ ಅಭಿಯಾನಗಳನ್ನು ನಡೆಸುತ್ತೇವೆ. ಈ ಕಾರ್ಯಕ್ರಮಗಳು ಲಭ್ಯವಾದಾಗ, ಆಸಕ್ತಿ ಹೊಂದಿರುವ ಸಂಶೋಧಕರು ಅವುಗಳಿಗೆ ಅರ್ಜಿ ಸಲ್ಲಿಸಲು ನಾವು ಆಹ್ವಾನಿಸುತ್ತೇವೆ. 

ಮೇಲೆ ಪಟ್ಟಿ ಮಾಡಲಾದ ವರ್ಗಗಳ ಹೊರತಾಗಿ, ಸಂಶೋಧಕರು ಬಳಕೆದಾರರಿಗೆ ನೇರ ಹಾನಿಗೆ ಕಾರಣವಾಗುವ ದೋಷಗಳನ್ನು ಗುರುತಿಸಿ, ಸ್ಪಷ್ಟವಾದ ಮತ್ತು ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದಾದ ಪರಿಹಾರ ಕ್ರಮಗಳನ್ನು ಸೂಚಿಸಿದರೆ, ಅವುಗಳನ್ನು ಪ್ರತಿ ಪ್ರಕರಣದ ಆಧಾರದ ಮೇಲೆ ಬಹುಮಾನಗಳಿಗೆ ವ್ಯಾಪ್ತಿಯೊಳಗೆ ಪರಿಗಣಿಸಬಹುದು. ಸುರಕ್ಷತೆ ಅಥವಾ ದುರುಪಯೋಗದ ಮೇಲೆ ಸ್ಪಷ್ಟವಾಗಿ ತೋರಿಸಬಹುದಾದ ಪರಿಣಾಮವಿಲ್ಲದ ಸಾಮಾನ್ಯ ವಿಷಯ-ನೀತಿ ತಪ್ಪಿಸಿಕೊಳ್ಳುವಿಕೆಗಳು ಈ ಕಾರ್ಯಕ್ರಮದ ವ್ಯಾಪ್ತಿಗೆ ಹೊರತಾಗಿವೆ. ಉದಾಹರಣೆಗೆ, ಮಾಡೆಲ್ ಅಸಭ್ಯ ಭಾಷೆಯನ್ನು ಬಳಸುವಂತೆ ಮಾಡುವ ಅಥವಾ ಸರ್ಚ್ ಎಂಜಿನ್‌ಗಳ ಮೂಲಕ ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಬಹುದಾದ ಮಾಹಿತಿಯನ್ನು ಹಿಂತಿರುಗಿಸುವ “ಜೈಲ್‌ಬ್ರೇಕ್‌ಗಳು” ಈ ಕಾರ್ಯಕ್ರಮದ ವ್ಯಾಪ್ತಿಗೆ ಹೊರತಾಗಿವೆ.

ಭಾಗವಹಿಸುವುದು ಹೇಗೆ

ಭಾಗವಹಿಸಲು ಆಸಕ್ತಿ ಹೊಂದಿರುವ ಸಂಶೋಧಕರು ನಮ್ಮ ಸುರಕ್ಷತಾ ಬಗ್ ಬೌಂಟಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಕಾರ್ಯಕ್ರಮದ ಮೂಲಕ ಅರ್ಜಿ ಸಲ್ಲಿಸಬಹುದು. ಸುರಕ್ಷಿತ AI ಪರಿಸರ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸುವ ಪ್ರಯತ್ನದಲ್ಲಿ ಸಂಶೋಧಕರು, ನೈತಿಕ ಹ್ಯಾಕರ್‌ಗಳು ಮತ್ತು ಸುರಕ್ಷತೆ ಹಾಗೂ ಭದ್ರತಾ ಸಮುದಾಯದೊಂದಿಗೆ ಜೊತೆಯಾಗಿ ಕೆಲಸ ಮಾಡಲು ನಾವು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ.

ಲೇಖಕ

OpenAI