ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು: ಅತ್ಯಾಧುನಿಕ ಭದ್ರತಾ ಸವಾಲು
AI ಉಪಕರಣಗಳು ಈಗ ಪ್ರಶ್ನೆಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಿನ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಆರಂಭಿಸುತ್ತಿವೆ. ಅವರು ಈಗ ವೆಬ್ನ್ನು ಬ್ರೌಸ್ ಮಾಡಬಹುದು, ಸಂಶೋಧನೆಗೆ ಸಹಾಯ ಮಾಡಬಹುದು, ಪ್ರವಾಸಗಳನ್ನು ಯೋಜಿಸಬಹುದು ಮತ್ತು ಉತ್ಪನ್ನಗಳನ್ನು ಖರೀದಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು. ಅವುಗಳು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯಶಾಲಿಗಳಾಗುತ್ತಿದ್ದಂತೆ, ಇತರ ಆ್ಯಪ್ಗಳಲ್ಲಿ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಲು ಮತ್ತು ನಿಮ್ಮ ಪರವಾಗಿ ಕ್ರಮಗಳನ್ನು ಕೈಗೊಳ್ಳಲು ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದಾಗ, ಹೊಸ ಭದ್ರತಾ ಸವಾಲುಗಳು ಎದುರಾಗುತ್ತವೆ. ನಾವು ಹೆಚ್ಚು ಗಮನ ಹರಿಸುತ್ತಿರುವ ಒಂದು ವಿಷಯ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್.
ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಎಂಬುದು ಸಂಭಾಷಣಾತ್ಮಕ AIಗೆ ವಿಶೇಷವಾದ ಸಾಮಾಜಿಕ ಎಂಜಿನಿಯರಿಂಗ್ ದಾಳಿಯ ಪ್ರಕಾರವಾಗಿದೆ. ಆರಂಭಿಕ AI ವ್ಯವಸ್ಥೆಗಳು ಒಬ್ಬ ಬಳಕೆದಾರ ಮತ್ತು ಒಬ್ಬ AI ಏಜೆಂಟ್ ನಡುವಿನ ಸಂಭಾಷಣೆಗಳಾಗಿದ್ದವು. ಇಂದಿನ AI ಉತ್ಪನ್ನಗಳಲ್ಲಿ, ನಿಮ್ಮ ಸಂಭಾಷಣೆಯಲ್ಲಿ ಇಂಟರ್ನೆಟ್ ಸೇರಿದಂತೆ ಅನೇಕ ಮೂಲಗಳಿಂದ ವಿಷಯಗಳು ಸೇರಿರಬಹುದು. (ಬಳಕೆದಾರನೂ ಅಲ್ಲ ಮತ್ತು AI ಕೂಡ ಅಲ್ಲದ)ತೃತೀಯ ವ್ಯಕ್ತಿಯೊಬ್ಬನು ಸಂಭಾಷಣೆಯ ಸಂದರ್ಭಕ್ಕೆ ದುರುದ್ದೇಶಿತ ಸೂಚನೆಗಳನ್ನು ಸೇರಿಸುವ ಮೂಲಕ ಮಾಡೆಲ್ ಅನ್ನು ತಪ್ಪುದಾರಿಗೆಳೆಯಬಹುದು ಎಂಬ ಕಲ್ಪನೆಯಿಂದ “ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್” ಎಂಬ ಪದವು ಹುಟ್ಟಿಕೊಂಡಿತು.
ಫಿಷಿಂಗ್ ಇಮೇಲ್ಗಳು ಅಥವಾ ವೆಬ್ನಲ್ಲಿನ ವಂಚನೆಗಳು ಜನರನ್ನು ಸಂವೇದನಶೀಲ ಮಾಹಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸುವಂತೆ ಮೋಸಗೊಳಿಸಲು ಪ್ರಯತ್ನಿಸುವ ರೀತಿಯಲ್ಲೇ, ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ಗಳು AI ಗಳನ್ನು ನೀವು ಕೇಳದ ಕೆಲಸಗಳನ್ನು ಮಾಡಲು ಮೋಸಗೊಳಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತವೆ.
ನೀವು ಆನ್ಲೈನ್ನಲ್ಲಿ ಕೆಲವು ರಜೆ ಸಂಶೋಧನೆ ಮಾಡಲು AI ಅನ್ನು ಕೇಳಿದ್ದೀರಿ ಎಂದು ಕಲ್ಪಿಸಿ, ಮತ್ತು ಅದು ಅದನ್ನು ಮಾಡುತ್ತಿರುವಾಗ, ಅದು ವೆಬ್ಪುಟದಲ್ಲಿ ಮರೆಮಾಡಿರುವ ತಪ್ಪುಮಾರ್ಗದರ್ಶಕ ವಿಷಯ ಅಥವಾ ಹಾನಿಕಾರಕ ಸೂಚನೆಗಳನ್ನು ಎದುರಿಸಬಹುದು, ಉದಾಹರಣೆಗೆ ಲಿಸ್ಟಿಂಗ್ನಲ್ಲಿನ ಕಾಮೆಂಟ್ನಲ್ಲಿ ಅಥವಾ ವಿಮರ್ಶೆಯಲ್ಲಿ. AI ತಪ್ಪಾದ ಲಿಸ್ಟಿಂಗ್ ಅನ್ನು ಶಿಫಾರಸು ಮಾಡುವಂತೆ ಮೋಸಗೊಳಿಸಲು ಅಥವಾ ಇನ್ನೂ ಕೆಟ್ಟದಾಗಿ, ನಿಮ್ಮ ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ ಮಾಹಿತಿಯನ್ನು ಕದಿಯಲು ಪ್ರಯತ್ನಿಸುವ ಉದ್ದೇಶದಿಂದ ವಿಷಯವನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ರಚಿಸಿರಬಹುದು.
ಇವು “ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್” ದಾಳಿಗಳ ಕೆಲವು ಉದಾಹರಣೆಗಳು—ನೀವು ಉದ್ದೇಶಿಸದ ಕಾರ್ಯಗಳನ್ನು ಮಾಡಲು AI ಅನ್ನು ಮೋಸಗೊಳಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಹಾನಿಕಾರಕ ಸೂಚನೆಗಳು, ಸಾಮಾನ್ಯವಾಗಿ ವೆಬ್ ಪುಟ, ಡಾಕ್ಯುಮೆಂಟ್ ಅಥವಾ ಇಮೇಲ್ನಂತಹ ಸಾಮಾನ್ಯ ವಿಷಯದೊಳಗೆ ಅಡಗಿರುತ್ತವೆ.
AI ಗಳು ಹೆಚ್ಚು ಸೂಕ್ಷ್ಮ ಡೇಟಾಕ್ಕೆ ಪ್ರವೇಶ ಹೊಂದಿದಂತೆ ಮತ್ತು ಹೆಚ್ಚು ಮುಂದಾಳತ್ವ ವಹಿಸಿ ದೀರ್ಘಕಾಲದ ಕಾರ್ಯಗಳನ್ನು ಕೈಗೊಳ್ಳುವಂತೆ ಈ ಅಪಾಯಗಳು ಹೆಚ್ಚುತ್ತವೆ.
ಸಾರಾಂಶ | ನೀವು AI ಗೆ ಏನು ಮಾಡಲು ಕೇಳಿದ್ದೀರಿ | ದಾಳಿಕೋರನು ಏನು ಮಾಡುತ್ತಾನೆ | ದಾಳಿ ಯಶಸ್ವಿಯಾದರೆ ಸಂಭವಿಸಬಹುದಾದ ಪರಿಣಾಮ |
ನೀವು ಅಪಾರ್ಟ್ಮೆಂಟ್ಗಳನ್ನು ಸಂಶೋಧಿಸಲು AI ಅನ್ನು ಕೇಳುತ್ತೀರಿ, ಆದರೆ ಅದು ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ನಿಂದಾಗಿ ನಿಮಗೆ ಅತ್ಯುತ್ತಮ ಆಯ್ಕೆಯಲ್ಲದ ಲಿಸ್ಟಿಂಗ್ ಅನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತದೆ. | ನೀವು ಕೆಲವು ನಿರ್ದಿಷ್ಟ ಮಾನದಂಡಗಳೊಂದಿಗೆ ಅಪಾರ್ಟ್ಮೆಂಟ್ಗಳನ್ನು ಹುಡುಕಲು AI ಅನ್ನು ಕೇಳುತ್ತೀರಿ. | ಆಕ್ರಮಣಕಾರನು ಅಪಾರ್ಟ್ಮೆಂಟ್ ಲಿಸ್ಟಿಂಗ್ನಲ್ಲಿ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ದಾಳಿಯನ್ನು ಸೇರಿಸಿದ್ದಾನೆ, ಬಳಕೆದಾರನ ಹೇಳಿದ ಆದ್ಯತೆಗಳನ್ನು ಲೆಕ್ಕಿಸದೆ AI ಅವರ ಲಿಸ್ಟಿಂಗ್ ಆಯ್ಕೆ ಮಾಡಬೇಕೆಂದು ನಂಬುವಂತೆ ಮೋಸಗೊಳಿಸಲು. | ದಾಳಿ ಯಶಸ್ವಿಯಾದರೆ, ನಿಮ್ಮ ಆದ್ಯತೆಗಳ ಆಧಾರದ ಮೇಲೆ AI ತಪ್ಪಾಗಿ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ ಅಪಾರ್ಟ್ಮೆಂಟ್ ಲಿಸ್ಟಿಂಗ್ ಅನ್ನು ಶಿಫಾರಸು ಮಾಡಬಹುದು. |
ನೀವು ರಾತ್ರೋರಾತ್ರಿ ಬಂದ ನಿಮ್ಮ ಇಮೇಲ್ಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸಲು AI ಏಜೆಂಟ್ ಅನ್ನು ಕೇಳುತ್ತೀರಿ, ಆದರೆ ಅದು ನಿಮ್ಮ ಬ್ಯಾಂಕ್ ಸ್ಟೇಟ್ಮೆಂಟ್ಗಳನ್ನು ಹಂಚುತ್ತದೆ. | ನೀವು ಇಂದು ಬೆಳಿಗ್ಗೆ ಬ್ಯುಸಿಯಾಗಿರುವುದರಿಂದ, ನೀವು AI ಏಜೆಂಟ್ ಅನ್ನು ನಿಮ್ಮ ರಾತ್ರಿ ಬಂದ ಇಮೇಲ್ಗಳಿಗೆ ಸಾಮಾನ್ಯವಾಗಿ ಪ್ರತಿಕ್ರಿಯಿಸಲು ಕೇಳುತ್ತೀರಿ. ಕೆಳಗೆ “ಸಾಧ್ಯವಾದಲ್ಲಿ ಏಜೆಂಟ್ಗೆ ಸ್ಪಷ್ಟ ಸೂಚನೆಗಳನ್ನು ನೀಡಿ” ಅನ್ನು ನೋಡಿ | ಆಕ್ರಮಣಕಾರನು ನಿಮಗೆ ತಪ್ಪುಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡ ಇಮೇಲ್ ಕಳುಹಿಸಿದ್ದಾನೆ, ಅದು ಮಾಡೆಲ್ ಅನ್ನು ನಿಮ್ಮ ಬ್ಯಾಂಕ್ ಸ್ಟೇಟ್ಮೆಂಟ್ಗಳನ್ನು ಹುಡುಕಿ ಅವುಗಳನ್ನು ಆಕ್ರಮಣಕಾರನೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳುವಂತೆ ಮೋಸಗೊಳಿಸುತ್ತದೆ. | ದಾಳಿ ಯಶಸ್ವಿಯಾದರೆ, ಏಜೆಂಟ್ ನಿಮ್ಮ ಇಮೇಲ್ನಲ್ಲಿ (ನೀವು ಕಾರ್ಯಕ್ಕಾಗಿ ಪ್ರವೇಶವನ್ನು ನೀಡಿದ್ದೀರಿ) ಬ್ಯಾಂಕ್ ಸ್ಟೇಟ್ಮೆಂಟ್ಗಳಂತಹ ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಹುಡುಕಬಹುದು ಮತ್ತು ಆಕ್ರಮಣಕಾರನೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳಬಹುದು. |
ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ವಿರುದ್ಧ ರಕ್ಷಣೆ AI ಉದ್ಯಮದಲ್ಲಿ ಒಂದು ಸವಾಲಾಗಿದ್ದು, OpenAI ನಲ್ಲಿ ಪ್ರಮುಖ ಕೇಂದ್ರೀಕೃತ ವಿಷಯವಾಗಿದೆ. ನಾವು ವಿರೋಧಿಗಳು ಇಂತಹ ದಾಳಿಗಳನ್ನು ಮುಂದುವರಿಸಿ ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಾರೆ ಎಂದು ನಿರೀಕ್ಷಿಸುತ್ತಿದ್ದರೂ, ಯಾರಾದರೂ ಬಳಕೆದಾರರನ್ನು ತಪ್ಪುದಾರಿಗೆಳೆಯಲು ಸಕ್ರಿಯವಾಗಿ ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಬಳಕೆದಾರರ ಉದ್ದೇಶಿತ ಕಾರ್ಯವನ್ನು ನಿರ್ವಹಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಿದ ರಕ್ಷಣೆಯನ್ನು ನಾವು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇವೆ. AGI ಯ ಪ್ರಯೋಜನಗಳನ್ನು ಸುರಕ್ಷಿತವಾಗಿ ಸಾಕಾರಗೊಳಿಸಲು ಆ ಸಾಮರ್ಥ್ಯ ಅತ್ಯಗತ್ಯವಾಗಿದೆ.
ನಮ್ಮ ಬಳಕೆದಾರರನ್ನು ರಕ್ಷಿಸಲು ಮತ್ತು ಈ ದಾಳಿಗಳ ವಿರುದ್ಧ ನಮ್ಮ ಮಾಡೆಲ್ಗಳನ್ನು ಸುಧಾರಿಸಲು, ನಾವು ಬಹು-ಪದರದ ವಿಧಾನವನ್ನು ಅನುಸರಿಸುತ್ತೇವೆ, ಇದರಲ್ಲಿ ಕೆಳಗಿನವುಗಳು ಸೇರಿವೆ:
ನಮಗೆ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ಗಳನ್ನು ಗುರುತಿಸಿ, ಅವುಗಳಿಗೆ ಬಲಿಯಾಗದ AI ಬೇಕು. ಆದರೆ, ವಿರೋಧಾತ್ಮಕ ದಾಳಿಗಳ ವಿರುದ್ಧದ ದೃಢತೆ ಯಂತ್ರ ಕಲಿಕೆ ಮತ್ತು AIಗೆ ದೀರ್ಘಕಾಲೀನ ಸವಾಲಾಗಿದ್ದು, ಇದು ಕಠಿಣ ಮತ್ತು ಮುಕ್ತ ಸಮಸ್ಯೆಯಾಗಿದೆ. ನಾವು ವಿಶ್ವಾಸಾರ್ಹ ಮತ್ತು ಅವಿಶ್ವಾಸಾರ್ಹ ಸೂಚನೆಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಗುರುತಿಸುವ ಮಾಡೆಲ್ಗಳತ್ತ ಕೆಲಸ ಮಾಡಲು ಇನ್ಸ್ಟ್ರಕ್ಷನ್ ಹೈಯಾರ್ಕಿ ಎಂಬ ಸಂಶೋಧನೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ. ನಾವು ಮಾಡೆಲ್ಗಳನ್ನು ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಮಾದರಿಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಗುರುತಿಸಲು ತರಬೇತಿ ನೀಡಲು ಹೊಸ ವಿಧಾನಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಿದ್ದೇವೆ, ಇದರಿಂದ ಅವು ಅವನ್ನು ನಿರ್ಲಕ್ಷಿಸಬಹುದು ಅಥವಾ ಬಳಕೆದಾರರಿಗೆ ಸೂಚಿಸಬಹುದು. ನಾವು ಅನ್ವಯಿಸುವ ತಂತ್ರಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಸ್ವಯಂಚಾಲಿತ ರೆಡ್ ಟೀಮಿಂಗ್, ಇದು ವರ್ಷಗಳಿಂದ ನಾವು ಅಧ್ಯಯನ ಮಾಡುತ್ತಿರುವ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಕ್ಷೇತ್ರವಾಗಿದ್ದು, ಹೊಸ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ದಾಳಿಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು.
ನಾವು ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ದಾಳಿಗಳನ್ನು ಗುರುತಿಸಿ ತಡೆಯಲು ಅನೇಕ ಸ್ವಯಂಚಾಲಿತ AI-ಚಾಲಿತ ಮಾನಿಟರ್ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ. ಇವು ಸುರಕ್ಷತಾ ತರಬೇತಿ ವಿಧಾನಗಳನ್ನು ಪೂರೈಸುತ್ತವೆ, ಏಕೆಂದರೆ ನಾವು ಪತ್ತೆಹಚ್ಚುವ ಯಾವುದೇ ಹೊಸ ದಾಳಿಗಳನ್ನು ತಕ್ಷಣ ತಡೆಯಲು ಇವುಗಳನ್ನು ಶೀಘ್ರವಾಗಿ ನವೀಕರಿಸಬಹುದು. ಈ ಮಾನಿಟರ್ಗಳು ನಮ್ಮ ಬಳಕೆದಾರರ ವಿರುದ್ಧ ಸಂಭವಿಸಬಹುದಾದ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ದಾಳಿಗಳನ್ನು ಗುರುತಿಸಲು ಮಾತ್ರ ಸಹಾಯ ಮಾಡುವುದಿಲ್ಲ, ಆದರೆ ಆ ದಾಳಿಗಳು ವಾಸ್ತವ ಜಗತ್ತಿನಲ್ಲಿ ನಿಯೋಜಿಸಲ್ಪಡುವ ಮೊದಲು ನಮ್ಮ ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಬಳಸಿ ನಡೆಯುವ ವಿರೋಧಾತ್ಮಕ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಸಂಶೋಧನೆ ಮತ್ತು ಪರೀಕ್ಷೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಹ ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತವೆ.
ಬಳಕೆದಾರರ ಡೇಟಾವನ್ನು ರಕ್ಷಿಸಲು ಸಹಾಯ ಮಾಡಲು, ನಾವು ನಮ್ಮ ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಮೂಲಸೌಕರ್ಯವನ್ನು ವಿವಿಧ ಅತಿಕ್ರಮಿಸುವ ಭದ್ರತಾ ರಕ್ಷಣೆಗಳೊಂದಿಗೆ ವಿನ್ಯಾಸಗೊಳಿಸಿದ್ದೇವೆ. ಈ ವೈಶಿಷ್ಟ್ಯಗಳು, ಭವಿಷ್ಯದ ಪೋಸ್ಟ್ಗಳಲ್ಲಿ ನಾವು ಇನ್ನಷ್ಟು ತಾಂತ್ರಿಕ ವಿವರವಾಗಿ ಪರಿಶೀಲಿಸುವೆವು, ಪ್ರತಿ ಉತ್ಪನ್ನದ ಆಧಾರದ ಮೇಲೆ ಹೊಂದಿಸಲಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, ನಂಬಲಾಗದ ವೆಬ್ಸೈಟ್ಗಳನ್ನು ತಪ್ಪಿಸಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಲು, ನಾವು ChatGPT ನಲ್ಲಿ ಕೆಲವು ಲಿಂಕ್ಗಳನ್ನು, ವಿಶೇಷವಾಗಿ ನಮ್ಮನ್ನು ಅವುಗಳನ್ನು ಕ್ಯಾಟಲಾಗ್ ಮಾಡಬೇಡಿ ಎಂದು ಕೇಳುವ ವೆಬ್ಸೈಟ್ಗಳಲ್ಲಿ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), ಅವುಗಳಿಗೆ ಭೇಟಿ ನೀಡುವ ಮೊದಲು ನೀವು ಅನುಮೋದಿಸುವಂತೆ ಕೇಳುತ್ತೇವೆ. ನಮ್ಮ AI ಇತರ ಪ್ರೋಗ್ರಾಂಗಳು ಅಥವಾ ಕೋಡ್ ಅನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಲು ಸಾಧನಗಳನ್ನು ಬಳಸುವಾಗ (ಉದಾಹರಣೆಗೆ Canvas ಅಥವಾ ನಮ್ಮ ಅಭಿವೃದ್ಧಿ ಸಾಧನ Codex), ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ನಿಂದ ಉಂಟಾಗಬಹುದಾದ ಹಾನಿಕಾರಕ ಬದಲಾವಣೆಗಳನ್ನು ತಡೆಯಲು ನಾವು ಮಾಡೆಲ್ಗಾಗಿ ಸ್ಯಾಂಡ್ಬಾಕ್ಸಿಂಗ್ ಎಂಬ ತಂತ್ರವನ್ನು ಬಳಸುತ್ತೇವೆ.
ನಾವು ಬಳಕೆದಾರರು ತಮ್ಮನ್ನು ತಾವು ರಕ್ಷಿಸಿಕೊಳ್ಳಲು ಸಹಾಯವಾಗುವಂತೆ ನಮ್ಮ ಉತ್ಪನ್ನಗಳಲ್ಲಿ ಅಂತರ್ನಿರ್ಮಿತ ನಿಯಂತ್ರಣಗಳನ್ನು ಸೇರಿಸುತ್ತೇವೆ. ಉದಾಹರಣೆಗೆ, ChatGPT Atlas ನಲ್ಲಿ, ನೀವು ಲಾಗ್ಔಟ್ ಮೋಡ್ ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು, ಇದು ChatGPT ಏಜೆಂಟ್ಗೆ ವೆಬ್ಸೈಟ್ಗಳಿಗೆ ಲಾಗ್ ಇನ್ ಆಗದೆ ಕಾರ್ಯಗಳನ್ನು ಪ್ರಾರಂಭಿಸಲು ಅನುಮತಿಸುತ್ತದೆ. ChatGPT ಏಜೆಂಟ್ ಸೂಕ್ಷ್ಮ ಹಂತಗಳನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು, ಉದಾಹರಣೆಗೆ ಖರೀದಿ ಪೂರ್ಣಗೊಳಿಸುವುದು, ವಿರಾಮಗೊಳ್ಳುತ್ತದೆ ಮತ್ತು ದೃಢೀಕರಣವನ್ನು ಕೇಳುತ್ತದೆ. ಏಜೆಂಟ್ ಸೂಕ್ಷ್ಮ ಸೈಟ್ಗಳಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವಾಗ, ಸೈಟ್ನ ಸೂಕ್ಷ್ಮ ಸ್ವಭಾವದ ಬಗ್ಗೆ ನಿಮಗೆ ಎಚ್ಚರಿಸುವ ಮತ್ತು ಏಜೆಂಟ್ ತನ್ನ ಕೆಲಸವನ್ನು ಮಾಡುವುದನ್ನು ನೋಡಲು ನೀವು ಟ್ಯಾಬ್ ಅನ್ನು ಸಕ್ರಿಯವಾಗಿರಿಸಬೇಕೆಂದು ಅಗತ್ಯಪಡಿಸುವ “ವಾಚ್ ಮೋಡ್” ಅನ್ನು ಸಹ ನಾವು ಜಾರಿಗೆ ತಂದಿದ್ದೇವೆ. ನೀವು ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯಿರುವ ಟ್ಯಾಬ್ನಿಂದ ದೂರ ಸರಿದರೆ ಏಜೆಂಟ್ ತಾತ್ಕಾಲಿಕವಾಗಿ ನಿಲ್ಲುತ್ತದೆ. ಇದು ನೀವು ಏಜೆಂಟ್ ಯಾವ ಕ್ರಮಗಳನ್ನು ಕೈಗೊಳ್ಳುತ್ತಿದೆ ಎಂಬುದರ ಬಗ್ಗೆ ಸದಾ ತಿಳಿದಿರುವುದನ್ನು ಮತ್ತು ನಿಯಂತ್ರಣದಲ್ಲಿರುವುದನ್ನು ಖಚಿತಪಡಿಸುತ್ತದೆ.
ನಾವು ನಮ್ಮ ರಕ್ಷಣೆಯನ್ನು ಪರೀಕ್ಷಿಸಲು ಮತ್ತು ಸುಧಾರಿಸಲು, ದಾಳಿಕಾರರ ನಡವಳಿಕೆಯನ್ನು ಅನುಕರಿಸಲು ಮತ್ತು ನಮ್ಮ ಭದ್ರತೆಯನ್ನು ಸುಧಾರಿಸಲು ಹೊಸ ಮಾರ್ಗಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಆಂತರಿಕ ಮತ್ತು ಬಾಹ್ಯ ತಂಡಗಳೊಂದಿಗೆ ವ್ಯಾಪಕ ರೆಡ್ ಟೀಮಿಂಗ್ ನಡೆಸುತ್ತೇವೆ. ಇದರಲ್ಲಿ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಮೇಲೆ ವಿಶೇಷವಾಗಿ ಕೇಂದ್ರೀಕರಿಸಿದ ಸಾವಿರಾರು ಗಂಟೆಗಳ ಕೆಲಸ ಸೇರಿದೆ. ನಾವು ಹೊಸ ತಂತ್ರಗಳು ಮತ್ತು ದಾಳಿಗಳನ್ನು ಕಂಡುಹಿಡಿದಂತೆ, ನಮ್ಮ ತಂಡಗಳು ಭದ್ರತಾ ದುರ್ಬಲತೆಗಳನ್ನು ಪೂರ್ವಭಾವಿಯಾಗಿ ಪರಿಹರಿಸುತ್ತವೆ ಮತ್ತು ನಮ್ಮ ಮಾಡೆಲ್ ನಿಯಂತ್ರಣ ಕ್ರಮಗಳನ್ನು ಸುಧಾರಿಸುತ್ತವೆ.
ಹೊಸ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ತಂತ್ರಗಳು ಮತ್ತು ದಾಳಿಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ನಮಗೆ ಸಹಾಯ ಮಾಡುವಂತೆ ಸದುದ್ದೇಶದ ಸ್ವತಂತ್ರ ಭದ್ರತಾ ಸಂಶೋಧಕರನ್ನು ಉತ್ತೇಜಿಸಲು, ಅನಿರೀಕ್ಷಿತ ಬಳಕೆದಾರ ಡೇಟಾ ಬಹಿರಂಗಗೊಳ್ಳುವಿಕೆಗೆ ಕಾರಣವಾಗಬಹುದಾದ ವಾಸ್ತವಿಕ ದಾಳಿ ಮಾರ್ಗವನ್ನು ಅವರು ತೋರಿಸಿದಾಗ, ನಮ್ಮ ಬಗ್ ಬೌಂಟಿ ಪ್ರೋಗ್ರಾಂ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅಡಿಯಲ್ಲಿ ನಾವು ಹಣಕಾಸಿನ ಬಹುಮಾನಗಳನ್ನು ನೀಡುತ್ತೇವೆ. ನಾವು ಈ ಸಮಸ್ಯೆಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಮೇಲಕ್ಕೆ ತರುವಂತೆ ಬಾಹ್ಯ ಕೊಡುಗೆದಾರರಿಗೆ ಪ್ರೋತ್ಸಾಹಿಸುತ್ತೇವೆ, ಇದರಿಂದ ನಾವು ಅವುಗಳನ್ನು ಪರಿಹರಿಸಿ ನಮ್ಮ ರಕ್ಷಣೆಯನ್ನು ಇನ್ನಷ್ಟು ಬಲಪಡಿಸಬಹುದು.
ನಾವು ಉತ್ಪನ್ನದ ಕೆಲವು ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಉಂಟಾಗುವ ಅಪಾಯಗಳ ಬಗ್ಗೆ ಬಳಕೆದಾರರಿಗೆ ಶಿಕ್ಷಣ ನೀಡುತ್ತೇವೆ, ಇದರಿಂದ ಬಳಕೆದಾರರು ತಿಳಿದ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ChatGPT ಅನ್ನು ಇತರ ಆ್ಯಪ್ಗಳಿಗೆ ಸಂಪರ್ಕಿಸುವಾಗ, ನಾವು ಯಾವ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಬಹುದು, ಅದನ್ನು ಹೇಗೆ ಬಳಸಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಕದಿಯಲು ಪ್ರಯತ್ನಿಸುವ ಸೈಟ್ನಂತಹ ಅಪಾಯಗಳು ಏನೆಂದು ವಿವರಿಸುತ್ತೇವೆ. ಜೊತೆಗೆ, ಇನ್ನಷ್ಟು ಸುರಕ್ಷಿತವಾಗಿರಲು ಹೇಗೆ ಎಂಬುದನ್ನು ತಿಳಿಯಲು ಲಿಂಕ್ ಅನ್ನು ಒದಗಿಸುತ್ತೇವೆ. ನಾವು ಸಂಸ್ಥೆಗಳಿಗೆ ಅವರ ವರ್ಕ್ಸ್ಪೇಸ್ಗಳಲ್ಲಿ ಬಳಕೆದಾರರು ಯಾವ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಬಹುದು ಅಥವಾ ಬಳಸಬಹುದು ಎಂಬುದರ ಮೇಲೆ ನಿಯಂತ್ರಣವನ್ನು ನೀಡುತ್ತೇವೆ.
ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಒಂದು ಅತ್ಯಾಧುನಿಕ ಭದ್ರತಾ ಸವಾಲು ಆಗಿದ್ದು, ಇದು ಕಾಲಕ್ರಮೇಣ ವಿಕಸನಗೊಳ್ಳುತ್ತದೆ ಎಂದು ನಾವು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ. ಬುದ್ಧಿಮತ್ತೆ ಮತ್ತು ಸಾಮರ್ಥ್ಯದ ಹೊಸ ಮಟ್ಟಗಳಿಗೆ ತಂತ್ರಜ್ಞಾನ, ಸಮಾಜ ಮತ್ತು ಅಪಾಯ ನಿರ್ವಹಣಾ ತಂತ್ರಗಳು ಸಹವಿಕಸನಗೊಳ್ಳಬೇಕಾಗುತ್ತದೆ. 2000ರ ದಶಕದ ಆರಂಭದಲ್ಲಿ ಕಂಪ್ಯೂಟರ್ ವೈರಸ್ಗಳಂತೆ, ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ಗಳ ಅಪಾಯವನ್ನು ಮತ್ತು ಅದನ್ನು ಹೇಗೆ ನಿಭಾಯಿಸಬೇಕೆಂಬುದನ್ನು ಪ್ರತಿಯೊಬ್ಬರೂ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮುಖ್ಯ. ಇದರಿಂದ ನಾವು ಈ ತಂತ್ರಜ್ಞಾನದಿಂದ ಸುರಕ್ಷಿತವಾಗಿ ಲಾಭ ಪಡೆಯಲು ಕಲಿಯಬಹುದು. AI ಮತ್ತು ನಿಮ್ಮ ಪರವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದಾದ ಏಜೆಂಟ್ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಬಳಸುವಾಗ ಎಚ್ಚರಿಕೆಯಿಂದ ಮತ್ತು ಜಾಗರೂಕರಾಗಿರುವುದು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಹೆಚ್ಚು ಸುರಕ್ಷಿತವಾಗಿರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಸಾಧ್ಯವಾದಲ್ಲಿ, ಏಜೆಂಟ್ನ ಪ್ರವೇಶವನ್ನು ಕಾರ್ಯವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಅಗತ್ಯವಿರುವ ಸೂಕ್ಷ್ಮ ಡೇಟಾ ಅಥವಾ ಕ್ರೆಡೆನ್ಶಿಯಲ್ಗಳಿಗೆ ಮಾತ್ರ ಸೀಮಿತಗೊಳಿಸಿ. ಉದಾಹರಣೆಗೆ, ChatGPT Atlas ನಲ್ಲಿ ರಜೆ ಸಂಶೋಧನೆ ಮಾಡಲು ಏಜೆಂಟ್ ಮೋಡ್ ಬಳಸುವಾಗ, ಏಜೆಂಟ್ ಕೇವಲ ಸಂಶೋಧನೆ ಮಾಡುತ್ತಿದ್ದರೆ ಮತ್ತು ಲಾಗ್ ಇನ್ ಪ್ರವೇಶ ಅಗತ್ಯವಿಲ್ಲದಿದ್ದರೆ, “ಲಾಗ್ ಔಟ್” ಮೋಡ್ ಬಳಸಿ.
ನಾವು ಏಜೆಂಟ್ಗಳನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸುವಾಗ, ಖರೀದಿ ಪೂರ್ಣಗೊಳಿಸುವುದು ಅಥವಾ ಇಮೇಲ್ ಕಳುಹಿಸುವಂತಹ ಪ್ರಮುಖ ಕ್ರಮಗಳನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು ನಿಮ್ಮಿಂದ ಅಂತಿಮ ದೃಢೀಕರಣವನ್ನು ಪಡೆಯಲು ಆಗಾಗ್ಗೆ ಗಮನಿಸುತ್ತೇವೆ. ಏಜೆಂಟ್ ನಿಮ್ಮಿಂದ ಕ್ರಮವನ್ನು ದೃಢೀಕರಿಸಲು ಕೇಳಿದಾಗ, ಕ್ರಮವು ಸರಿಯಾಗಿದೆಯೇ ಮತ್ತು ಹಂಚಿಕೊಳ್ಳಲಾಗುತ್ತಿರುವ ಮಾಹಿತಿ ಆ ಸಂದರ್ಭಕ್ಕೆ ಸೂಕ್ತವಾಗಿದೆಯೇ ಎಂದು ಎಚ್ಚರಿಕೆಯಿಂದ ಪರಿಶೀಲಿಸಿ.
ಏಜೆಂಟ್ ನಿಮ್ಮ ಬ್ಯಾಂಕ್ನಂತಹ ಸೂಕ್ಷ್ಮ ಸ್ಥಳದಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿರುವಾಗ, ಏಜೆಂಟ್ ತನ್ನ ಕೆಲಸವನ್ನು ಹೇಗೆ ಮಾಡುತ್ತಿದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ. ಇದು ನಿಮ್ಮ ಕೈಗಳನ್ನು ಸ್ಟೀರಿಂಗ್ ಚಕ್ರದ ಮೇಲೆ ಇಟ್ಟುಕೊಂಡು ಸ್ವಯಂ-ಚಾಲಿತ ಕಾರನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದಕ್ಕೆ ಹೋಲುತ್ತದೆ.
ಏಜೆಂಟ್ಗೆ "ನನ್ನ ಇಮೇಲ್ಗಳನ್ನು ಪರಿಶೀಲಿಸಿ ಮತ್ತು ಅಗತ್ಯವಿರುವ ಯಾವುದೇ ಕ್ರಮ ಕೈಗೊಳ್ಳಿ" ಎಂಬಂತಹ ವಿಸ್ತೃತ ಸೂಚನೆಯನ್ನು ನೀಡುವುದು, ಸಂವೇದನಾಶೀಲ ಕ್ರಮಗಳನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು ನಿಮ್ಮೊಂದಿಗೆ ಪರಿಶೀಲಿಸುವಂತೆ ವಿನ್ಯಾಸಗೊಳಿಸಿದ್ದರೂ, ಮರೆಮಾಡಿದ ದುರುದ್ದೇಶಪೂರಿತ ವಿಷಯವು ಮಾಡೆಲ್ ಅನ್ನು ತಪ್ಪು ದಾರಿಗೆ ಎಳೆಯಲು ಸುಲಭವಾಗಬಹುದು.
ನಿಮ್ಮ ಏಜೆಂಟ್ಗೆ ನಿರ್ದಿಷ್ಟ ಕಾರ್ಯಗಳನ್ನು ಮಾಡಲು ಕೇಳುವುದು ಹೆಚ್ಚು ಸುರಕ್ಷಿತವಾಗಿದೆ ಮತ್ತು ಇಮೇಲ್ಗಳಂತಹ ಬೇರೆ ಮೂಲಗಳಿಂದ ಬರುವ ಹಾನಿಕಾರಕ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಲು ಅದಕ್ಕೆ ವ್ಯಾಪಕ ಸ್ವಾತಂತ್ರ್ಯವನ್ನು ನೀಡಬಾರದು. ಇದು ದಾಳಿಗಳು ನಡೆಯುವುದಿಲ್ಲ ಎಂದು ಖಾತರಿಪಡಿಸುವುದಿಲ್ಲ, ಆದರೆ ದಾಳಿಕೋರರು ಯಶಸ್ವಿಯಾಗಲು ಕಷ್ಟವಾಗುತ್ತದೆ.
AI ತಂತ್ರಜ್ಞಾನ ವಿಕಸನಗೊಳ್ಳುತ್ತಿದ್ದಂತೆ, ಹೊಸ ಅಪಾಯಗಳು ಮತ್ತು ರಕ್ಷಣೆಗಳ ಕ್ರಮಗಳು ಹೊರಹೊಮ್ಮುತ್ತವೆ. ಉತ್ತಮ ಅಭ್ಯಾಸಗಳನ್ನು ತಿಳಿಯಲು OpenAI ಮತ್ತು ಇತರ ವಿಶ್ವಾಸಾರ್ಹ ಮೂಲಗಳಿಂದ ನವೀಕರಣಗಳನ್ನು ಅನುಸರಿಸಿ.
ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ಅತ್ಯಾಧುನಿಕ, ಸವಾಲಿನ ಸಂಶೋಧನಾ ಸಮಸ್ಯೆಯಾಗಿ ಉಳಿದಿದೆ, ಮತ್ತು ವೆಬ್ನಲ್ಲಿನ ಪರಂಪರೆಯ ವಂಚನೆಗಳಂತೆ, ನಮ್ಮ ಕೆಲಸವು ಮುಂದುವರಿಯುತ್ತದೆ ಎಂದು ನಾವು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ. ಈ ತಂತ್ರವನ್ನು ದಾಳಿಕೋರರು ಇನ್ನೂ ಗಮನಾರ್ಹವಾಗಿ ಅಳವಡಿಸಿಕೊಂಡಿಲ್ಲ, ಆದರೆ AIs ಈ ದಾಳಿಗಳಿಗೆ ಬಲಿಯಾಗುವಂತೆ ಮಾಡುವ ಮಾರ್ಗಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ವಿರೋಧಿಗಳು ಗಮನಾರ್ಹ ಸಮಯ ಮತ್ತು ಸಂಪನ್ಮೂಲಗಳನ್ನು ಖರ್ಚುಮಾಡುತ್ತಾರೆ ಎಂದು ನಾವು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ. ನಮ್ಮ ಉತ್ಪನ್ನಗಳನ್ನು ಸುರಕ್ಷಿತವಾಗಿಸಲು ಮತ್ತು ಈ ಅಪಾಯದ ವಿರುದ್ಧ AI ಯ ದೃಢತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಸಂಶೋಧನೆಯಲ್ಲಿ ನಾವು ಭಾರೀ ಹೂಡಿಕೆ ಮಾಡುತ್ತೇವೆ. ನಾವು ಹೆಚ್ಚು ತಿಳಿದಂತೆ, ಈ ಕ್ಷೇತ್ರದಲ್ಲಿ ನಮ್ಮ ಭದ್ರತಾ ಕೆಲಸದಲ್ಲಿ ನಡೆಯುತ್ತಿರುವ ಪ್ರಗತಿಯನ್ನು ಒಳಗೊಂಡಂತೆ, ನವೀಕರಣಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತೇವೆ. ಉದಾಹರಣೆಗೆ, ನಿಮ್ಮ AI ಯ ಇಂಟರ್ನೆಟ್ನೊಂದಿಗೆ ಸಂವಹನವು ನಿಮ್ಮ ಸಂಭಾಷಣೆಯಿಂದ ಮಾಹಿತಿಯನ್ನು ಪ್ರಸಾರ ಮಾಡುತ್ತದೆಯೇ ಎಂಬುದನ್ನು ನಾವು ಹೇಗೆ ಪತ್ತೆಹಚ್ಚುತ್ತೇವೆ ಎಂಬುದರ ಕುರಿತು ಹೆಚ್ಚಿನ ವಿವರಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳುವ, ನಾವು ಶೀಘ್ರದಲ್ಲೇ ಪ್ರಕಟಿಸುವ ಒಂದು ವರದಿಯನ್ನು ನಾವು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇವೆ.
ನಮ್ಮ ಗುರಿಯು ಈ ವ್ಯವಸ್ಥೆಗಳನ್ನು ನಿಮ್ಮ ಅತ್ಯಂತ ವಿಶ್ವಾಸಾರ್ಹ ಮತ್ತು ಭದ್ರತಾ ಜ್ಞಾನಿ ಸಹೋದ್ಯೋಗಿ ಅಥವಾ ಸ್ನೇಹಿತನೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವಷ್ಟು ವಿಶ್ವಾಸಾರ್ಹ ಮತ್ತು ಸುರಕ್ಷಿತವಾಗಿರಿಸುವುದು. ನಾವು ನೈಜ ಜಗತ್ತಿನ ಬಳಕೆಯಿಂದ ಕಲಿಯುತ್ತಾ, ಸುರಕ್ಷಿತವಾಗಿ ಪುನರಾವರ್ತನೆಗಳನ್ನು ಮಾಡುತ್ತಾ, ತಂತ್ರಜ್ಞಾನ ಮುಂದುವರಿದಂತೆ ನಾವು ಕಲಿತದ್ದನ್ನು ಪ್ರಕಟಿಸುತ್ತಿರುತ್ತೇವೆ.


