ಫೆಬ್ರವರಿ 18, 2026

EVMbench ಅನ್ನು ಪರಿಚಯಿಸಲಾಗುತ್ತಿದೆ

AI ಏಜೆಂಟ್‌ಗಳ ಸಾಮರ್ಥ್ಯವನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ ಮೂಲಕ ಬ್ಲಾಕ್‌ಚೈನ್ ಪರಿಸರಗಳಲ್ಲಿ ದುರ್ಬಲತೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಿ, ಪ್ಯಾಚ್ ಮಾಡಿ ಶೋಷಿಸುವ ಮೂಲಕ ಸ್ಮಾರ್ಟ್ ಕಾನ್‌ಟ್ರ್ಯಾಕ್ಟ್‌ಗಳನ್ನು ಇನ್ನಷ್ಟು ಸುರಕ್ಷಿತಗೊಳಿಸುವುದು.

ಪತ್ರಿಕೆಯನ್ನು ಓದಿ

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

ಸ್ಮಾರ್ಟ್ ಕಾನ್‌ಟ್ರಾಕ್ಟ್‌ಗಳು ನಿಯಮಿತವಾಗಿ ಓಪನ್-ಸೋರ್ಸ್ ಕ್ರಿಪ್ಟೋ ಆಸ್ತಿಗಳಲ್ಲಿ $100 ಬಿಲಿಯನ್‌ಗಿಂತ ಹೆಚ್ಚು ಮೊತ್ತವನ್ನು ಸುರಕ್ಷಿತಗೊಳಿಸುತ್ತವೆ. AI ಏಜೆಂಟ್‌ಗಳು ಓದಲು, ಬರೆಯಲು ಮತ್ತು ಕೋಡ್ ಕಾರ್ಯಗತಗೊಳಿಸಲು ಸುಧಾರಿಸುತ್ತಿರುವಂತೆ, ಆರ್ಥಿಕವಾಗಿ ಅರ್ಥಪೂರ್ಣ ಪರಿಸರಗಳಲ್ಲಿ ಅವುಗಳ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಅಳೆಯುವುದು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗುತ್ತದೆ. ನಿಯೋಜಿತ ಒಪ್ಪಂದಗಳನ್ನು ಆಡಿಟ್ ಮಾಡಲು ಮತ್ತು ಬಲಪಡಿಸಲು AI ವ್ಯವಸ್ಥೆಗಳನ್ನು ರಕ್ಷಣಾತ್ಮಕವಾಗಿ ಬಳಸುವುದನ್ನು ಉತ್ತೇಜಿಸುವುದು ಅಗತ್ಯವಾಗಿದೆ.

Paradigm⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಜೊತೆಗೆ, ನಾವು EVMbench ಅನ್ನು ಪರಿಚಯಿಸುತ್ತಿದ್ದೇವೆ, ಇದು AI ಏಜೆಂಟ್‌ಗಳು ಉನ್ನತ-ತೀವ್ರತೆಯ ಸ್ಮಾರ್ಟ್ ಒಪ್ಪಂದ ದುರ್ಬಲತೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು, ಪ್ಯಾಚ್ ಮಾಡಲು ಮತ್ತು ಶೋಷಿಸಲು ಹೊಂದಿರುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ ಮಾನದಂಡ. EVMbench 40 ಆಡಿಟ್‌ಗಳಿಂದ ಆಯ್ಕೆ ಮಾಡಲಾದ 117 ಕ್ಯೂರೆಟ್‌ ಮಾಡಿದ ದುರ್ಬಲತೆಗಳನ್ನು ಆಧರಿಸಿದೆ, ಅವುಗಳಲ್ಲಿ ಹೆಚ್ಚಿನವು ಓಪನ್ ಕೋಡ್ ಆಡಿಟ್ ಸ್ಪರ್ಧೆಗಳಿಂದ ಬಂದಿವೆ. EVMbench ಹೆಚ್ಚುವರಿಯಾಗಿ, ಸ್ಟೇಬಲ್‌ಕಾಯಿನ್‌ಗಳ ಮೂಲಕ ಹೆಚ್ಚಿನ ಥ್ರೂಪುಟ್ ಮತ್ತು ಕಡಿಮೆ ವೆಚ್ಚದ ಪಾವತಿಗಳನ್ನು ಸಾಧ್ಯವಾಗಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಉದ್ದೇಶಪೂರ್ವಕ L1 ಆಗಿರುವ Tempo⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಬ್ಲಾಕ್‌ಚೇನ್‌ನ ಭದ್ರತಾ ಪರಿಶೀಲನಾ ಪ್ರಕ್ರಿಯೆಯಿಂದ ತೆಗೆದುಕೊಳ್ಳಲಾದ ಹಲವು ದುರ್ಬಲತಾ ಸನ್ನಿವೇಶಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಸನ್ನಿವೇಶಗಳು ಪಾವತಿ-ಕೇಂದ್ರೀತ ಸ್ಮಾರ್ಟ್ ಕಾನ್‌ಟ್ರ್ಯಾಕ್ಟ್ ಕೋಡ್‌ಗೆ ಬೆಂಚ್‌ಮಾರ್ಕ್ ಅನ್ನು ವಿಸ್ತರಿಸುತ್ತವೆ, ಅಲ್ಲಿ ನಾವು ಏಜೆಂಟಿಕ್ ಸ್ಟೇಬಲ್‌ಕಾಯಿನ್ ಪಾವತಿಗಳು ಬೆಳೆಯುತ್ತವೆ ಎಂದು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ ಮತ್ತು ಇದು ಉದಯೋನ್ಮುಖ ಪ್ರಾಯೋಗಿಕ ಮಹತ್ವದ ಕ್ಷೇತ್ರದಲ್ಲಿ ನೆಲೆಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ನಮ್ಮ ಕಾರ್ಯ ಪರಿಸರಗಳನ್ನು ರಚಿಸಲು, ಲಭ್ಯವಿದ್ದಾಗ ನಾವು ಅಸ್ತಿತ್ವದಲ್ಲಿದ್ದ ಪೂರಕ ತತ್ವದ ಎಕ್ಸ್‌ಪ್ಲಾಯಿಟ್ ಪರೀಕ್ಷೆಗಳು ಮತ್ತು ನಿಯೋಜನೆ ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳನ್ನು ಹೊಂದಾಣಿಕೆ ಮಾಡಿದ್ದೇವೆ, ಇಲ್ಲದಿದ್ದರೆ ಅವನ್ನು ಕೈಯಾರೆ ಬರೆದಿದ್ದೇವೆ. ಪ್ಯಾಚ್ ಮೋಡ್‌ನಲ್ಲಿ, ನಾವು ದುರ್ಬಲತೆಗಳನ್ನು ಶೋಷಿಸಬಹುದಾದವುಗಳಾಗಿಯೇ ಉಳಿಸಿಕೊಂಡಿದ್ದೇವೆ ಮತ್ತು ಕಂಪೈಲೇಶನ್-ಭಂಗಗೊಳಿಸುವ ಬದಲಾವಣೆಗಳನ್ನು ಪರಿಚಯಿಸದೆ ಅವುಗಳನ್ನು ತಗ್ಗಿಸಬಹುದು ಎಂಬುದನ್ನು ಖಚಿತಪಡಿಸಿದ್ದೇವೆ, ಏಕೆಂದರೆ ಅವು ನಮ್ಮ ಸೆಟಪ್‌ಗೆ ಧಕ್ಕೆ ತರುತ್ತವೆ. ಎಕ್ಸ್‌ಪ್ಲಾಯಿಟ್ ಮೋಡ್‌ಗಾಗಿ, ನಾವು ಕಸ್ಟಮ್ ಗ್ರೇಡರ್‌ಗಳನ್ನು ಬರೆದು, ಏಜೆಂಟ್ ಗ್ರೇಡರ್ ಅನ್ನು ಮೋಸಗೊಳಿಸಬಹುದಾದ ವಿಧಾನಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಿ ಪ್ಯಾಚ್ ಮಾಡಲು ಪರಿಸರಗಳನ್ನು ರೆಡ್-ಟೀಮ್ ಮಾಡಿದೆವು. Paradigm ಒದಗಿಸಿದ ಡೊಮೇನ್ ಪರಿಣತಿಯ ಮೂಲಕ ಕಾರ್ಯ ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣದ ಜೊತೆಗೆ, ನಮ್ಮ ಪರಿಸರಗಳ ದೃಢತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಸಹಾಯವಾಗುವಂತೆ ನಾವು ಸ್ವಯಂಚಾಲಿತ ಕಾರ್ಯ ಪರಿಶೀಲನಾ ಏಜೆಂಟ್‌ಗಳನ್ನು ಬಳಸಿದ್ದೇವೆ.

EVMbench ಮೂರು ಸಾಮರ್ಥ್ಯ ಮೋಡ್‌ಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತದೆ:

ಡಿಟೆಕ್ಟ್: ಏಜೆಂಟ್‌ಗಳು ಸ್ಮಾರ್ಟ್ ಕಾನ್‌ಟ್ರಾಕ್ಟ್ ರಿಪೊಸಿಟರಿಯನ್ನು ಪರಿಶೀಲಿಸುತ್ತಾರೆ ಮತ್ತು ಗ್ರೌಂಡ್-ಟ್ರೂತ್ ದುರ್ಬಲತೆಗಳನ್ನು ಗುರುತಿಸುವ ಸಾಮರ್ಥ್ಯದ ಆಧಾರದ ಮೇಲೆ ಮತ್ತು ಸಂಬಂಧಿತ ಆಡಿಟ್ ಬಹುಮಾನಗಳಿಗಾಗಿ ಅಂಕಗಳನ್ನು ಪಡೆಯುತ್ತಾರೆ.
ಪ್ಯಾಚ್: ಏಜೆಂಟ್‌ಗಳು ದುರ್ಬಲ ಒಪ್ಪಂದಗಳನ್ನು ತಿದ್ದುಪಡಿ ಮಾಡುತ್ತವೆ ಮತ್ತು ಶೋಷಣೀಯತೆಯನ್ನು ನಿವಾರಿಸುವಾಗ ಉದ್ದೇಶಿತ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಕಾಪಾಡಬೇಕು. ಇದನ್ನು ಸ್ವಯಂಚಾಲಿತ ಪರೀಕ್ಷೆಗಳು ಮತ್ತು ಶೋಷಣೆ ಪರಿಶೀಲನೆಗಳ ಮೂಲಕ ದೃಢೀಕರಿಸಲಾಗುತ್ತದೆ.
ಎಕ್ಸ್‌ಪ್ಲಾಯಿಟ್: ಏಜೆಂಟ್‌ಗಳು ಸ್ಯಾಂಡ್‌ಬಾಕ್ಸ್ ಮಾಡಿದ ಬ್ಲಾಕ್‌ಚೈನ್ ಪರಿಸರದಲ್ಲಿ ನಿಯೋಜಿತ ಕಾನ್‌ಟ್ರ್ಯಾಕ್ಟ್‌ಗಳ ವಿರುದ್ಧ ಎಂಡ್-ಟು-ಎಂಡ್ ನಿಧಿ-ಖಾಲಿ ದಾಳಿಗಳನ್ನು ನಡೆಸುತ್ತವೆ. ಗ್ರೇಡಿಂಗ್ ಅನ್ನು ಟ್ರಾನ್ಸ್ಯಾಕ್ಷನ್ ರಿಪ್ಲೇ ಮತ್ತು ಆನ್-ಚೈನ್ ಪರಿಶೀಲನೆಯ ಮೂಲಕ ಪ್ರೋಗ್ರಾಮ್ಯಾಟಿಕ್ ಆಗಿ ಮಾಡಲಾಗುತ್ತದೆ.

ವಸ್ತುನಿಷ್ಠ ಮತ್ತು ಪುನರುತ್ಪಾದಿಸಬಹುದಾದ ಮೌಲ್ಯಮಾಪನಕ್ಕೆ ಬೆಂಬಲ ನೀಡಲು, ನಾವು ಒಪ್ಪಂದಗಳನ್ನು ನಿಯೋಜಿಸುವ, ಏಜೆಂಟ್ ವ್ಯವಹಾರಗಳನ್ನು ನಿರ್ಧಿಷ್ಟವಾಗಿ ಮರುಪ್ಲೇ ಮಾಡುವ, ಮತ್ತು ಅಸುರಕ್ಷಿತ RPC ವಿಧಾನಗಳನ್ನು ನಿರ್ಬಂಧಿಸುವ ರಸ್ಟ್ ಆಧಾರಿತ ಹಾರ್ನೆಸ್ ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ. ಶೋಷಣಾ ಕಾರ್ಯಗಳು ಲೈವ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳ ಬದಲು ಐಸೋಲೇಟೆಡ್ ಸ್ಥಳೀಯ Anvil ಪರಿಸರದಲ್ಲಿ ನಡೆಯುತ್ತವೆ ಮತ್ತು ದುರ್ಬಲತೆಗಳು ಐತಿಹಾಸಿಕವಾಗಿದ್ದು ಸಾರ್ವಜನಿಕವಾಗಿ ದಾಖಲಾಗಿವೆ.

ನಾವು ಮೂರೂ ಮೋಡ್‌ಗಳಲ್ಲಿ ಅತ್ಯಾಧುನಿಕ ಏಜೆಂಟ್‌ಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತೇವೆ. ‘ಶೋಷಣೆ' ಮೋಡ್‌ನಲ್ಲಿ, GPT‑5.3‑Codex Codex CLI ಮೂಲಕ ಕಾರ್ಯಗತಗೊಳಿಸಿದಾಗ 71.0% ಅಂಕವನ್ನು ಪಡೆಯುತ್ತದೆ. ಇದು GPT‑5 ಮುಂತಾದ ಹಿಂದಿನ ಮಾಡೆಲ್‌ಗಳಿಗಿಂತ ಗಮನಾರ್ಹವಾದ ಮುನ್ನಡೆಯಾಗಿದೆ, GPT‑5 33.3% ಅಂಕಗಳನ್ನು ಗಳಿಸಿದ್ದು, ಕೇವಲ ಆರು ತಿಂಗಳಿಗಿಂತ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಹಿಂದೆ ಬಿಡುಗಡೆ ಮಾಡಲಾಗಿದೆ. ದೊಡ್ಡ ಪ್ರಮಾಣದ ದುರ್ಬಲತೆಗಳನ್ನು ಏಜೆಂಟ್‌ಗಳು ಕಂಡುಹಿಡಿದು ಸರಿಪಡಿಸುವುದು ಇನ್ನೂ ಕಷ್ಟವಾಗಿರುವುದರಿಂದ, ಪತ್ತೆಹಚ್ಚುವಿಕೆ, ರಿಕಾಲ್ ಮತ್ತು ಪ್ಯಾಚ್ ಯಶಸ್ಸಿನ ದರಗಳು ಸಂಪೂರ್ಣ ವ್ಯಾಪ್ತಿಗಿಂತ ಕೆಳಗೇ ಉಳಿದಿವೆ.

EVMbench ಟಾಸ್ಕ್‌ಗಳಾದ್ಯಂತ ಮಾಡೆಲ್ ನಡವಳಿಕೆಯಲ್ಲಿ ಆಸಕ್ತಿದಾಯಕ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ. ಏಜೆಂಟ್‌ಗಳು ಶೋಷಣಾ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿ ಅತ್ಯುತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ, ಅಲ್ಲಿ ಉದ್ದೇಶ ಸ್ಪಷ್ಟವಾಗಿದೆ: ನಿಧಿಗಳು ಖಾಲಿಯಾಗುವವರೆಗೆ ಪುನರಾವರ್ತನೆಯನ್ನು ಮುಂದುವರಿಸಿ. ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯೊಂದಿಗೆ, ಡಿಟೆಕ್ಟ್ ಮತ್ತು ಪ್ಯಾಚ್ ಕಾರ್ಯಗಳಲ್ಲಿ ಕಾರ್ಯಕ್ಷಮತೆ ಕಡಿಮೆ. ‘ಡಿಟೆಕ್ಟ್’ ನಲ್ಲಿ, ಏಜೆಂಟ್‌ಗಳು ಕೆಲವೊಮ್ಮೆ ಕೋಡ್‌ಬೇಸ್ ಅನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಪರಿಶೀಲಿಸುವ ಬದಲು, ಒಂದೇ ಸಮಸ್ಯೆಯನ್ನು ಗುರುತಿಸಿದ ನಂತರ ನಿಲ್ಲುತ್ತಾರೆ. ‘ಪ್ಯಾಚ್’ನಲ್ಲಿ, ಸೂಕ್ಷ್ಮ ದುರ್ಬಲತೆಗಳನ್ನು ತೆಗೆದುಹಾಕುವಾಗ ಸಂಪೂರ್ಣ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಕಾಪಾಡುವುದು ಸವಾಲಾಗಿಯೇ ಉಳಿದಿದೆ.

ಮಿತಿಗಳು

EVMbench ನೈಜ-ಜಗತ್ತಿನ ಸ್ಮಾರ್ಟ್ ಕಾನ್‌ಟ್ರ್ಯಾಕ್ಟ್ ಭದ್ರತೆಯ ಸಂಪೂರ್ಣ ಕಠಿಣತೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುವುದಿಲ್ಲ. ಒಳಗೊಂಡಿದ್ದ ದುರ್ಬಲತೆಗಳನ್ನು Code4rena ಆಡಿಟಿಂಗ್ ಸ್ಪರ್ಧೆಗಳಿಂದ ತೆಗೆದುಕೊಳ್ಳಲಾಗಿದೆ. ಇವು ವಾಸ್ತವಿಕವಾಗಿದ್ದು ಮತ್ತು ಹೆಚ್ಚಿನ ತೀವ್ರತೆಯದ್ದಾಗಿದ್ದರೂ, ಬಹಳವಾಗಿ ನಿಯೋಜಿಸಲ್ಪಟ್ಟ ಮತ್ತು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ಅನೇಕ ಕ್ರಿಪ್ಟೋ ಒಪ್ಪಂದಗಳು ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚು ಪರಿಶೀಲನೆಗೆ ಒಳಗಾಗುತ್ತವೆ ಮತ್ತು ಅವುಗಳನ್ನು ದುರುಪಯೋಗಪಡಿಸಿಕೊಳ್ಳುವುದು ಹೆಚ್ಚು ಕಷ್ಟವಾಗಬಹುದು.

ನಮ್ಮ ಶ್ರೇಣೀಕರಣ ವ್ಯವಸ್ಥೆ ದೃಢವಾಗಿದೆ ಆದರೆ ಸಂಪೂರ್ಣವಲ್ಲ. ‘ಡಿಟೆಕ್ಟ್’ ಮೋಡ್‌ನಲ್ಲಿ, ನಾವು ಏಜೆಂಟ್ ಮಾನವ ಆಡಿಟರ್‌ಗಳು ಗುರುತಿಸಿದ ಅದೇ ದುರ್ಬಲತೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತವೆಯೇ ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸುತ್ತೇವೆ. ಏಜೆಂಟ್ ಹೆಚ್ಚುವರಿ ಸಮಸ್ಯೆಗಳನ್ನು ಗುರುತಿಸಿದರೆ, ಅವು ಮಾನವರು ಗಮನಿಸದೆ ಬಿಟ್ಟ ನಿಜವಾದ ದುರ್ಬಲತೆಗಳಾಗಿದೆಯೋ ಅಥವಾ ತಪ್ಪು ಸಕಾರಾತ್ಮಕಗಳಾಗಿದೆಯೋ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು ನಮ್ಮ ಬಳಿ ಪ್ರಸ್ತುತ ವಿಶ್ವಾಸಾರ್ಹ ವಿಧಾನವಿಲ್ಲ.

‘ಶೋಷಣೆ’ ಸೆಟ್ಟಿಂಗ್‌ನಲ್ಲಿಯೂ ರಚನಾತ್ಮಕ ಮಿತಿಗಳು ಇವೆ. ಗ್ರೇಡಿಂಗ್ ಕಂಟೇನರ್‌ನಲ್ಲಿ ವ್ಯವಹಾರಗಳನ್ನು ಕ್ರಮವಾಗಿ ಮರುಪ್ಲೇ ಮಾಡಲಾಗುತ್ತದೆ, ಆದ್ದರಿಂದ ನಿಖರವಾದ ಟೈಮಿಂಗ್ ಮೆಕ್ಯಾನಿಕ್ಸ್ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುವ ವರ್ತನೆಗಳು ವ್ಯಾಪ್ತಿಗೆ ಒಳಪಡುವುದಿಲ್ಲ. ಚೈನ್ ಸ್ಥಿತಿ ಒಂದು ಸ್ವಚ್ಛ ಸ್ಥಳೀಯ Anvil ಇನ್‌ಸ್ಟಾನ್ಸ್ ಆಗಿದ್ದು, ಇದು ಮುಖ್ಯ ಜಾಲದ ಫೋರ್ಕ್ ಅಲ್ಲ ಮತ್ತು ನಾವು ಪ್ರಸ್ತುತ ಏಕ-ಚೈನ್ ಪರಿಸರಗಳನ್ನು ಮಾತ್ರ ಬೆಂಬಲಿಸುತ್ತೇವೆ. ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಇದಕ್ಕೆ ಮುಖ್ಯ ಜಾಲ ನಿಯೋಜನೆಗಳ ಬದಲು ಅಣಕು ಒಪ್ಪಂದಗಳು ಅಗತ್ಯವಿರುತ್ತವೆ.

ಇದು ಏಕೆ ಮುಖ್ಯವಾಗಿದೆ

ಸ್ಮಾರ್ಟ್ ಕಾನ್‌ಟ್ರ್ಯಾಕ್ಟ್‌ಗಳು ಬಿಲಿಯನ್‌ಗಳಷ್ಟು ಡಾಲರ್ ಮೌಲ್ಯದ ಆಸ್ತಿಗಳನ್ನು ಸುರಕ್ಷಿತಗೊಳಿಸುತ್ತವೆ ಮತ್ತು AI ಏಜೆಂಟ್‌ಗಳು ದಾಳಿಕೋರರು ಮತ್ತು ರಕ್ಷಕರಿಗೆ ಪರಿವರ್ತನಾತ್ಮಕವಾಗಬಹುದು. ಈ ಕ್ಷೇತ್ರದಲ್ಲಿ ಮಾಡೆಲ್ ಸಾಮರ್ಥ್ಯವನ್ನು ಅಳೆಯುವುದು ಹೊರಹೊಮ್ಮುತ್ತಿರುವ ಸೈಬರ್ ಅಪಾಯಗಳನ್ನು ಹಿಂಬಾಲಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ ಮತ್ತು ನಿಯೋಜಿತ ಒಪ್ಪಂದಗಳನ್ನು ಆಡಿಟ್ ಮಾಡಿ ಬಲಪಡಿಸಲು AI ವ್ಯವಸ್ಥೆಗಳನ್ನು ರಕ್ಷಣಾತ್ಮಕವಾಗಿ ಬಳಸುವ ಮಹತ್ವವನ್ನು ಒತ್ತಿ ತೋರಿಸುತ್ತದೆ.

EVMbench ಅನ್ನು ಮಾಪನ ಸಾಧನವಾಗಿಯೂ ಮತ್ತು ಕ್ರಮಕ್ಕೆ ಕರೆ ನೀಡುವ ಸಾಧನವಾಗಿಯೂ ಉದ್ದೇಶಿಸಲಾಗಿದೆ. ಏಜೆಂಟ್‌ಗಳು ಸುಧಾರಿಸುತ್ತಿರುವಂತೆ, ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ಭದ್ರತಾ ಸಂಶೋಧಕರು ತಮ್ಮ ಕಾರ್ಯಪ್ರವಾಹಗಳಲ್ಲಿ AI-ಸಹಾಯಕ ಆಡಿಟಿಂಗ್ ಅನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವುದು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗುತ್ತದೆ.

ಇತ್ತೀಚಿನ ತಿಂಗಳುಗಳಲ್ಲಿ, ಸೈಬರ್‌ಸಿಕ್ಯೂರಿಟಿ ಕಾರ್ಯಗಳಲ್ಲಿ ಮಾಡೆಲ್ ಕಾರ್ಯಕ್ಷಮತೆಯಲ್ಲಿ ಅರ್ಥಪೂರ್ಣ ಲಾಭಗಳನ್ನು ನಾವು ಕಂಡಿದ್ದೇವೆ, ಇದರಿಂದ ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ಭದ್ರತಾ ವೃತ್ತಿಪರರು ಇಬ್ಬರೂ ಪ್ರಯೋಜನ ಪಡೆದಿದ್ದಾರೆ. ಸಮಾನಾಂತರವಾಗಿ, ನಾವು ರಕ್ಷಣಾತ್ಮಕ ಬಳಕೆ ಮತ್ತು ವ್ಯಾಪಕ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯ ಸ್ಥಿತಿಸ್ಥಾಪಕತೆಯನ್ನು ಬೆಂಬಲಿಸಲು ಬಲಪಡಿಸಿದ ಸೈಬರ್ ಭದ್ರತಾ ಕ್ರಮಗಳನ್ನು ಸಿದ್ಧಪಡಿಸುತ್ತಿದ್ದೇವೆ.

ಸೈಬರ್ ಭದ್ರತೆಯು ಸ್ವಭಾವತಃ ದ್ವಿ-ಬಳಕೆಯದ್ದಾಗಿರುವುದರಿಂದ, ನಾವು ಪುರಾವೆ-ಆಧಾರಿತ, ಪುನರಾವರ್ತಿತ ವಿಧಾನವನ್ನು ಅಳವಡಿಸುತ್ತಿದ್ದೇವೆ, ಇದು ರಕ್ಷಕರು ದುರ್ಬಲತೆಗಳನ್ನು ಕಂಡುಹಿಡಿದು ಸರಿಪಡಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ವೇಗಗೊಳಿಸುತ್ತದೆ ಮತ್ತು ದುರುಪಯೋಗವನ್ನು ನಿಧಾನಗೊಳಿಸುತ್ತದೆ. ನಮ್ಮ ಶಮನ ಕ್ರಮಗಳಲ್ಲಿ ಸುರಕ್ಷತಾ ತರಬೇತಿ, ಸ್ವಯಂಚಾಲಿತ ಮಾನಿಟರಿಂಗ್, ಸುಧಾರಿತ ಸಾಮರ್ಥ್ಯಗಳಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ ಪ್ರವೇಶ ಮತ್ತು ಬೆದರಿಕೆ ಗುಪ್ತಚರವನ್ನು ಒಳಗೊಂಡ ಜಾರಿ ಪೈಪ್‌ಲೈನ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿವೆ.

ನಾವು ಪರಿಸರ ವ್ಯವಸ್ಥೆಯ ರಕ್ಷಣಾ ಕ್ರಮಗಳಲ್ಲಿ ಹೂಡಿಕೆ ಮಾಡುತ್ತಿದ್ದೇವೆ, ಉದಾಹರಣೆಗೆ, ನಮ್ಮ ಭದ್ರತಾ ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಆರ್ಡ್‌ವಾರ್ಕ್ ನ ಖಾಸಗಿ ಬೀಟಾವನ್ನು ವಿಸ್ತರಿಸುವುದು ಮತ್ತು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ಯೋಜನೆಗಳಿಗೆ ಉಚಿತ ಕೋಡ್‌ಬೇಸ್ ಸ್ಕ್ಯಾನಿಂಗ್ ಒದಗಿಸಲು ಓಪನ್-ಸೋರ್ಸ್ ನಿರ್ವಹಕರೊಂದಿಗೆ ಸಹಭಾಗಿತ್ವ ಮಾಡುವುದು.

2023ರಲ್ಲಿ ಪ್ರಾರಂಭಿಸಿದ ನಮ್ಮ ಸೈಬರ್‌ಭದ್ರತಾ ಅನುದಾನ ಕಾರ್ಯಕ್ರಮದ ಮೇಲೆ ಆಧಾರಿತವಾಗಿ, ನಾವು ಓಪನ್ ಸೋರ್ಸ್ ಸಾಫ್ಟ್‌ವೇರ್ ಮತ್ತು ಪ್ರಮುಖ ಮೂಲಸೌಕರ್ಯ ವ್ಯವಸ್ಥೆಗಳಿಗಾಗಿ ನಮ್ಮ ಅತ್ಯಂತ ಸಾಮರ್ಥ್ಯವಂತ ಮಾಡೆಲ್‌ಗಳೊಂದಿಗೆ ಸೈಬರ್ ರಕ್ಷಣೆಯನ್ನು ವೇಗಗೊಳಿಸಲು API ಕ್ರೆಡಿಟ್‌ಗಳಲ್ಲಿ $10 ಮಿಲಿಯನ್ ಅನ್ನು ನೀಡುವುದಕ್ಕೆ ಬದ್ಧರಾಗಿದ್ದೇವೆ. ಉತ್ತಮ ನಂಬಿಕೆಯ ಭದ್ರತಾ ಸಂಶೋಧನೆಯಲ್ಲಿ ತೊಡಗಿರುವ ಸಂಸ್ಥೆಗಳು ನಮ್ಮ ಸೈಬರ್‌ಭದ್ರತಾ ಅನುದಾನ ಕಾರ್ಯಕ್ರಮ ಮೂಲಕ API ಕ್ರೆಡಿಟ್‌ಗಳು ಮತ್ತು ಬೆಂಬಲಕ್ಕಾಗಿ ಅರ್ಜಿ ಸಲ್ಲಿಸಬಹುದು.

ನಾವು ಉದಯೋನ್ಮುಖ AI ಸೈಬರ್ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಅಳೆಯುವ ಮತ್ತು ನಿರ್ವಹಿಸುವ ಕುರಿತು ಮುಂದುವರಿದ ಸಂಶೋಧನೆಯನ್ನು ಬೆಂಬಲಿಸಲು EVMbench ನ ಕಾರ್ಯಗಳು, ಉಪಕರಣಗಳು ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ರೂಪರೇಷೆಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತೇವೆ.

ಓದು ಮುಂದುವರಿಸಿ

ಎಲ್ಲವನ್ನೂ ನೋಡಿ

GPT-Red: ದೃಢತೆಗೆ ಸ್ವ-ಸುಧಾರಣೆಯ ಅನಾವರಣ

ಸುರಕ್ಷತೆಜುಲೈ 15, 2026

ಕೋಡಿಂಗ್ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ಸಂಕೇತವನ್ನು ಗದ್ದಲದಿಂದ ಬೇರ್ಪಡಿಸುವುದು

ಸಂಶೋಧನೆಜುಲೈ 8, 2026

GeneBench-Pro ಪರಿಚಯ

ಸಂಶೋಧನೆಜೂನ್ 30, 2026