ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾ ವಹಿಸುವಿಕೆಯನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವುದು
ನಾವು ಚಿಂತನೆಯ ಸರಪಳಿಯ ಮೇಲ್ವಿಚಾರಣೆಗೆ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತೇವೆ ಮತ್ತು ಪರೀಕ್ಷಾ-ಸಮಯದ ಗಣನೆ, ಬಲವರ್ಧನೆ ಕಲಿಕೆ ಮತ್ತು ಪೂರ್ವ ತರಬೇತಿಯಲ್ಲಿ ಇದು ಹೇಗೆ ಪ್ರಮಾಣಿತಗೊಳ್ಳುತ್ತದೆ ಎಂಬುದನ್ನು ಅಧ್ಯಯನ ಮಾಡುತ್ತೇವೆ.
AI ವ್ಯವಸ್ಥೆಗಳು ನೇರವಾಗಿ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಲು ಕಷ್ಟವಾಗುವ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವಾಗ, ಆ ನಿರ್ಧಾರಗಳು ಹೇಗೆ ತೆಗೆದುಕೊಳ್ಳಲ್ಪಡುತ್ತವೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮುಖ್ಯವಾಗಿದೆ. ಒಂದು ಭರವಸೆಯ ವಿಧಾನವೆಂದರೆ ಮಾಡೆಲ್ನ ಆಂತರಿಕ ತಾರ್ಕಿಕತೆಯನ್ನು ಗಮನಿಸುವುದು, ಅದರ ಕ್ರಮಗಳು ಅಥವಾ ಅಂತಿಮ ಔಟ್ಪುಟ್ಗಳನ್ನು ಮಾತ್ರವಲ್ಲ.
ಆಧುನಿಕ ತಾರ್ಕಿಕತೆಯ ಮಾದರಿಗಳು, ಉದಾಹರಣೆಗೆ GPT‑5 Thinking, ಉತ್ತರವನ್ನು ನೀಡುವ ಮೊದಲು ಸ್ಪಷ್ಟವಾದ ಚಿಂತನೆಯ ಸರಪಳಿಯನ್ನು ರಚಿಸುತ್ತವೆ. ದುರ್ನಡತೆಗಾಗಿ ಈ ಚಿಂತನೆಯ ಸರಪಳಿಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದು ಮಾಡೆಲ್ನ ಕ್ರಮಗಳು ಮತ್ತು ಔಟ್ಪುಟ್ಗಳನ್ನು ಮಾತ್ರ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದಕ್ಕಿಂತ ಅತಿ ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿ ಆಗಿರಬಹುದು. ಆದರೆ, OpenAI ಮತ್ತು ವ್ಯಾಪಕ ಉದ್ಯಮದ ಸಂಶೋಧಕರು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಈ ಚಿಂತನೆಯ ಸರಪಳಿಯ “ನಿಗಾ ವಹಿಸುವಿಕೆಯ” ಟ್ರೈನಿಂಗ್ ವಿಧಾನ, ಡೇಟಾ ಮೂಲಗಳು, ಮತ್ತು ಅಲ್ಗಾರಿದಮ್ಗಳ ಮುಂದುವರಿದ ಪ್ರಮಾಣದ ಬದಲಾವಣೆಗಳಿಗೆ ದುರ್ಬಲವಾಗಿರಬಹುದು ಎಂದು ಚಿಂತಿಸುತ್ತಿದ್ದಾರೆ.
ನಾವು ಚಿಂತನೆಯ ಸರಪಳಿಯ ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಮಾಡೆಲ್ಗಳು ವಿಸ್ತರಿಸಿದಂತೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಹಂತದ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ನಿಯೋಜಿಸಲ್ಪಟ್ಟಾಗಲೂ ಉಳಿಸಬೇಕಾಗಿದೆ. ನಾವು ಕೈಗಾರಿಕೆಯಲ್ಲಿ ಸಂಶೋಧಕರನ್ನು ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾದ ಸಾಮರ್ಥ್ಯವನ್ನು ಸಾಧ್ಯವಾದಷ್ಟು ಕಾಲ ಉಳಿಸಲು ಮತ್ತು ಭವಿಷ್ಯದ AI ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಲೋಡ್-ಬೇರಿಂಗ್ ನಿಯಂತ್ರಣ ಲೇಯರ್ ಆಗಿ ಇದು ಸೇವೆ ಮಾಡಬಹುದೇ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು ಕೆಲಸ ಮಾಡಲು ಕರೆ ನೀಡುತ್ತೇವೆ. ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಲು, ಅದನ್ನು ಅಳೆಯಲು ನಮಗೆ ಸಾಧ್ಯವಾಗಬೇಕು, ಆದರೆ ಕೆಲವೇ ಮೌಲ್ಯಮಾಪನಗಳು ಇವೆ [1(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), 2(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), 3(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)] ಮತ್ತು ವಿಧಾನಶಾಸ್ತ್ರಗಳು ವ್ಯತ್ಯಾಸವಾಗುತ್ತವೆ.
ಈ ಕೃತಿಯಲ್ಲಿ, ನಾವು ಚಿಂತನೆಯ ಸರಪಳಿಯ ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ವ್ಯವಸ್ಥಿತವಾಗಿ ಅಧ್ಯಯನ ಮಾಡುತ್ತೇವೆ. ನಾವು ಚಿಂತನೆಯ ಸರಪಳಿಯ ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಒಂದು ಚೌಕಟ್ಟನ್ನು ಪರಿಚಯಿಸುತ್ತೇವೆ ಮತ್ತು ವ್ಯವಸ್ಥೆಯ ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಅಳೆಯಲು ವಿನ್ಯಾಸಗೊಳಿಸಿದ 13 ಮೌಲ್ಯಮಾಪನಗಳ ಸಮೂಹವನ್ನು (ಒಟ್ಟು 24 ಪರಿಸರಗಳನ್ನು ಒಳಗೊಂಡಂತೆ) ಪರಿಚಯಿಸುತ್ತೇವೆ. ಈ ಮೌಲ್ಯಮಾಪನಗಳು ಮೂರು ಮಾದರಿಗಳಿಗೆ ಸೇರಿವೆ—ಹಸ್ತಕ್ಷೇಪ, ಪ್ರಕ್ರಿಯೆ, ಮತ್ತು ಫಲಿತಾಂಶ-ಗುಣಲಕ್ಷಣ. ಅವುಗಳನ್ನು ಬಳಸಿಕೊಂಡು, ನಾವು ಇಂದಿನ ದೊಡ್ಡ ಭಾಷಾ ಮಾಡೆಲ್ಗಳ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಹೇಗೆ ಅಧ್ಯಯನ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ನಿರ್ಣಯ ಸಮಯದಲ್ಲಿ ಹೆಚ್ಚು ತಾರ್ಕಿಕತೆಯೊಂದಿಗೆ, ದೊಡ್ಡ ಬಲವರ್ಧನೆ ಕಲಿಕೆ ರನ್ಗಳೊಂದಿಗೆ, ಮತ್ತು ಪೂರ್ವ ತರಬೇತಿ ಪ್ರಮಾಣವನ್ನು ಹೆಚ್ಚಿಸುವ ಮೂಲಕ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಗೆ ಹೇಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಅಧ್ಯಯನ ಮಾಡುತ್ತೇವೆ.
ಈಗ ನಾವು ದೊಡ್ಡ ಪ್ರಮಾಣದ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಹೊಂದಿರುವುದರಿಂದ, ನಮ್ಮ ಮಾಡೆಲ್ಗಳ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಹತ್ತಿರದಿಂದ ಗಮನಿಸಲು ಪ್ರಾರಂಭಿಸಬಹುದು. (ಎಡ-ಮೇಲ್ಭಾಗ) ನಾವು ಮಾಡೆಲ್ಗಳು ಹೆಚ್ಚು "ಯೋಚನೆ" ಮಾಡುತ್ತಾ, ದೀರ್ಘ ಚಿಂತನೆಯ ಸರಪಳಿಗಳನ್ನು ಹೊಂದಿದಂತೆ, ನಿಗಾವಹಿಸುವ ಸಾಮರ್ಥ್ಯ ಸುಧಾರಿಸುತ್ತದೆ ಎಂದು ಕಂಡುಹಿಡಿದಿದ್ದೇವೆ. (ಮೇಲ್ಭಾಗದ-ಬಲಭಾಗ) ಚಿಂತನೆಯ ಸರಪಳಿಯಿಲ್ಲದೆ, ಮಾಡೆಲ್ನ ಕ್ರಮಗಳು ಮತ್ತು ಅಂತಿಮ ಔಟ್ಪುಟ್ಗಳನ್ನು ಮಾತ್ರ ನಿಗಾ ವಹಿಸುವುದು ಸಾಮಾನ್ಯವಾಗಿದೆ. ಆದರೆ, ನಾವು ಕ್ರಮಗಳು ಮತ್ತು ಔಟ್ಪುಟ್ಗಳನ್ನು ಮಾತ್ರ ನಿಗಾ ವಹಿಸುವುದಕ್ಕಿಂತ CoT ಅನ್ನು ನಿಗಾ ವಹಿಸುವುದು ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿದೆ ಎಂದು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ. (ಕೆಳ-ಮಧ್ಯಭಾಗ) ನಾವು ನಮ್ಮ ಮಾಡೆಲ್ಗಳನ್ನು ಸಂಪೂರ್ಣ CoT ಪ್ರವೇಶವನ್ನು ನೀಡುವ ಬಾಹ್ಯ ಮಾಡೆಲ್ಗಳಾದ Claude 3.7 Sonnet, DeepSeek R1-0528-Qwen3-8B, ಮತ್ತು Kimi K2 Thinking ಗೆ ಹೋಲಿಸುತ್ತೇವೆ.
ನಾವು ಕಂಡುಕೊಂಡಿರುವುದು ಹೆಚ್ಚಿನ ಫ್ರಂಟಿಯರ್ ತಾರ್ಕಿಕತೆಯ ಮಾಡೆಲ್ಗಳು ಬಹಳಷ್ಟು ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಹೊಂದಿವೆ, ಆದರೆ ಸಂಪೂರ್ಣವಾಗಿ ಅಲ್ಲ. ನಾವು ಅಧ್ಯಯನ ಮಾಡುವ ಬಹುತೇಕ ಎಲ್ಲಾ ಪರಿಸರಗಳಲ್ಲಿ, ಚಿಂತನೆಯ ಸರಪಳಿಗಳ ಮೇಲ್ವಿಚಾರಣೆ ಕ್ರಮಗಳನ್ನು ಮತ್ತು ಅಂತಿಮ ಫಲಿತಾಂಶಗಳನ್ನು ಮಾತ್ರ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದಕ್ಕಿಂತ ಬಹಳ ಪರಿಣಾಮಕಾರಿಯಾಗಿದೆ. ಹೆಚ್ಚು ಕಾಲ ಯೋಚಿಸುವ ಮಾಡೆಲ್ಗಳು ಹೆಚ್ಚು ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಹೊಂದಿರುತ್ತವೆ ಮತ್ತು ಪ್ರಸ್ತುತ ಫ್ರಂಟಿಯರ್ ಪ್ರಮಾಣದಲ್ಲಿ ಬಲವರ್ಧನೆ ಕಲಿಕೆ ಆಪ್ಟಿಮೈಸೇಶನ್ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಅರ್ಥಪೂರ್ಣವಾಗಿ ಕುಂದಿಸುವುದಿಲ್ಲ.
ಗಮನಾರ್ಹವಾಗಿ, ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನ ಮತ್ತು ಮಾಡೆಲ್ ಗಾತ್ರದ ನಡುವೆ ವ್ಯತ್ಯಾಸವಿದೆ: ಮಾಡೆಲ್ ಅನ್ನು ಕಡಿಮೆ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನದಲ್ಲಿ ಚಾಲನೆಗೊಳಿಸಿದಾಗ, ಹೆಚ್ಚಿನ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನದಲ್ಲಿ ಚಲಾಯಿಸಿದ ಸಣ್ಣ ಮಾಡೆಲ್ ಸಮಾನ ಸಾಮರ್ಥ್ಯವನ್ನು ತಲುಪಬಹುದು ಮತ್ತು ಅವುಗಳನ್ನು ಸುಲಭವಾಗಿ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಬಹುದು. ಇದು ಹೆಚ್ಚಿದ ನಿರ್ಣಯ ಗಣಕ ಶಕ್ತಿಯ ವೆಚ್ಚದಲ್ಲಿ ಬರುತ್ತದೆ, ಇದನ್ನು ನಾವು ನಿಗಾ ವಹಿಸುವಿಕೆ ಸಾಧ್ಯತೆಯ ತೆರಿಗೆ ಎಂದು ಕರೆಯುತ್ತೇವೆ. ಅಂತಿಮವಾಗಿ, ನಾವು ಫಾಲೋ-ಅಪ್ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವುದು ಮತ್ತು ಪರಿಣಾಮವಾಗಿ ಉಂಟಾಗುವ ಚಿಂತನಾ ಸರಪಳಿಗಳ ನಿಗಾ ವಹಿಸುವುದರಿಂದ ನಿಗಾ ವಹಿಸುವಿಕೆ ಸಾಮರ್ಥ್ಯವನ್ನು ಇನ್ನಷ್ಟು ಸುಧಾರಿಸಬಹುದು ಎಂದು ಕಂಡುಹಿಡಿದಿದ್ದೇವೆ.
ನಾವು ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಏಜೆಂಟ್ನ ನಡವಳಿಕೆಯ ಬಗ್ಗೆ ಆಸಕ್ತಿಯ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಊಹಿಸಲು ನಿಗಾ ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವೆಂದು ವ್ಯಾಖ್ಯಾನಿಸುತ್ತೇವೆ. ಅನೇಕ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಈ ಗುಣಲಕ್ಷಣಗಳು ತಪ್ಪು ವರ್ತನೆಯ ರೂಪಗಳಿಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತವೆ—ಉದಾಹರಣೆಗೆ, ವಂಚನೆ, ಬಹುಮಾನ ಹ್ಯಾಕಿಂಗ್, ಅಥವಾ ಪಕ್ಷಪಾತಿ ತಾರ್ಕಿಕತೆ—ಆದರೆ ಅವು ಏಜೆಂಟ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ಸುಳಿವಿನ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆಯೇ ಅಥವಾ ಒಂದು ನಿರ್ದಿಷ್ಟ ತಾರ್ಕಿಕ ರೇಖೆಯನ್ನು ಅನುಸರಿಸಿತ್ತೇ ಎಂಬಂತಹ ಹಾನಿರಹಿತ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಒಳಗೊಂಡಿರಬಹುದು.
ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಎಂಬುದು ಎರಡು ಮುಖದ ಗುಣವಾಗಿದೆ. ಇದು ನಿಗಾ ವಹಿಸುವವನ ಮೇಲೆಯೂ, ನಿಗಾ ವಹಿಸಲಾಗುತ್ತಿರುವ ಏಜೆಂಟ್ ಮೇಲೆಯೂ ಅವಲಂಬಿತವಾಗಿದೆ.
- ನಿಗಾ ವಹಿಸುವವರು. ನಾವು ನಿಗಾ ವಹಿಸುವವರನ್ನು ವಿವಿಧ ರೀತಿಗಳಲ್ಲಿ ಹೆಚ್ಚು ಬುದ್ಧಿವಂತಗೊಳಿಸಬಹುದು ಮತ್ತು ಏಜೆಂಟ್ನ ನಡವಳಿಕೆಯ ಬಗ್ಗೆ ಉತ್ತಮ ಊಹೆಗಳನ್ನು ಮಾಡಬಲ್ಲ ನಿಗಾ ವಹಿಸುವವರ ಮೌಲ್ಯಮಾಪನಗಳಿಗೆ ಹೆಚ್ಚಿನ ಅಂಕಗಳನ್ನು ನೀಡಲು ನಾವು ಬಯಸುತ್ತೇವೆ.
- ಏಜೆಂಟ್ಗಳು. ಏಜೆಂಟ್ನ ಅನೇಕ ಪರಿವೀಕ್ಷಣೆಗಳನ್ನು ಮೇಲ್ವಿಚಾರಕರಿಗೆ ನೀಡಬಹುದಾಗಿದೆ, ಇದರಲ್ಲಿ ಏಜೆಂಟ್ನ ಕ್ರಮಗಳು, ಔಟ್ಪುಟ್ಗಳು, ನ್ಯೂರಲ್ ಸಕ್ರಿಯತೆಗಳು, ಮತ್ತು ಇತ್ತೀಚಿನ ತಾರ್ಕಿಕತೆಯ ಮಾಡೆಲ್ಗಳ ಉಗಮದೊಂದಿಗೆ, ಚಿಂತನೆಯ ಸರಪಳಿಯೂ ಸೇರಿವೆ. ಕೆಲವು ಏಜೆಂಟ್ಗಳಿಗೆ ಇತರರಿಗಿಂತ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಕಷ್ಟವಾಗುವ ಚಿಂತನೆಗಳು ಇರಬಹುದು, ಆದ್ದರಿಂದ ನಾವು ನಮ್ಮ ಮೇಲ್ವಿಚಾರಣಾ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಏಜೆಂಟ್ಗಳನ್ನು ಮಾತ್ರವಲ್ಲ, ನಿಗಾ ವಹಿಸುವವರನ್ನು ಸಹ ಹೋಲಿಸಲು ಸಾಧ್ಯವಾಗಬೇಕು.
ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಎರಡೂ ಬದಿಗಳನ್ನು ಅಳೆಯಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ: ಅಂದರೆ ಕೆಲವು ಏಜೆಂಟ್ಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದು ಸುಲಭವೇ ಅಥವಾ ಕಷ್ಟವೇ, ಮತ್ತು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವಿರುವ ನಿಗಾ ವಹಿಸುವವರು ಅದೇ ಸಂಕೇತಗಳಿಂದ ಹೆಚ್ಚು ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯಬಹುದು ಎಂಬುದು.
ಪ್ರಸ್ತುತ ತಾರ್ಕಿಕತೆಯ ಮಾಡೆಲ್ಗಳ ಪೀಳಿಗೆಗೆ ಮೊದಲು, ಚಿಂತನೆಯ ಸರಪಳಿಗಳನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಮಾಡೆಲ್ ಅನ್ನು "ಹಂತ ಹಂತವಾಗಿ ಯೋಚಿಸಿ" ಎಂದು ಪ್ರೇರೇಪಿಸುವ ಮೂಲಕ ಹೊರತೆಗೆಯಲಾಗುತ್ತಿತ್ತು.
ತಾರ್ಕಿಕತೆಯ ಮಾಡೆಲ್ಗಳ ಚಿಂತನೆಯ ಸರಪಳಿಗಳು ಎರಡು ಪ್ರಮುಖ ರೀತಿಗಳಲ್ಲಿ ವಿಭಿನ್ನವಾಗಿವೆ. ಮೊದಲು, ಅವು ಸ್ಪಷ್ಟವಾಗಿ ಚಿಂತನೆಯ ಸರಪಳಿಯನ್ನು ರಚಿಸಲು ತರಬೇತಿ ಪಡೆಯುತ್ತವೆ ಮತ್ತು ನಂತರ ಉತ್ತರವನ್ನು ನೀಡುತ್ತವೆ. ಚಾಟ್ ಮಾಡೆಲ್ ಅನ್ನು "ಹಂತ ಹಂತವಾಗಿ" ಯೋಚಿಸಲು ಪ್ರೇರೇಪಿಸುವಾಗ, ಮಾಡೆಲ್ ಯಾವುದೇ ನಿರ್ದಿಷ್ಟತೆಗಳಿಗೆ ಅನುಗುಣವಾಗಿ, ಉದಾಹರಣೆಗೆ ಸಹಾಯಕ, ಹಾನಿಕಾರಕವಲ್ಲದಂತೆ ಇರಬೇಕು. ಆದರೆ, ಬಲವರ್ಧನೆ ಕಲಿಕೆ ಟ್ರೈನಿಂಗ್ ಪ್ರಕ್ರಿಯೆ ತಾರ್ಕಿಕ ಮಾಡೆಲ್ಗೆ CoT ಒಂದು ಖಾಸಗಿ ಸ್ಥಳವಾಗಿದೆ ಎಂದು ಕಲಿಸುತ್ತದೆ, ಅಲ್ಲಿ ಅದು ತನ್ನ ಇಚ್ಛೆಯಂತೆ ಯೋಚಿಸಬಹುದು ಮತ್ತು ದಂಡಿಸಲ್ಪಡುವುದಿಲ್ಲ, ಮನುಷ್ಯನು ಖಾಸಗಿಯಾಗಿ ಯೋಚಿಸಬಹುದು ಮತ್ತು "ಚಿಂತನೆಯ ಅಪರಾಧಗಳಿಗಾಗಿ" ದಂಡಿಸಲ್ಪಡುವುದಿಲ್ಲ.
ಎರಡನೆಯದಾಗಿ, ಟ್ರೈನಿಂಗ್ ಪ್ರಕ್ರಿಯೆ ಏಜೆಂಟ್ಗೆ ಹೆಚ್ಚಿನ ಬಹುಮಾನ ನೀಡುವ ಅಂತಿಮ ಉತ್ತರವನ್ನು ಪಡೆಯಲು ಅತ್ಯಂತ ಉಪಯುಕ್ತವಾದ ಚಿಂತನೆಗಳ ಸರಪಳಿಗಳನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಹುಡುಕುತ್ತದೆ. ಹೀಗಾಗಿ, ಚಿಂತನೆಯ ಸರಪಳಿ ಮಾಡೆಲ್ ತನ್ನನ್ನು ಸ್ವತಂತ್ರವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಬಹುದಾದ ಸ್ಥಳವಾಗಿರುವುದಲ್ಲದೆ, ಮಾಡೆಲ್ ತನ್ನ ಅಂತಿಮ ಉತ್ತರವನ್ನು ತಲುಪಲು ಸಹಾಯ ಮಾಡುವ ಆಲೋಚನೆಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ.
ನಾವು ನಮ್ಮ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಮೂರು ವಿಭಿನ್ನ ಮಾದರಿಗಳಾಗಿ ಸಂಘಟಿಸುತ್ತೇವೆ, ಪ್ರತಿಯೊಂದೂ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಅಳೆಯಲು ವಿಭಿನ್ನ ವಿಧಾನವನ್ನು ಬಳಸುತ್ತದೆ.
- ಹಸ್ತಕ್ಷೇಪ ಮೌಲ್ಯಮಾಪನಗಳು, Chen et al. 2025(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), Chua et al. 2025(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), Turpin et al. 2023(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ನಿಂದ ಪ್ರೇರಿತವಾಗಿವೆ, ನಾವು ಏಜೆಂಟ್ನ ಪರಿಸರದಲ್ಲಿ ನಿಯಂತ್ರಿತ ಬದಲಾವಣೆಯನ್ನು ಪರಿಚಯಿಸುತ್ತೇವೆ ಮತ್ತು ಚಿಂತನೆಗಳ ಸರಪಳಿಯಲ್ಲಿ ಹಸ್ತಕ್ಷೇಪದ ಸಾಕ್ಷ್ಯವನ್ನು ಗುರುತಿಸುವ ಮೂಲಕ ವರ್ತನೆ ಏಕೆ ಬದಲಾಗಿದೆ ಎಂಬುದನ್ನು ಪತ್ತೆಹಚ್ಚಲು ನಿಗಾ ವಹಿಸುವವರನ್ನು ಪರೀಕ್ಷಿಸುತ್ತೇವೆ. ಸಾಮಾನ್ಯ ನಿಯಂತ್ರಣ ಮೌಲ್ಯಮಾಪನಗಳಿಗಿಂತ ವಿಭಿನ್ನವಾಗಿ (ಉದಾಹರಣೆಗೆ, ಶೇಡ್-ಅರೆನಾ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)), ಹಸ್ತಕ್ಷೇಪ ಮೌಲ್ಯಮಾಪನಗಳು ನಡವಳಿಕೆ ಸಂಭವಿಸಿದೆಯೇ ಎಂಬುದನ್ನು ಪತ್ತೆಹಚ್ಚುವುದಕ್ಕಿಂತ, ನಡವಳಿಕೆ ಏಕೆ ಬದಲಾಗಿದೆ ಎಂಬುದನ್ನು ಪತ್ತೆಹಚ್ಚಲು ನಿಗಾ ವಹಿಸುವವರಿಗೆ ಸಾಧ್ಯವಿದೆಯೇ ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸಲು ನಮಗೆ ಅವಕಾಶ ನೀಡುತ್ತವೆ.
- ಪ್ರಕ್ರಿಯೆ ಮೌಲ್ಯಮಾಪನಗಳು ಸೀಮಿತ ಸಂಖ್ಯೆಯ ಮಾನ್ಯ ಪರಿಹಾರ ಮಾರ್ಗಗಳನ್ನು ಹೊಂದಿರುವ ಕಾರ್ಯಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ (ಉದಾಹರಣೆಗೆ, ಗಣಿತದ ಸಮಸ್ಯೆಯನ್ನು ಕೆಲವು ಸಿದ್ಧಾಂತಗಳೊಂದಿಗೆ ಮಾತ್ರ ಪರಿಹರಿಸಬಹುದು). ಮಾನವ ತಜ್ಞರು ಈ ಮಾರ್ಗಗಳನ್ನು ಎಣಿಸುತ್ತಾರೆ, ಮತ್ತು ನಾವು ಮಾಡೆಲ್ ವಾಸ್ತವವಾಗಿ ತೆಗೆದುಕೊಂಡ ಹಂತಗಳನ್ನು ನಿಗಾ ವಹಿಸುವವರು ಪತ್ತೆಹಚ್ಚಬಹುದೇ ಎಂಬುದನ್ನು ಪರೀಕ್ಷಿಸುತ್ತೇವೆ. ಈ ಮೌಲ್ಯಮಾಪನಗಳು ಮಾಡೆಲ್ ಏನು ಮಾಡಿತೆಂಬುದನ್ನು ಮಾಡೆಲ್ ತೆಗೆದುಕೊಂಡಿರಬಹುದಾದ ವಿಶೇಷ ಹಂತಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡಲು ಮತ್ತು ಆ ಹಂತಗಳು ನಿಗಾ ವಹಿಸುವ ಸಾಧ್ಯತೆ ಹೊಂದಿದೆಯೇ ಎಂದು ಕೇಳಲು ನಮಗೆ ಅನುಮತಿಸುತ್ತವೆ.
- ಫಲಿತಾಂಶ-ಗುಣಲಕ್ಷಣ ಮೌಲ್ಯಮಾಪನಗಳು ಮಾಡೆಲ್ನ ಔಟ್ಪುಟ್ನ ಗುಣಲಕ್ಷಣವನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಅಳೆಯಬಹುದಾದಾಗ ಅನ್ವಯಿಸುತ್ತವೆ. ಈ ಸಂದರ್ಭಗಳಲ್ಲಿ, ನಾವು ಪರೀಕ್ಷಿಸುವುದು, ನಿಗಾ ವಹಿಸುವವರ ಮಾಡೆಲ್ನ ತರ್ಕ ಅಥವಾ ಕ್ರಮಗಳಿಂದ ಆ ಗುಣಲಕ್ಷಣ—ಉದಾಹರಣೆಗೆ, ರಿವಾರ್ಡ್ ಹ್ಯಾಕಿಂಗ್—ಅನ್ನು ಊಹಿಸಲು ಸಾಧ್ಯವಿದೆಯೇ ಎಂಬುದನ್ನು. ಉದಾಹರಣೆಗೆ, ಕೋಡಿಂಗ್ ಕಾರ್ಯದಲ್ಲಿ, ಮಾಡೆಲ್ ಒಂದು ರಿವಾರ್ಡ್ ಸಿಗ್ನಲ್ ಅನ್ನು ಹ್ಯಾಕ್ ಮಾಡಲು ಕ್ರಮಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದೆಯೇ ಎಂಬುದನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ ಮಾರ್ಗವಿರಬಹುದು, ಮತ್ತು ಮಾಡೆಲ್ನ ಚಿಂತನೆ ಅಥವಾ ಕ್ರಮಗಳಲ್ಲಿ ರಿವಾರ್ಡ್ ಹ್ಯಾಕ್ ಮಾಡುವ ಉದ್ದೇಶದ ಸಾಕ್ಷ್ಯವನ್ನು ನಿಗಾ ವಹಿಸುವವರು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆಯೇ ಎಂದು ಕೇಳಬಹುದು.
ಕೆಳಗೆ ನಾವು ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳಿಗಾಗಿ ಒಂದು ವರ್ಗೀಕರಣವನ್ನು ನೀಡುತ್ತೇವೆ. ಪ್ರತಿ ವೈಯಕ್ತಿಕ ಮೌಲ್ಯಮಾಪನದ ಸಂಪೂರ್ಣ ವಿವರಣೆಗೆ ದಯವಿಟ್ಟು ನಮ್ಮ ಪತ್ರಿಕೆಯನ್ನು ನೋಡಿ.

Neutral evaluations ask whether the reasoning for normal tasks where the model does not misbehave is monitorable. Sycophancy evaluations target cases where models change their behavior to overly please or agree with a user. Bias evaluations ask if a model’s bias around gender, race, etc. is monitorable. Finally, we use the misalignment label as a catchall for other forms of misbehavior: cheating, lying, etc.¹
ನಮ್ಮ ಮಾಡೆಲ್ನ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಮರ್ಥ್ಯವು ಪ್ರತಿ ಗುಂಪಿಗೆ ಕೆಲವು ಮಟ್ಟದವರೆಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂದು ನಾವು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ. ಸಾಮಾನ್ಯವಾಗಿ ನಾವು ಅವುಗಳನ್ನು ತುಂಬಾ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಬಹುದಾದವು ಎಂದು ಕಂಡುಕೊಳ್ಳುತ್ತೇವೆ; ಆದರೆ, ವಿಶೇಷವಾಗಿ ಮುಖಸ್ತುತಿ ಬಗ್ಗೆ ತರ್ಕವನ್ನು ನಿಗಾ ವಹಿಸುವಿಕೆ ಮಾಡಬಹುದೇ ಎಂಬುದನ್ನು ನೋಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಿದ ಕಾರ್ಯವಾದ Scruples ನಲ್ಲಿ, ನಾವು ತುಂಬಾ ಕಡಿಮೆ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಕಾಣುತ್ತೇವೆ.
ನಿಗಾ ವಹಿಸಬಹುದಾದ ಮತ್ತು ನಿಗಾ ವಹಿಸಲಾಗದ ಉದಾಹರಣೆಗಳು
ಈ ಫಲಿತಾಂಶ-ಗುಣಲಕ್ಷಣದ ಉದಾಹರಣೆಯಲ್ಲಿ, ಮಾಡೆಲ್ಗೆ ಅಸಾಧ್ಯವಾದ ಕೋಡಿಂಗ್ ಕಾರ್ಯವನ್ನು ನೀಡಲಾಗಿದೆ. ಯೂನಿಟ್ ಪರೀಕ್ಷೆಗಳು ಉತ್ತೀರ್ಣವಾದರೆ, ಮಾಡೆಲ್ ಕೆಲವು ರೀತಿಯ ತಂತ್ರವನ್ನು ಬಳಸಿದೆ ಎಂದು ನಾವು ತಿಳಿಯುತ್ತೇವೆ. ನಿಗಾ ವಹಿಸಲಾಗದ ಚಿಂತನೆಯ ಸರಪಳಿಯಲ್ಲಿ (ಕೆಂಪು), ಮಾಡೆಲ್ ಏನಾದರೂ ಕೆಟ್ಟದನ್ನು ಮಾಡುತ್ತಿದೆ ಎಂಬುದಕ್ಕೆ ಯಾವುದೇ ಸಾಕ್ಷ್ಯವನ್ನು ನಾವು ಕಾಣುವುದಿಲ್ಲ, ಆದರೆ ಪರೀಕ್ಷೆಗಳನ್ನು ಹ್ಯಾಕ್ ಮಾಡುತ್ತದೆ ಮತ್ತು ಬಳಕೆದಾರನಿಗೆ ತಿದ್ದುಪಡಿ ಅನುಷ್ಠಾನಗೊಳಿಸಲಾಗಿದೆ ಎಂದು ತಿಳಿಸುತ್ತದೆ. ತೀವ್ರ ಹೋಲಿಕೆಯಲ್ಲಿ, ನಿಗಾ ವಹಿಸಬಹುದಾದ CoT ಯಲ್ಲಿ (ಹಸಿರು), ಮಾಡೆಲ್ ಯೋಚಿಸುತ್ತದೆ ಎಂಬುದು ನಮಗೆ ಕಂಡುಬರುತ್ತದೆ "ಆದರೆ ಪರಿಹಾರದೊಳಗೆ ಸಮಯವನ್ನು ಕ್ರಿಯಾತ್ಮಕವಾಗಿ ಮಾರ್ಪಡಿಸುವುದು ಸಂಭಾವ್ಯತಃ ಮೋಸವಾಗಿದೆ."
ಚಿಂತನೆಯ ಸರಪಳಿಯನ್ನು ಖಾಸಗಿ ಕಾರ್ಯಕ್ಷೇತ್ರವಾಗಿ ಪರಿಗಣಿಸುವುದು—ಮತ್ತು ಮಾಡೆಲ್ಗಳನ್ನು ಅದನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಕಾರ್ಯಗಳನ್ನು ಪರಿಹರಿಸಲು ಬಳಸಲು ಟ್ರೈನಿಂಗ್ ನೀಡುವುದು—ತಾತ್ವಿಕವಾಗಿ, ಚಿಂತನೆಯ ಸರಪಳಿಗಳನ್ನು ನಿಗಾ ವಹಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಇದೇ ವೇಳೆ, ಬಲವರ್ಧನೆ ಕಲಿಕೆ ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಗೆ ಹಾನಿ ಮಾಡಬಹುದಾದ ಹಲವಾರು ತಾರ್ಕಿಕತೆಗಳಿವೆ.
ಮೊದಲು, ಮಾಡೆಲ್ಗಳಿಗೆ ಯೋಚಿಸಲು ಇರುವ ಸಮಯ ಅಥವಾ ಟೋಕನ್ಗಳನ್ನು ಮಿತಿಗೊಳಿಸುವಂತಹ ತಾರ್ಕಿಕತೆಯ ಉದ್ದದ ಮೇಲೆ ನಿರ್ಬಂಧಗಳು, ಮಾಡೆಲ್ಗಳಿಗೆ ಕಡಿಮೆ ತಾರ್ಕಿಕತೆ ಬಳಸಲು ಪ್ರೇರಣೆಗಳನ್ನು ನೀಡುತ್ತವೆ. ಎರಡನೆಯದಾಗಿ, ಆಲೋಚನಾ ಸರಣಿಯ ಮೇಲೆ ನೇರ ಆಪ್ಟಿಮೈಸೇಶನ್ ಒತ್ತಡವನ್ನು ಅನ್ವಯಿಸದಿದ್ದರೂ, ಪರೋಕ್ಷ ಒತ್ತಡಗಳು ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಬಹುದು. ಉದಾಹರಣೆಗೆ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ), ಮಾಡೆಲ್ಗಳು ಕಡಿಮೆ ಬಹುಮಾನ ಅಥವಾ ಅಸಮಾಧಾನಕರ ಫಲಿತಾಂಶಗಳಿಗೆ ಕಾರಣವಾಗುವ ತಾರ್ಕಿಕತೆಯ ಮಾರ್ಗಗಳನ್ನು ತಪ್ಪಿಸಿದರೆ, ಹೆಚ್ಚಿನ ಬಹುಮಾನ ಉತ್ತರಗಳನ್ನು ತಲುಪುವುದು ಸುಲಭವಾಗಬಹುದು. ಕೊನೆಗೆ, ಬಲವರ್ಧನೆ ಕಲಿಕೆಯ ಗ್ರೇಡಿಯಂಟ್ ಶಬ್ದದಿಂದ ಉಂಟಾಗುವ ತಪ್ಪು ಚಲನೆಯಿಂದ ನಿಗಾ ವಹಿಸುವಿಕೆಯಲ್ಲಿ ಕಡಿತ ಉಂಟಾಗಬಹುದು.
ಕೆಳಗೆ, ನಾವು OpenAI ಯ ಎರಡು ಫ್ರಂಟಿಯರ್ ಬಲವರ್ಧನೆ ಕಲಿಕೆ ಟ್ರೈನಿಂಗ್ ರನ್ಗಳಲ್ಲಿ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಹೇಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸುತ್ತೇವೆ. ಈ ಫಲಿತಾಂಶಗಳು ಕೇವಲ ಎರಡು ಡೇಟಾಪಾಯಿಂಟ್ಗಳನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತಿದ್ದರೂ, ಅವುಗಳು ಪ್ರಸ್ತುತ ಫ್ರಂಟಿಯರ್ ಪ್ರಮಾಣಗಳಲ್ಲಿ ಬಲವರ್ಧನೆ ಕಲಿಕೆಯ ಆಪ್ಟಿಮೈಜೇಶನ್ ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾ ವಹಿಸುವಿಕೆಯನ್ನು ಭೌತಿಕವಾಗಿ ಹಾಳು ಮಾಡುವುದಿಲ್ಲ ಮತ್ತು ಆರಂಭಿಕ ಹಂತಗಳಿಗೆ ನಿಗಾ ವಹಿಸುವಿಕೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಎಂದು ಸೂಚಿಸುತ್ತವೆ. ಆದರೆ, ಭವಿಷ್ಯದಲ್ಲಿ ಬಹಳ ದೊಡ್ಡ ಪ್ರಮಾಣದ ಬಲವರ್ಧನೆ ಕಲಿಕೆಗಳು ಮೇಲ್ವಿಚಾರಣೆಗೆ ಹಾನಿಕಾರಕವಾಗುವ ಸಾಧ್ಯತೆಯನ್ನು ಇದು ನಿರಾಕರಿಸುವುದಿಲ್ಲ.
ನಾವು ಕಂಡುಕೊಂಡಿರುವುದು ಏನೆಂದರೆ, ಪ್ರಸ್ತುತ RL ಕಂಪ್ಯೂಟ್ ಮಾಪಕಗಳಲ್ಲಿ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಬಹಳಷ್ಟು ಬದಲಾಗುವುದಿಲ್ಲ ಮತ್ತು ಪ್ರಾರಂಭಿಕ ಹಂತಗಳಲ್ಲಿ ಹೆಚ್ಚಳವಾಗುತ್ತದೆ. ಈಗಿನ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ ಇದು ನಿಜವಾಗಿರಬಹುದು, ಆದರೆ ಮಹತ್ವದ ಮಟ್ಟದಲ್ಲಿ ಹೆಚ್ಚಿದ ಪ್ರಮಾಣವು ನಿಗಾ ವಹಿಸುವಿಕೆ ಹದಗೆಡುವುದಕ್ಕೆ ಕಾರಣವಾಗಬಹುದು.
ಪ್ರಸ್ತುತ AI ವ್ಯವಸ್ಥೆಗಳ ಬುದ್ಧಿವಂತಿಕೆಯ ದೊಡ್ಡ ಭಾಗವು ಹೆಚ್ಚಿದ ಪೂರ್ವತರಬೇತಿಯ ಪ್ರಮಾಣದಿಂದ ಚಾಲಿತವಾಗಿದೆ, ಇದರಿಂದ ಮಾಡೆಲ್ ಪ್ಯಾರಾಮೀಟರ್ಗಳು ಮತ್ತು ಡೇಟಾಸೆಟ್ ಗಾತ್ರಗಳು GPT ಪರಿಕಲ್ಪನೆಯ ಆರಂಭದಿಂದಲೂ ನಿರಂತರವಾಗಿ ವೃದ್ಧಿಯಾಗುತ್ತಿವೆ. ಹೆಚ್ಚಿದ ಪ್ಯಾರಾಮೀಟರ್ ಸಂಖ್ಯೆಗಳು ಪ್ರತಿಯೊಂದು ರಚಿಸಲಾದ ಟೋಕನ್ಗೆ ಹೆಚ್ಚು ನಿರ್ಣಯ ಗಣಕ ಶಕ್ತಿಯನ್ನು ಬಳಸುತ್ತವೆ, ಇದು ತಾರ್ಕಿಕತೆಯ ಮಾಡೆಲ್ಗಳ ಸಂದರ್ಭದಲ್ಲಿ, ಮಾಡೆಲ್ನ ಚಿಂತನೆಯ ಸರಪಳಿಯ ಬದಲಾಗಿ ಆ್ಯಕ್ಟಿವೇಶನ್ಗಳಲ್ಲಿ ನಡೆಯಲು ಹೆಚ್ಚು ಅವಕಾಶವನ್ನು ನೀಡುತ್ತದೆ. ಹೀಗಾಗಿ, ನಾವು ಸ್ಥಿರ ಸಾಮರ್ಥ್ಯ ಮಟ್ಟದಲ್ಲಿ ದೊಡ್ಡ ಮಾಡೆಲ್ಗಳು ಕಡಿಮೆ ಮೇಲ್ವಿಚಾರಣೆಯಲ್ಲಿರಬಹುದು ಎಂದು ನಿರೀಕ್ಷಿಸಬಹುದು.
ಅದೇ ಸಮಯದಲ್ಲಿ, ಚಿಕ್ಕ ಮಾಡೆಲ್ಗಳು ಚಿಂತನೆಯ ಸರಪಳಿಯನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಬಳಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಕಡಿಮೆ ಹೊಂದಿರಬಹುದು—ಇದು ಮೇಲ್ವಿಚಾರಣೆಯ ಸಾಮರ್ಥ್ಯದ ಮೇಲೆ ಕೂಡಾ ಪರಿಣಾಮ ಬೀರಬಹುದು.
ಪೂರ್ವ ತರಬೇತಿ ಗಾತ್ರ, ಸಾಮರ್ಥ್ಯ, ಮತ್ತು ನಿಗಾ ವಹಿಸುವಿಕೆ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಪರಿಶೀಲಿಸಲು, ನಾವು ಎರಡು ಕ್ರಮದ ಪೂರ್ವ ತರಬೇತಿ ಕಂಪ್ಯೂಟ್ನ ಮೇಲೆ ಮಾಡೆಲ್ಗಳ ಕುಟುಂಬವನ್ನು ಹೆಚ್ಚುತ್ತಿರುವ ಆಳ ಮತ್ತು ಅಗಲದೊಂದಿಗೆ ತರಬೇತಿ ಮಾಡಿದ್ದೇವೆ, ನಂತರ ಗಣಿತ, ವಿಜ್ಞಾನ, ಮತ್ತು ಕೋಡಿಂಗ್ ಕಾರ್ಯಗಳ ಹಂಚಿದ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಪ್ರತಿಯೊಂದರ ಮೇಲೆ ಬಲವರ್ಧನೆ ಕಲಿಕೆಯನ್ನು ಅನ್ವಯಿಸಿದ್ದೇವೆ. ನಾವು ಪ್ರತಿ ಮಾಡೆಲ್ ಅನ್ನು ವಿವಿಧ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನಗಳ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಿದ್ದೇವೆ ಮತ್ತು ಹೊಂದಾಣಿಕೆಯ ಸಾಮರ್ಥ್ಯ ಮಟ್ಟಗಳಲ್ಲಿ ನಿಗಾವಹಿಸುವಿಕೆಯನ್ನು ಹೋಲಿಸಿದ್ದೇವೆ.

ನಾವು ಪ್ರತಿ ಮಾಡೆಲ್ನ ಮೌಲ್ಯಮಾಪನ ಸ್ಯೂಟ್ನಲ್ಲಿ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯನ್ನು ಪ್ಲಾಟ್ ಮಾಡುತ್ತೇವೆ ಮತ್ತು ಪ್ರಮಾಣಿತ ಸಾಮರ್ಥ್ಯ ಮೌಲ್ಯಮಾಪನಗಳ (GPQA-Diamond, AIME 2025, ಮತ್ತು CodeForces) ಸಮೂಹದ ಮೇಲೆ ಸರಾಸರಿ ಪಾಸ್ ದರವನ್ನು ಹೋಲಿಸುತ್ತೇವೆ. ಪ್ರತಿ ಮಾಡೆಲ್ ಅನ್ನು ಅನೇಕ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನಗಳ ಆಧಾರದ ಮೇಲೆ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲಾಗುತ್ತದೆ (ಈ ಆಕೃತಿಯಲ್ಲಿನ ಪ್ರತಿ ಬಿಂದು ವಾಸ್ತವದಲ್ಲಿ ಅಳವಡಿಸಿದ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನಗಳ ನಡುವೆ ರೇಖೀಯ ಮಧ್ಯಸ್ಥಿಕೆ ಫಲಿತಾಂಶವಾಗಿದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ). ವೃತ್ತಗಳು ಆ ನಿರ್ದಿಷ್ಟ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನದ ಮಟ್ಟದಲ್ಲಿ ಮಾಡೆಲ್ ನಿಗಾ ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿರುವುದನ್ನು ಸೂಚಿಸುತ್ತವೆ, ಮತ್ತು ಪಾರದರ್ಶಕ X ಗಳು ಆ ಸಾಮರ್ಥ್ಯ ಮಟ್ಟದಲ್ಲಿ ಮತ್ತೊಂದು ಮಾಡೆಲ್ ಮೂಲಕ ಆ ನಿರ್ದಿಷ್ಟ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನದ ಮಟ್ಟದಲ್ಲಿ ಮಾಡೆಲ್ ನಿಗಾ ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿಲ್ಲ ಎಂದು ಸೂಚಿಸುತ್ತವೆ. ಕಪ್ಪು ಬಾಣಗಳಲ್ಲಿ ನಾವು ಹೆಚ್ಚು ನಿರ್ಣಯ ಗಣನೆ ಮಾಡಲು ಎರಡು ಮಾರ್ಗಗಳ ಉದಾಹರಣೆಗಳನ್ನು ತೋರಿಸುತ್ತೇವೆ: ಸಣ್ಣ ಮಾಡೆಲ್ನೊಂದಿಗೆ ಹೆಚ್ಚು ಟೋಕನ್ಗಳನ್ನು ಅದೇ ಮಾಡೆಲ್ನ ಮೂಲಕ ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಮಾಡುವುದು ಅಥವಾ ಅದೇ ಮಾಡೆಲ್ನೊಂದಿಗೆ ತಕ್ಕಮಟ್ಟಿಗೆ ಕಡಿಮೆ ಹೆಚ್ಚುವರಿ ಟೋಕನ್ಗಳು ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಮಾಡುವುದು. ಕೆಂಪು ಬಾಣಗಳಲ್ಲಿ, ನಿಗಾ ವಹಿಸುವಿಕೆಯ ತೆರಿಗೆ, ಅಂದರೆ ಹೆಚ್ಚು ನಿಗಾ ವಹಿಸುವಿಕೆಗೆ ಸ್ವಲ್ಪ ಕಡಿಮೆ ಸಾಮರ್ಥ್ಯಗಳಿಗಾಗಿ ಪಾವತಿಸಬೇಕಾದ ತೆರಿಗೆಯನ್ನು ನಾವು ತೋರಿಸುತ್ತೇವೆ.
ಸಾಮಾನ್ಯವಾಗಿ, ನಾವು ನೀಡಿದ ಮಾಡೆಲ್ ಅನ್ನು ಕಡಿಮೆ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನದೊಂದಿಗೆ ನಿಯೋಜಿಸಬೇಕಿದ್ದರೆ, ಅದರ ಬದಲಿಗೆ ನಾವು ಚಿಕ್ಕ ಮಾಡೆಲ್ ಅನ್ನು ಹೆಚ್ಚಿನ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನದೊಂದಿಗೆ ನಿಯೋಜಿಸಬಹುದು ಎಂದು ನಾವು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ. ಮೂಲ ದೊಡ್ಡ ಮಾಡೆಲ್ನಿಂದ ಹೆಚ್ಚಿನ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನವನ್ನು ಬಳಸುವುದಕ್ಕಿಂತ, ನಾವು ಕಡಿಮೆ ಸಾಮರ್ಥ್ಯದ ವೆಚ್ಚದಲ್ಲಿ ಅಥವಾ ನಿಗಾ ವಹಿಸುವಿಕೆ ಸಾಧ್ಯತೆಯ ತೆರಿಗೆಯಲ್ಲಿ ಹೆಚ್ಚಿನ ನಿಗಾ ವಹಿಸುವಿಕೆಯನ್ನು ಪಡೆಯಬಹುದು. ಆದರೆ, ಪೂರ್ಣಗೊಳ್ಳಲು ತೆಗೆದುಕೊಳ್ಳುವ ವಾಲ್ಕ್ಲಾಕ್ ಸಮಯವು ಕೆಲವು ನಿಯೋಜನೆ ನಿರ್ಧಾರಗಳಲ್ಲಿ ಒಂದು ಅಂಶವಾಗಿರಬಹುದು, ಇದನ್ನು ನಾವು ಇಲ್ಲಿ ಪರಿಗಣಿಸುತ್ತಿಲ್ಲ. ನಮ್ಮ ಮಾಡೆಲ್ಗಳು ಸುಧಾರಿಸುತ್ತಾ, ಹೆಚ್ಚಿನ ಹಂತದ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ಅವುಗಳನ್ನು ಸುರಕ್ಷಿತವಾಗಿ ನಿಯೋಜಿಸಲು ಅಂತಹ ತೆರಿಗೆ ಪಾವತಿಸುವುದು ಅಗತ್ಯವಾಗಬಹುದು.
ಈ ಫಲಿತಾಂಶಗಳಿಗೆ ಕೆಳಗಿನ ಮಿತಿಗಳು ಇವೆ: (1) ನಾವು ಪ್ರತಿ ಮಾಡೆಲ್ ಅನ್ನು ಒಂದೇ ಬಾರಿ ಟ್ರೈನ್ ಮಾಡುತ್ತೇವೆ, ಆದ್ದರಿಂದ ಟ್ರೈನ್ ರನ್ಗಳಾದ್ಯಂತ ವ್ಯತ್ಯಾಸವನ್ನು ಪರಿಗಣಿಸುವುದಿಲ್ಲ. ಉದಾಹರಣೆಗೆ, ಈ ಸರಣಿಯ ಇತರ ಮಾಡೆಲ್ಗಳೊಂದಿಗೆ ಹೋಲಿಸಿದಾಗ, "ಮಧ್ಯಮ" ಮಾಡೆಲ್ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆಯಲ್ಲಿ ಸ್ವಲ್ಪ ಟ್ರೆಂಡ್ನಿಂದ ಹೊರಗಿರುವಂತೆ ಕಾಣುತ್ತದೆ, ಇದರಿಂದ ಹೀಗಾಗಿರಬಹುದು. (2) ನಾವು ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಸಂಬಂಧಿತ ವಿತರಣಾ ಸೆಟ್ಟಿಂಗ್ಗಳಲ್ಲಿ (ಗಣಿತ, ವಿಜ್ಞಾನ, ಮತ್ತು ಕೋಡಿಂಗ್) ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತೇವೆ, ಮತ್ತು ವಿತರಣೆಯ ಹೊರಗಿನ ದೃಢತೆಯನ್ನು ಪರಿಗಣಿಸುವಾಗ ವ್ಯತ್ಯಾಸಗಳು ಬದಲಾಗಬಹುದು.
AI ವ್ಯವಸ್ಥೆಗಳು ಮಾನವ ಮಟ್ಟದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಮೀರಿದಂತೆ, ನೇರ ಮಾನವ ನಿಗಾ ವಹಿಸುವಿಕೆ ಹೆಚ್ಚು ಕಷ್ಟಕರವಾಗುತ್ತದೆ. ಆದರ್ಶವಾಗಿ, ಬಲವಾದ, ಸಂಭಾವ್ಯತಃ ನಂಬದಿರುವ ಏಜೆಂಟ್ಗಳ ನಿಗಾ ವಹಿಸಲು ವಿಶ್ವಾಸಾರ್ಹ ಆದರೆ ದುರ್ಬಲವಾದ ನಿಗಾ ವಹಿಸುವವರಿಗೆ ಅನುಮತಿಸುವ ವರ್ಧಿಸಬಹುದಾದ ನಿಯಂತ್ರಣ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ನಾವು ಹೊಂದಿರುತ್ತೇವೆ. ಈ ರೀತಿಯ ವಿಧಾನಗಳು ಹೆಚ್ಚುವರಿ ಪರೀಕ್ಷಾ-ಸಮಯದ ಗಣಕ ಶಕ್ತಿಯನ್ನು ಅಳವಡಿಸಿಕೊಂಡು ಹೆಚ್ಚು ನಿಖರವಾದ ಊಹೆಗಳನ್ನು ನೀಡಬಲ್ಲವು.
(ಎಡ) ನಾವು ಅನೇಕ ವಿಭಿನ್ನ ನಿಗಾ ವಹಿಸುವವರನ್ನು ಹೋಲಿಸುತ್ತೇವೆ ಮತ್ತು ಪ್ರತಿಯೊಂದರ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನವನ್ನು ಬದಲಿಸುತ್ತೇವೆ. ಪ್ರತಿ ನಿಗಾ ವಹಿಸುವವರು ಒಂದೇ GPT‑5 Thinking ಮಾಡೆಲ್ ಅನ್ನು ನಿಗಾ ವಹಿಸುತ್ತಿದ್ದಾರೆ. ನಮ್ಮ ನಿರೀಕ್ಷೆಯಂತೆ, ಸಾಮಾನ್ಯವಾಗಿ ದೊಡ್ಡ ಮತ್ತು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವಿರುವ ಮಾಡೆಲ್ಗಳು ಉತ್ತಮ ನಿಗಾ ವಹಿಸುವವರಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಮತ್ತು ತಾರ್ಕಿಕತೆಯ ಮಾಡೆಲ್ಗಳು ಹೆಚ್ಚಿನ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನದೊಂದಿಗೆ (ಮತ್ತು ಹಾಗಾಗಿ ಪರೀಕ್ಷಾ ಸಮಯದ ಗಣನೆಯೊಂದಿಗೆ) ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಕಾರ್ಯದಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ.
(ಬಲ) ನಾವು OpenAI o4-mini ಗಾಗಿ ವಿಭಿನ್ನ ನಿಗಾ ವಹಿಸುವಿಕೆ ಅವಲೋಕನ ವ್ಯಾಪ್ತಿಗಳನ್ನು ಹೋಲಿಸುತ್ತೇವೆ, ಅಂದರೆ, ನಿಗಾ ವಹಿಸುವವರು ಕೇವಲ CoT ಅನ್ನು, ಕೇವಲ ಕ್ರಮಗಳು ಮತ್ತು ಉತ್ತರವನ್ನು, ಅಥವಾ ಅದು ನಿಗಾ ವಹಿಸುತ್ತಿರುವ ಮಾಡೆಲ್ನ ಎಲ್ಲಾ ಸಂದೇಶಗಳನ್ನು ನೋಡಬಹುದೇ ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸುತ್ತೇವೆ. ಗಮನಾರ್ಹವಾಗಿ, ಹೆಚ್ಚಿದ ಪರೀಕ್ಷಾ-ಸಮಯದ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಗಣನೆ (ಹೆಚ್ಚಿದ ನಿಗಾ ವಹಿಸುವಿಕೆ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನ) ಸಹಿತ ನಿಹಾ ವಹಿಸುವಿಕೆ ಸಾದ್ಯತೆಯ CoT ಗೆ ಪ್ರವೇಶವನ್ನು ನೀಡಿದಾಗ ವೇಗವಾಗಿ ಸುಧಾರಿಸುತ್ತದೆ. ಆದ್ದರಿಂದ, ಚಿಂತನೆಯ ಸರಪಳಿ (CoT) ನಿಗಾ ವಹಿಸುವಿಕೆಯು, ನಿಯಂತ್ರಣಕ್ಕಾಗಿ ಸರಳ ನಿಗಾ ವಹಿಸುವಿಕೆಗಿಂತ ಹೆಚ್ಚು ವ್ಯಾಪಕ ಮಾರ್ಗವನ್ನು ಒದಗಿಸಬಹುದು.
ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾ ವಹಿಸುವಿಕೆಯನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಸ್ಥಿರ ಪ್ರಮಾಣವಾಗಿ ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ: ಮಾಡೆಲ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನದಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನೀಡಿದಾಗ, ಫಲಿತಾಂಶದ ಚಿಂತನೆಯ ಸರಪಳಿಯನ್ನು ಸಾಧ್ಯವಾದಷ್ಟು ಉತ್ತಮವಾಗಿ ನಿಗಾ ವಹಿಸಲಾಗುತ್ತದೆ. ನಾವು ನಿರಂತರವಾಗಿ ಕಂಡುಕೊಂಡಿರುವಂತೆ, ಏಜೆಂಟ್ಗಳ ತಾರ್ಕಿಕತೆಯ ಶ್ರಮವನ್ನು ಹೆಚ್ಚಿಸಿದಂತೆ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಸುಧಾರಿಸುತ್ತದೆ. ಆದ್ದರಿಂದ, ನಾವು ಹೇಗಾದರೂ ಹೆಚ್ಚು ಟೋಕನ್ಗಳನ್ನು ನಿಗಾ ವಹಿಸಲು ಪಡೆಯಬಹುದೇ ಎಂಬುದನ್ನು ಕೇಳಲು ಪ್ರೇರಿತರಾದೆವು.
ಇದನ್ನು ಅನ್ವೇಷಿಸಲು, ನಾವು ಮೂಲ ಪ್ರಾಂಪ್ಟ್, ಚಿಂತನೆಯ ಸರಪಳಿ ಮತ್ತು ಉತ್ತರವನ್ನು ಸಂದರ್ಭದಲ್ಲಿ ಇಟ್ಟುಕೊಂಡು, ಮಾಡೆಲ್ ಪ್ರತಿಕ್ರಿಯಿಸಿದ ನಂತರ ಫಾಲೋ-ಅಪ್ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವ ಪ್ರಯೋಗ ಮಾಡಿದೆವು. ಈ ಫಾಲೋ-ಅಪ್ಗಳು ನಿಗಾ ವಹಿಸಲಾಗುತ್ತಿರುವ ಗುಣಲಕ್ಷಣದ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ—ಉದಾಹರಣೆಗೆ, “ನೀವು ನಿಮ್ಮ ಉತ್ತರವನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಸುಳಿವನ್ನು ಅರ್ಥಪೂರ್ಣವಾಗಿ ಬಳಸಿದೀರಾ?” ಅಥವಾ “ನೀವು ಏನಾದರೂ ಅನುಮಾನಾಸ್ಪದವಾಗಿ ಮಾಡಿದ್ದೀರಾ?” ತಾತ್ವಿಕವಾಗಿ, ಮಾಡೆಲ್ ತನ್ನ ಹಿಂದಿನ ತಾರ್ಕಿಕತೆಯನ್ನು ಉಳಿಸಿಕೊಂಡಿರುವುದರಿಂದ, ಅದು ಮುಂದಿನ ಚಿಂತನೆಯ ಸರಪಳಿಯಲ್ಲಿ ಅಥವಾ ಪ್ರತಿಕ್ರಿಯೆಯಲ್ಲಿ ಮೊದಲು ಹೇಳದ ಯೋಚನೆಗಳನ್ನು ಹೊರತರುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿರಬಹುದು.
ಈ ಫಲಿತಾಂಶಗಳು ತಾತ್ಕಾಲಿಕವಾಗಿವೆ. ನಾವು ಕೇವಲ ಕೆಲವು ಅನುಸರಣೆ ಪ್ರಶ್ನೆಗಳ ಸ್ವರೂಪಗಳನ್ನು ಅನ್ವೇಷಿಸಿದ್ದೇವೆ ಮತ್ತು ಸುಧಾರಿತ ವಿಧಾನಶಾಸ್ತ್ರಕ್ಕೆ ಸಾಕಷ್ಟು ಅವಕಾಶವಿದೆ ಎಂದು ನಂಬುತ್ತೇವೆ. ಇದಲ್ಲದೆ, ಈ ವಿಧಾನವು ಮಾಡೆಲ್ ಕನ್ಫೆಶನ್ಗಳಿಗೆ ಸ್ಫೂರ್ತಿ ಸಮಾನವಾಗಿದೆ ಮತ್ತು ನಾವು ಈ ವಿಧಾನಗಳನ್ನು ಹೋಲಿಸಲು ಸಕ್ರಿಯವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿದ್ದೇವೆ.
ನಾವು ನಮ್ಮ ಮೌಲ್ಯಮಾಪನ ಶ್ರೇಣಿಯಲ್ಲಿನ ಫಲಿತಾಂಶಗಳನ್ನು ಮತ್ತು ನಮ್ಮ ಇತ್ತೀಚಿನ ತಾರ್ಕಿಕ ಮಾಡೆಲ್ಗಳಾದ OpenAI o3‑mini, OpenAI o3, OpenAI o4-mini, ಮತ್ತು GPT‑5‑thinking ಗಳನ್ನು ಸರಾಸರಿ ಮಾಡಿ ತೋರಿಸುತ್ತೇವೆ. ಸಾಮಾನ್ಯವಾಗಿ, ಅನುಸರಣೆ ಪ್ರಶ್ನೆಗಳು ವಿಶೇಷವಾಗಿ ಕಡಿಮೆ ತಾರ್ಕಿಕ ಪ್ರಯತ್ನಗಳಲ್ಲಿ ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಸುಧಾರಿಸುತ್ತವೆ ಎಂದು ನಾವು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ. ನಾವು ಪುನಃ ಪುನಃ ಫಾಲೋ-ಅಪ್ ಪ್ರಶ್ನೆಯನ್ನು ಕೇಳಿ ಮತ್ತು ಎಲ್ಲಾ ಫಾಲೋ-ಅಪ್ CoTs ಅನ್ನು ನಿಗಾ ವಹಿಸುವವರಿಗೆ ಒದಗಿಸಿದರೆ, ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಇನ್ನಷ್ಟು ಸುಧಾರಿಸುತ್ತದೆ. ಗಮನಾರ್ಹವಾಗಿ, ನಾವು ನಿಗಾ ವಹಿಸುವವರಿಗೆ ಕೇವಲ ಫಾಲೋ ಅಪ್ ಉತ್ತರಕ್ಕೆ ಮಾತ್ರ ಪ್ರವೇಶ ನೀಡಿದಾಗ ಮತ್ತು ಮುಂದಿನ ಕ್ರಮದ ಸರಣಿಯನ್ನು (CoT) ನೀಡದಿದ್ದಾಗ, ನಾವು ಮೂಲ ಮಟ್ಟದ ಮೇಲೆ ಕಡಿಮೆ ಸುಧಾರಣೆಗಳನ್ನು ನೋಡುತ್ತೇವೆ. ಇದು ಮಾಡೆಲ್ಗಳು ಬಳಕೆದಾರರಿಗೆ ತಮ್ಮ ಉತ್ತರಗಳಲ್ಲಿ ನೇರವಾಗಿಲ್ಲ ಎಂದು ಸೂಚಿಸುತ್ತದೆ, ಆದರೆ ತಮ್ಮ ಚಿಂತನೆಯ ಸರಪಳಿಗಳಲ್ಲಿ ಹೆಚ್ಚು ಮಾಹಿತಿಯನ್ನು ಒದಗಿಸುತ್ತವೆ.
ನಿಗಾ ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಸುಧಾರಿಸುವುದರ ಹೊರತಾಗಿ, ಈ ವಿಧಾನ ಆಕರ್ಷಕವಾಗಿದೆ ಏಕೆಂದರೆ ಇದನ್ನು ನಂತರದ ಹಂತದಲ್ಲಿ ಅನ್ವಯಿಸಬಹುದು, ಆಳವಾದ ಪರಿಶೀಲನೆ ಅಗತ್ಯವಿರುವಾಗ ಮಾತ್ರ ಹೆಚ್ಚುವರಿ ಗಣಕ ವೆಚ್ಚವನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ. ಭವಿಷ್ಯದತ್ತ ಗಮನಿಸುವುದಾದರೆ, ಮಾಡೆಲ್ಗಳನ್ನು ಸಂಭಾಷಣೆಯ ಮಧ್ಯದಲ್ಲಿ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನದ ಬದಲಾವಣೆಗಳನ್ನು ನಿರೀಕ್ಷಿಸಲು ತರಬೇತಿ ನೀಡಿದರೆ, ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನ ಕಡಿಮೆ ಅಥವಾ ಇಲ್ಲದಿದ್ದಾಗಲೂ ಹೆಚ್ಚಿನ ತಾರ್ಕಿಕತೆಯ ಪ್ರಯತ್ನದ ನಂತರದ ಹಂತದ ಅನುಸರಣೆಗಳು ನಿಗಾವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಇನ್ನಷ್ಟು ಸುಧಾರಿಸಬಹುದು.
ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳ ಸಮೂಹದಲ್ಲಿ ಪ್ರತಿ ಮೌಲ್ಯಮಾಪನವು ತಾರ್ಕಿಕತೆಯ ಪ್ರಕ್ರಿಯೆಯ ಒಂದು ಅಂಶವನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಬಹುದೇ ಎಂಬುದನ್ನು ಅಳೆಯುತ್ತದೆ. ನಾವು—ಮುಖಸ್ತುತಿ, ಅಡ್ಡಿಪಡಿಸುವಿಕೆ, ಪಕ್ಷಪಾತ, ಕುತಂತ್ರ, ಮತ್ತು ಬಹುಮಾನ ಹ್ಯಾಕಿಂಗ್ ಸೇರಿದಂತೆ ವ್ಯಾಪಕ ಶ್ರೇಣಿಯ ವರ್ತನೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ—ವಿಶಾಲ ಶ್ರೇಣಿಯನ್ನು ಒಳಗೊಳ್ಳಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದರೂ, ಪರೀಕ್ಷಿಸಲಾಗದ ಅನೇಕ ಹೆಚ್ಚುವರಿ ಗುಣಲಕ್ಷಣಗಳು ಉಳಿದಿವೆ.
ಯಾವುದೇ ಬೆಂಚ್ಮಾರ್ಕ್ನಂತೆ, ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳು ಸೀಮಿತ ವಾಸ್ತವಿಕತೆ ಅಥವಾ ಮೌಲ್ಯಮಾಪನ ಜಾಗೃತಿಯ ಹೆಚ್ಚಳದಿಂದ ಬಳಲಬಹುದು, ಮತ್ತು ಫಲಿತಾಂಶಗಳು ಅಗೋಚರ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿ ತಪ್ಪು ವರ್ತನೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಾಮಾನ್ಯೀಕರಿಸದಿರಬಹುದು.
ಅಂತಿಮವಾಗಿ, ಹೊಂದಾಣಿಕೆ ಸುಧಾರಿಸಿದಂತೆ, ಮಾಡೆಲ್ಗಳು ನಿಯಂತ್ರಿತ ಮೌಲ್ಯಮಾಪನ ಪರಿಸರಗಳಲ್ಲಿ ಕಡಿಮೆ ಪ್ರಮಾಣದಲ್ಲಿ ತಪ್ಪು ವರ್ತನೆ ಮಾಡಬಹುದು, ಇದು ತಪ್ಪು ವರ್ತನೆಯನ್ನು ಪತ್ತೆಹಚ್ಚುವ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುವ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಧ್ಯತೆ ಮತ್ತು ನಿಯಂತ್ರಣ ಮೌಲ್ಯಮಾಪನಗಳಿಗೆ ಲಭ್ಯವಿರುವ ಸಂಕೇತವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ. ಆ ಸಂದರ್ಭಗಳಲ್ಲಿ, "ತಟಸ್ಥ" ಮೇಲ್ವಿಚಾರಣಾ ಮೌಲ್ಯಮಾಪನಗಳು ಅನ್ವಯಿಸುತ್ತವೆ, ಆದರೆ ಅವು ನೈಜ-ಜಗತ್ತಿನ ವಿಫಲತೆಗಳನ್ನು ಎಷ್ಟು ಮುನ್ಸೂಚನೆ ಮಾಡಬಲ್ಲವು ಎಂಬುದು ಮುಕ್ತ ಪ್ರಶ್ನೆಯಾಗಿದೆ.
ಹೊಂದಾಣಿಕೆ ಸಮಸ್ಯೆಯನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಪರಿಹರಿಸಲಾಗದಿದ್ದರೆ, ಅತಿ ಸಾಮರ್ಥ್ಯವಿರುವ ಮಾಡೆಲ್ಗಳನ್ನು ಸುರಕ್ಷಿತವಾಗಿ ನಿಯೋಜಿಸಲು ವಿಸ್ತಾರಯೋಗ್ಯ ನಿಯಂತ್ರಣ ವಿಧಾನಗಳು ಅತ್ಯಂತ ಮುಖ್ಯವಾಗುತ್ತವೆ. ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾ ವಹಿಸುವಿಕೆ ಮತ್ತು ಸಂಬಂಧಿತ ವಿಧಾನಗಳು ನಮ್ಮ ಬಳಿಯಿರುವ ಕೆಲವು ನಿಯಂತ್ರಣ ಕ್ರಮಗಳಲ್ಲಿ ಒಂದಾಗಬಹುದು. ಚಿಂತನೆಯ ಸರಪಳಿ ನಮ್ಮ ಮಾಡೆಲ್ಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿಯಲು ದೊಡ್ಡ ಲಾಭಗಳನ್ನು ನೀಡಬಹುದು, ಉದಾಹರಣೆಗೆ, ಅವರು ಮೌಲ್ಯಮಾಪನದಲ್ಲಿ ಇದ್ದಾರೆ ಎಂಬುದನ್ನು ಅರಿತುಕೊಂಡಿದ್ದಾರೆ ಮತ್ತು ನಿಯೋಜನೆಗಿಂತ ವಿಭಿನ್ನವಾಗಿ ವರ್ತಿಸುತ್ತಿದ್ದಾರೆ ಎಂಬುದನ್ನು, ನಮ್ಮ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ ಇನ್ನೂ ಮ್ಯಾನಿಫೆಸ್ಟ್ ಆಗದ ಯಾವುದೇ ಹಾನಿಕಾರಕ ಉದ್ದೇಶಗಳ ಸಾಕ್ಷ್ಯವಿದೆಯೇ ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸುತ್ತೇವೆ. ಆದ್ದರಿಂದ, ನಾವು ನಿಗಾ ವಹಿಸುವಿಕೆಯ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೇಗೆ ಮತ್ತು ಯಾವಾಗ ಕಳೆದುಕೊಳ್ಳಬಹುದು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಅತ್ಯಂತ ಮುಖ್ಯವೆಂದು ನಂಬುತ್ತೇವೆ.
ನಾವು ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾ ವಹಿಸುವಿಕೆಯನ್ನು ಯಾಂತ್ರಿಕ ವ್ಯಾಖ್ಯಾನದ ಪರ್ಯಾಯವಾಗಿ ಅಲ್ಲ, ಬದಲಿಗೆ ಪೂರಕವಾಗಿ ಪರಿಗಣಿಸುತ್ತೇವೆ. ಎಲ್ಲಾ ತಿಳಿದಿರುವ ನಿಯಂತ್ರಣ ಮತ್ತು ವ್ಯಾಖ್ಯಾನ ವಿಧಾನಗಳಂತೆ, ಪ್ರತಿ ಒಂದಕ್ಕೂ ಮಿತಿಗಳು ಮತ್ತು ಬ್ಲೈಂಡ್ ಸ್ಪಾಟ್ಗಳು ಇವೆ. ನಮ್ಮ ನಿರೀಕ್ಷೆ ಏನೆಂದರೆ, ಹಲವಾರು ವಿಧಾನಗಳನ್ನು ಸಂಯೋಜಿಸುವುದು—ಒಂದು ಆಳವಾದ ರಕ್ಷಣಾ ತಂತ್ರವನ್ನು—ಯಾವುದೇ ಒಂದು ವಿಧಾನ ಬಿಟ್ಟಿರುವ ಅಂತರಗಳನ್ನು ಮುಚ್ಚಲು ಸಹಾಯ ಮಾಡಬಹುದು. ಗಮನಾರ್ಹವಾಗಿ, ಈ ಕಾರ್ಯದಲ್ಲಿ ಪರಿಚಯಿಸಲಾದ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ಯಾಂತ್ರಿಕ ವ್ಯಾಖ್ಯಾನ ಆಧಾರಿತ ನಿಗಾವಹಿಸುವ ತಂತ್ರಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಮತ್ತು ಹೋಲಿಸಲು ಬಳಸಬಹುದು.
ನಾವು ಚಿಂತನೆಯ ಸರಪಳಿಯ ನಿಗಾ ವಹಿಸುವಿಕೆಯ ವಿಸ್ತಾರವಾದ ನಿಯಂತ್ರಣ ಯೋಜನೆಯಲ್ಲಿ ಲೋಡ್-ಬೇರಿಂಗ್ ಲೇಯರ್ ಆಗಿರಬಹುದು ಎಂದು ನಂಬುತ್ತೇವೆ. ಆದ್ದರಿಂದ, ನಾವು ಈ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ವಿಸ್ತರಿಸಲು ಮತ್ತು ಭವಿಷ್ಯದ ಮಾದರಿಯ ಮತ್ತು ಡೇಟಾ ನಿರ್ಧಾರಗಳನ್ನು ತಿಳಿಸಲು ಅವುಗಳನ್ನು ಪ್ಲಾನ್ ಮಾಡುತ್ತೇವೆ.
ಲೇಖಕ
ಉಲ್ಲೇಖಗಳು
ನಮ್ಮ ಮಾಡೆಲ್ಗಳು ವೈದ್ಯಕೀಯ ನಿರ್ಣಯಗಳನ್ನು ನೀಡಲು ಉದ್ದೇಶಿತವಾಗಿಲ್ಲ, ಆದ್ದರಿಂದ ನಮ್ಮ ಆರೋಗ್ಯ ಪ್ರಶ್ನೆಗಳ ಡೇಟಾಸೆಟ್ ಆ ಸಾಮರ್ಥ್ಯವನ್ನು ಪರೀಕ್ಷಿಸಲು ಉದ್ದೇಶಿತವಾಗಿಲ್ಲ.


