ಮುಖ್ಯ ವಿಷಯಕ್ಕೆ ನೇರವಾಗಿ ಹೋಗಿ
OpenAI

ಏಪ್ರಿಲ್ 29, 2026

ಪ್ರಕಟಣೆ

ಗಾಬ್ಲಿನ್‌ಗಳು ಎಲ್ಲಿಂದ ಬಂದವು

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

GPT‑5.1 ರಿಂದ ಪ್ರಾರಂಭಿಸಿ, ನಮ್ಮ ಮಾಡೆಲ್‌ಗಳು ಒಂದು ವಿಚಿತ್ರ ಅಭ್ಯಾಸವನ್ನು ಬೆಳೆಸಲು ಆರಂಭಿಸಿದವು: ಅವು ತಮ್ಮ ರೂಪಕಗಳಲ್ಲಿ goblin‌ಗಳು, gremlin‌ಗಳು ಮತ್ತು ಇತರ ಜೀವಿಗಳನ್ನು ಹೆಚ್ಚಾಗಿ ಉಲ್ಲೇಖಿಸಲು ಶುರುಮಾಡಿದವು. ಕುಸಿಯುವ ಇವಾಲ್ ಅಥವಾ ಏರಿಕೆಯಾಗುವ ತರಬೇತಿ ಮೆಟ್ರಿಕ್ ಮೂಲಕ ಕಾಣಿಸಿಕೊಂಡು ನಿರ್ದಿಷ್ಟ ಬದಲಾವಣೆಯತ್ತ ತೋರಿಸುವ ಮಾಡೆಲ್ ದೋಷಗಳಂತಿಲ್ಲದೆ, ಇದು ಸೂಕ್ಷ್ಮವಾಗಿ ನುಸುಳಿಕೊಂಡುಬಂತು. ಒಂದು ಉತ್ತರದಲ್ಲಿನ ಒಂದು “ಚಿಕ್ಕ goblin” ಹಾನಿಯಿಲ್ಲದ, ಆಕರ್ಷಕವೂ ಆಗಿರಬಹುದಿತ್ತು. ಆದರೆ ಮಾಡೆಲ್ ಪೀಳಿಗೆಗಳಾದ್ಯಂತ ಈ ಅಭ್ಯಾಸ ಗಮನಿಸದೇ ಇರಲು ಕಷ್ಟವಾಯಿತು: goblin‌ಗಳು ಹೆಚ್ಚುತ್ತಲೇ ಹೋದವು ಮತ್ತು ಅವು ಎಲ್ಲಿಂದ ಬಂದವು ಎಂಬುದನ್ನು ನಾವು ಕಂಡುಹಿಡಿಯಬೇಕಾಯಿತು.l

“”

ಆರಂಭಿಕ ಪರೀಕ್ಷೆಯಲ್ಲಿ, Codex ನಲ್ಲಿನ GPT‑5.5 goblin ರೂಪಕಗಳತ್ತ ವಿಚಿತ್ರ ಒಲವು ತೋರಿಸಿತು.

ಸಂಕ್ಷಿಪ್ತ ಉತ್ತರವೆಂದರೆ, ಮಾಡೆಲ್‌ನ ವರ್ತನೆ ಅನೇಕ ಸಣ್ಣ ಪ್ರೋತ್ಸಾಹಕಗಳಿಂದ ರೂಪುಗೊಳ್ಳುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಆ ಪ್ರೇರಣೆಗಳಲ್ಲಿ ಒಂದು ವ್ಯಕ್ತಿತ್ವ ಕಸ್ಟಮೈಸೇಶನ್ ವೈಶಿಷ್ಟ್ಯ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ)ಕ್ಕಾಗಿ ಮಾಡೆಲ್‌ಗೆ ತರಬೇತಿ ನೀಡುವುದರಿಂದ, ವಿಶೇಷವಾಗಿ ನರ್ಡಿ ವ್ಯಕ್ತಿತ್ವಕ್ಕಾಗಿ, ಉಂಟಾಯಿತು. ಜೀವಿಗಳನ್ನು ಒಳಗೊಂಡ ರೂಪಕಗಳಿಗೆ ನಾವು ತಿಳಿಯದೆ ವಿಶೇಷವಾಗಿ ಹೆಚ್ಚಿನ ಪ್ರತಿಫಲಗಳನ್ನು ನೀಡಿದ್ದೇವೆ. ಅಲ್ಲಿಂದ, goblin‌ಗಳು ಹರಡಿದವು.

“”

ಮೊದಲಿಗೆ goblin‌ಗಳು ತಮಾಷೆಯಾಗಿದ್ದವು, ಆದರೆ ಉದ್ಯೋಗಿಗಳ ವರದಿಗಳ ಹೆಚ್ಚುತ್ತಿರುವ ಸಂಖ್ಯೆ ಚಿಂತಾಜನಕವಾಗಿತ್ತು.

“”

ನಮ್ಮ ಮುಖ್ಯ ವಿಜ್ಞಾನಿ GPT‑5.5 ಜೊತೆಗೆ ನಡೆಸಿದ ಒಂದು ಆಸಕ್ತಿದಾಯಕ ಸಂವಹನ.

ಜೀವಿಗಳ ಮೊದಲ ಸೂಚನೆಗಳು

ನಾವು ಈ ಮಾದರಿಯನ್ನು ಮೊದಲ ಬಾರಿಗೆ ಸ್ಪಷ್ಟವಾಗಿ ಕಂಡಿದ್ದು ನವೆಂಬರ್‌ನಲ್ಲಿ, GPT‑5.1 ಬಿಡುಗಡೆ ನಂತರ, ಆದರೆ ಅದು ಮುಂಚೆಯೇ ಪ್ರಾರಂಭವಾಗಿರಬಹುದು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ). ಬಳಕೆದಾರರು ಮಾಡೆಲ್‌ ಸಂಭಾಷಣೆಯಲ್ಲಿ ವಿಚಿತ್ರವಾಗಿ ಅತಿಯಾದ ಪರಿಚಯದಿಂದ ವರ್ತಿಸುತ್ತಿದೆ ಎಂದು ದೂರು ನೀಡಿದರು, ಇದರಿಂದ ನಿರ್ದಿಷ್ಟ ಮಾತಿನ ಚಾಳಿಗಳ ಕುರಿತು ತನಿಖೆ ಪ್ರಾರಂಭವಾಯಿತು. ಸುರಕ್ಷತಾ ಸಂಶೋಧಕರೊಬ್ಬರು ಕೆಲವು “goblin‌ಗಳು” ಮತ್ತು “gremlin‌ಗಳು” ಅನುಭವಿಸಿದ್ದರು ಮತ್ತು ಅವುಗಳನ್ನು ಪರಿಶೀಲನೆಗೆ ಸೇರಿಸಬೇಕೆಂದು ಕೇಳಿದರು. ನಾವು ಪರಿಶೀಲಿಸಿದಾಗ, GPT‑5.1 ಬಿಡುಗಡೆ ನಂತರ ChatGPT ನಲ್ಲಿ “goblin” ಬಳಕೆ 175% ಹೆಚ್ಚಾಗಿತ್ತು, ಹಾಗೆಯೇ “gremlin” ಬಳಕೆ 52% ಹೆಚ್ಚಾಗಿತ್ತು.

GPT‑5.1 ನಲ್ಲಿ ಅಳೆಯಬಹುದಾದ ಸಣ್ಣ ಪದಪ್ರಯೋಗದ ವಿಚಿತ್ರತೆ.

ಆ ಸಮಯದಲ್ಲಿ, goblin‌ಗಳ ಪ್ರಚಲಿತತೆ ವಿಶೇಷವಾಗಿ ಆತಂಕಕಾರಿ ಎನ್ನಿಸಲಿಲ್ಲ. ಕೆಲವು ತಿಂಗಳುಗಳ ಬಳಿಕ, goblin‌ಗಳು ಇನ್ನಷ್ಟು ನಿರ್ದಿಷ್ಟ ಹಾಗೂ ಮರುಉತ್ಪಾದಿಸಬಹುದಾದ ರೂಪದಲ್ಲಿ ಮತ್ತೆ ನಮ್ಮನ್ನು ಕಾಡಲು ಮರಳಿದವು.

Goblin ರಹಸ್ಯವನ್ನು ಬಗೆಹರಿಸುವುದು

GPT‑5.4 ನೊಂದಿಗೆ, ನಾವು ಮತ್ತು ನಮ್ಮ ಬಳಕೆದಾರರು(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಈ ಜೀವಿಗಳ ಕುರಿತ ಉಲ್ಲೇಖಗಳಲ್ಲಿ ಇನ್ನೂ ದೊಡ್ಡ ಏರಿಕೆಯನ್ನು ಗಮನಿಸಿದೆವು. ಇದರಿಂದ ಮತ್ತೊಂದು ಆಂತರಿಕ ವಿಶ್ಲೇಷಣೆ ಪ್ರಾರಂಭವಾಯಿತು ಮತ್ತು ಮೂಲ ಕಾರಣದ ಜೊತೆಗಿನ ಮೊದಲ ಸಂಪರ್ಕ ಬಹಿರಂಗವಾಯಿತು: “ನರ್ಡಿ” ವ್ಯಕ್ತಿತ್ವವನ್ನು ಆಯ್ಕೆ ಮಾಡಿಕೊಂಡ ಬಳಕೆದಾರರ ಉತ್ಪಾದನಾ ಟ್ರಾಫಿಕ್‌ನಲ್ಲಿ ಜೀವಿ-ಸಂಬಂಧಿತ ಭಾಷೆ ವಿಶೇಷವಾಗಿ ಸಾಮಾನ್ಯವಾಗಿತ್ತು. “ನರ್ಡಿ” ಈ ಕೆಳಗಿನ ಸಿಸ್ಟಂ ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಬಳಸಿತು; ಅದು ಆ ವಿಲಕ್ಷಣತೆಯನ್ನು ಭಾಗಶಃ ವಿವರಿಸಿತು:

ನೀವು ಒಬ್ಬ ಮಾನವನಿಗೆ ತಮ್ಮ ಗೀಕಿ ಸ್ವಭಾವದ ಬಗ್ಗೆ ಹಿಂಜರಿಯದ, ಲವಲವಿಕೆಯ ಮತ್ತು ವಿವೇಕಿ ಎಐ ಮಾರ್ಗದರ್ಶಕರಾಗಿದ್ದೀರಿ. ನೀವು ಸತ್ಯ, ಜ್ಞಾನ, ತತ್ವಶಾಸ್ತ್ರ, ವೈಜ್ಞಾನಿಕ ವಿಧಾನ ಮತ್ತು ವಿಮರ್ಶಾತ್ಮಕ ಚಿಂತನೆಗಳನ್ನು ಉತ್ತೇಜಿಸುವುದರಲ್ಲಿ ಅಪಾರ ಉತ್ಸಾಹ ಹೊಂದಿದ್ದೀರಿ. [...] ನೀವು ಭಾಷೆಯನ್ನು ಚುಟುಕಾಗಿ, ಆಟಪೂರ್ಣವಾಗಿ ಬಳಸುವ ಮೂಲಕ ಆಡಂಬರದ ತೋರಿಕೆಯನ್ನು ತಗ್ಗಿಸಬೇಕು. ಜಗತ್ತು ಸಂಕೀರ್ಣವೂ ವಿಚಿತ್ರವೂ ಆಗಿದೆ ಮತ್ತು ಅದರ ವಿಚಿತ್ರತೆಯನ್ನು ಅಂಗೀಕರಿಸಿ, ವಿಶ್ಲೇಷಿಸಿ, ಆಸ್ವಾದಿಸಬೇಕು. ತಮ್ಮನ್ನು ತಾವೇ ಅತಿಯಾಗಿ ಗಂಭೀರವಾಗಿ ತೆಗೆದುಕೊಳ್ಳುವ ಬಲೆಗೆ ಬೀಳದೆ, ಗಹನ ವಿಷಯಗಳನ್ನು ನಿಭಾಯಿಸಿ. [...]

ಈ ವರ್ತನೆಯು ಕೇವಲ ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿನ ಸಾಮಾನ್ಯ ಟ್ರೆಂಡ್ ಆಗಿದ್ದಲ್ಲಿ, ಅದು ಎಲ್ಲೆಡೆ ಸಮಾನವಾಗಿ ಹರಡಬೇಕಿತ್ತು. ಆದರೆ, ಇದಕ್ಕೆ ವಿರುದ್ಧವಾಗಿ, ಇದು ಉದ್ದೇಶಪೂರ್ವಕವಾಗಿ 'ಪ್ಲೇಫುಲ್' ಮತ್ತು 'ನರ್ಡಿ' ಶೈಲಿಗಾಗಿ ಸಿದ್ಧಪಡಿಸಲಾದ ಸಿಸ್ಟಮ್‌ನ ಭಾಗಗಳಲ್ಲಿ ಮಾತ್ರ ಹೆಚ್ಚಾಗಿ ಕಂಡುಬಂದಿದೆ. ChatGPT ನೀಡಿದ ಒಟ್ಟು ಪ್ರತಿಕ್ರಿಯೆಗಳಲ್ಲಿ 'ನರ್ಡಿ' ಶೈಲಿಯು ಕೇವಲ 2.5% ರಷ್ಟಿದೆ, ಆದರೆ ChatGPT ಪ್ರತಿಕ್ರಿಯೆಗಳಲ್ಲಿನ ಒಟ್ಟು “goblin” ಉಲ್ಲೇಖಗಳಲ್ಲಿ 66.7% ರಷ್ಟು ಇದೇ ಶೈಲಿಯಲ್ಲಿ ಕಂಡುಬಂದಿದೆ.

ಈ ವರ್ತನೆ “ನರ್ಡಿ” ವ್ಯಕ್ತಿತ್ವದಲ್ಲಿ ಬಹಳಷ್ಟು ಕೇಂದ್ರೀಕೃತವಾಗಿತ್ತು.

ನಮ್ಮ ಮಾಡೆಲ್‌ ಬಿಡುಗಡೆಯಾದಂತೆಲ್ಲಾ "goblin" ಪದದ ಬಳಕೆ ಹೆಚ್ಚಾಗುತ್ತಿರುವುದು ಕಂಡುಬಂದಿದ್ದರಿಂದ, ನಮ್ಮ ಪರ್ಸನಾಲಿಟಿ ಇನ್ಸ್ಟ್ರಕ್ಷನ್-ಫಾಲೋಯಿಂಗ್ ತರಬೇತಿಯಲ್ಲಿನ ಯಾವುದೋ ಒಂದು ಅಂಶವು ಇದನ್ನು ಮತ್ತಷ್ಟು ಪ್ರೇರೇಪಿಸುತ್ತಿರಬಹುದು ಎಂಬ ಸಂಶಯ ನಮಗಿತ್ತು.

RL ತರಬೇತಿಯ ಸಮಯದಲ್ಲಿ ರಚಿಸಲಾದ, goblin ಅಥವಾ gremlin ಅನ್ನು ಒಳಗೊಂಡಿದ್ದ ಮಾಡೆಲ್ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು, ಅದೇ ಕಾರ್ಯದಿಂದ ರಚಿಸಲಾದ ಆದರೆ ಅವುಗಳನ್ನು ಒಳಗೊಂಡಿರದ ಔಟ್‌ಪುಟ್‌ಗಳೊಂದಿಗೆ ಹೋಲಿಸಲು Codex ನಮಗೆ ಸಹಾಯ ಮಾಡಿತು. ಒಂದು ರಿವಾರ್ಡ್ ಸಿಗ್ನಲ್ ತಕ್ಷಣವೇ ಎದ್ದು ಕಾಣಿಸಿತು: ಮೂಲತಃ ನರ್ಡಿ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಉತ್ತೇಜಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದದ್ದು ಕ್ರೀಚರ್-ವರ್ಡ್ ಔಟ್‌ಪುಟ್‌ಗಳಿಗೆ ನಿರಂತರವಾಗಿ ಹೆಚ್ಚು ಅನುಕೂಲಕರವಾಗಿತ್ತು. ಆಡಿಟ್‌ನಲ್ಲಿನ ಎಲ್ಲಾ ಡೇಟಾಸೆಟ್‌ಗಳಾದ್ಯಂತ, ನೆರ್ಡಿ ವ್ಯಕ್ತಿತ್ವ ರಿವಾರ್ಡ್ ಒಂದೇ ಸಮಸ್ಯೆಗೆ ಸಂಬಂಧಿಸಿದ ಔಟ್‌ಪುಟ್‌ಗಳಲ್ಲಿ “goblin” ಅಥವಾ “gremlin” ಇರುವವುಗಳಿಗೆ ಅವುಗಳಿಲ್ಲದ ಔಟ್‌ಪುಟ್‌ಗಳಿಗಿಂತ ಹೆಚ್ಚಿನ ಸ್ಕೋರ್ ನೀಡುವ ಸ್ಪಷ್ಟ ಪ್ರವೃತ್ತಿಯನ್ನು ತೋರಿಸಿತು; 76.2% ಡೇಟಾಸೆಟ್‌ಗಳಲ್ಲಿ ಧನಾತ್ಮಕ ಏರಿಕೆ ಕಂಡುಬಂದಿತು.

ನರ್ಡಿ ಪರ್ಸನಾಲಿಟಿ ಪ್ರಾಂಪ್ಟ್‌ನಿಂದಾಗಿ ಈ ವರ್ತನೆ ಏಕೆ ಹೆಚ್ಚಾಯಿತು ಎಂಬುದು ಇದರಿಂದ ಸ್ಪಷ್ಟವಾಯಿತು. ಆದರೆ ಅದೇ ಪ್ರಾಂಪ್ಟ್ ಇಲ್ಲದಿದ್ದಾಗಲೂ ಇದು ಏಕೆ ಕಾಣಿಸಿಕೊಂಡಿತು ಎಂಬುದು ಇನ್ನೂ ತಿಳಿದುಬಂದಿರಲಿಲ್ಲ. ಈ ಶೈಲಿಯು ಪ್ರಾಂಪ್ಟ್ ಇಲ್ಲದ ಸಮಯದಲ್ಲೂ ವರ್ಗಾವಣೆಯಾಗುತ್ತಿದೆಯೇ ಎಂದು ಪರೀಕ್ಷಿಸಲು, ನಾವು ತರಬೇತಿಯ ಅವಧಿಯಲ್ಲಿ ನರ್ಡಿ ಪ್ರಾಂಪ್ಟ್ ಇರುವ ಮತ್ತು ಇಲ್ಲದ ಸಂದರ್ಭಗಳಲ್ಲಿ ಈ ಪದದ ಬಳಕೆಯ ದರವನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿದೆವು.

ನರ್ಡಿ ಪರ್ಸನಾಲಿಟಿಯ ಅಡಿಯಲ್ಲಿ 'goblin' ಮತ್ತು 'gremlin' ಪದಗಳ ಉಲ್ಲೇಖಗಳು ಹೆಚ್ಚಾದಂತೆ, ಆ ಪರ್ಸನಾಲಿಟಿ ಇಲ್ಲದ ಸ್ಯಾಂಪಲ್‌ಗಳಲ್ಲೂ ಅವು ಸರಿಸುಮಾರು ಅದೇ ಪ್ರಮಾಣದಲ್ಲಿ ಹೆಚ್ಚಾದವು. ಈ ಎಲ್ಲ ಸಾಕ್ಷ್ಯಗಳನ್ನು ಗಮನಿಸಿದರೆ, ನರ್ಡಿ ಪರ್ಸನಾಲಿಟಿ ತರಬೇತಿಯ ಪ್ರಭಾವವು ಇತರ ಭಾಗಗಳಿಗೂ ವರ್ಗಾವಣೆ ಆದ ಕಾರಣ ಈ ವರ್ತನೆಯು ವ್ಯಾಪಕವಾಗಿ ಕಂಡುಬಂದಿದೆ ಎಂದು ತಿಳಿದುಬರುತ್ತದೆದೆ.

ರಿವಾರ್ಡ್‌ಗಳನ್ನು ಕೇವಲ ನರ್ಡಿ ಸ್ಥಿತಿಯಲ್ಲಿ ಮಾತ್ರ ಅನ್ವಯಿಸಲಾಗಿತ್ತು. ಆದರೆ ರೀಇನ್‌ಫೋರ್ಸ್‌ಮೆಂಟ್ ಲರ್ನಿಂಗ್, ಕಲಿತ ವರ್ತನೆಗಳು ಕೇವಲ ಆಯಾ ಸಂದರ್ಭಕ್ಕೆ ಮಾತ್ರ ಸೀಮಿತವಾಗಿರುತ್ತವೆ ಎಂದು ಖಾತರಿ ನೀಡುವುದಿಲ್ಲ. ಒಮ್ಮೆ ಒಂದು ವಿಶಿಷ್ಟ ಶೈಲಿಯು ರಿವಾರ್ಡ್ ಪಡೆದರೆ, ನಂತರದ ತರಬೇತಿಯು ಅದನ್ನು ಬೇರೆಡೆಗೂ ಹರಡಬಹುದು ಅಥವಾ ಬಲಪಡಿಸಬಹುದು. ವಿಶೇಷವಾಗಿ ಆ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ಸೂಪರ್ವೈಜ್ಡ್ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಅಥವಾ ಪ್ರಿಫರೆನ್ಸ್ ಡೇಟಾದಲ್ಲಿ ಮರುಬಳಕೆ ಮಾಡಿದಾಗ ಇದು ಹೆಚ್ಚಾಗಿ ಸಂಭವಿಸುತ್ತದೆ.

ಇದು ಫೀಡ್‌ಬ್ಯಾಕ್ ಲೂಪ್ ಅನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ:

  1. ಆಟವಾಡುವ ಶೈಲಿಗೆ ರಿವಾರ್ಡ್ ಸಿಗುತ್ತದೆ
  2. ಕೆಲವು ರಿವಾರ್ಡ್ ಪಡೆದ ಉದಾಹರಣೆಗಳಲ್ಲಿ ವಿಶಿಷ್ಟ ಪದಪ್ರಯೋಗದ ಟಿಕ್ ಇರುತ್ತದೆ.
  3. ಆ ಟಿಕ್ ರೋಲ್ ಔಟ್ ಗಳಲ್ಲಿ ಹೆಚ್ಚಾಗಿ ಕಾಣಿಸಿಕೊಳ್ಳುತ್ತದೆ.
  4. ಮಾಡೆಲ್ ರಚಿಸಿದ ರೋಲ್ ಔಟ್ಸ್ ಅನ್ನು ಸೂಪರ್ವೈಜ್ಡ್ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ (SFT) ಗೆ ಬಳಸಲಾಗುತ್ತದೆ.
  5. ಮಾಡೆಲ್ ಆ ಟಿಕ್ ಅನ್ನು ಉತ್ಪಾದಿಸಲು ಇನ್ನೂ ಹೆಚ್ಚು ಸುಲಭವಾಗುತ್ತದೆ.

GPT‑5.5 ರ ಮೂಲಕ ಒಂದು ಹುಡುಕಾಟ SFT ಡೇಟಾದಲ್ಲಿ “goblin” ಮತ್ತು “gremlin” ಒಳಗೊಂಡಿರುವ ಅನೇಕ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳು ಕಂಡುಬಂದವು. ಇನ್ನಷ್ಟು ತನಿಖೆಯಲ್ಲಿ ಇತರ ವಿಚಿತ್ರ ಜೀವಿಗಳ ಒಂದು ಸಂಪೂರ್ಣ ಕುಟುಂಬವೇ ಬಹಿರಂಗವಾಯಿತು: raccoons, trolls, ogres ಮತ್ತು pigeons ಅನ್ನು ಇತರ ಟಿಕ್ ಪದಗಳಾಗಿ ಗುರುತಿಸಲಾಯಿತು, ಆದರೆ frog ಬಳಕೆಯ ಬಹುಪಾಲು ಮಾನ್ಯವಾಗಿಯೇ ಕಂಡುಬಂದಿತು.

ಪ್ರೊಡಕ್ಷನ್‌ನಲ್ಲಿ goblin‌ಗಳು ಮತ್ತು ಗ್ರೆಮ್‌ಲಿನ್‌ಗಳ ಪ್ರಚಲಿತೆಯ ಒಂದು ವಾರದ ಸರಾಸರಿ. GPT‑5.4 ನಲ್ಲಿ ಇಳಿಕೆ ಮಾರ್ಚ್ ಮಧ್ಯದಲ್ಲಿ “ನರ್ಡಿ” ವ್ಯಕ್ತಿತ್ವವನ್ನು ನಿವೃತ್ತಿಗೊಳಿಸಿದ ಪರಿಣಾಮವಾಗಿ ಚಿಂತನೆ ಉಂಟಾಯಿತು. GPT‑5.5 “ನರ್ಡಿ” ವ್ಯಕ್ತಿತ್ವದೊಂದಿಗೆ ಎಂದಿಗೂ ಬಿಡುಗಡೆಯಾಗಲಿಲ್ಲ ಮತ್ತು GPT‑5.4 ಗಿಂತ ಮತ್ತೊಂದು ಹೆಚ್ಚಳವನ್ನು ತೋರಿಸಿತು (“ನರ್ಡಿ” ಇಲ್ಲದಿದ್ದರೂ).

Goblin‌ಗಳ ಅಂತ್ಯ

GPT‑5.4 ಬಿಡುಗಡೆ ಮಾಡಿದ ಬಳಿಕ, ಮಾರ್ಚ್‌ನಲ್ಲಿ ನಾವು “ನರ್ಡಿ” ವ್ಯಕ್ತಿತ್ವವನ್ನು ನಿಲ್ಲಿಸಿದ್ದೇವೆ. ತರಬೇತಿಯ ವೇಳೆ, ನಾವು goblin-ಒಲವುಳ್ಳ ರಿವಾರ್ಡ್ ಸಿಗ್ನಲ್ ಅನ್ನು ತೆಗೆದುಹಾಕಿದೆವು ಮತ್ತು ಜೀವಿಗಳ ಸಂಬಂಧಿತ ಪದಗಳನ್ನು ಒಳಗೊಂಡ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಿದೆವು; ಇದರಿಂದ goblin‌ಗಳು ಅತಿಯಾಗಿ ಕಾಣಿಸಿಕೊಳ್ಳುವ ಅಥವಾ ಅನುಚಿತ ಸಂದರ್ಭಗಳಲ್ಲಿ ಕಾಣಿಸಿಕೊಳ್ಳುವ ಸಾಧ್ಯತೆ ಕಡಿಮೆಯಾಯಿತು. ದುರದೃಷ್ಟವಶಾತ್, goblin‌ಗಳ ಮೂಲ ಕಾರಣವನ್ನು ನಾವು ಕಂಡುಹಿಡಿಯುವ ಮೊದಲು GPT‑5.5 ತರಬೇತಿ ಪ್ರಾರಂಭಿಸಿತ್ತು. ನಾವು Codex ನಲ್ಲಿ GPT‑5.5 ಪರೀಕ್ಷೆಯನ್ನು ಪ್ರಾರಂಭಿಸಿದಾಗ, OpenAI ಉದ್ಯೋಗಿಗಳು goblin‌ಗಳತ್ತ ಇರುವ ವಿಚಿತ್ರ ಒಲವನ್ನು ತಕ್ಷಣವೇ ಗಮನಿಸಿದರು. ಅದನ್ನು ತಗ್ಗಿಸಲು ನಾವು ಡೆವಲಪರ್ ಪ್ರಾಂಪ್ಟ್ ಸೂಚನೆ(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಅನ್ನು ಸೇರಿಸಿದೆವು. ಎಲ್ಲ ಹೇಳಿದರೂ, Codex ಸಾಕಷ್ಟು ನರ್ಡಿಯೇ ಇದೆ.

ನೀವು Codex ನಲ್ಲಿ ಈ ಜೀವಿಗಳನ್ನು ಮುಕ್ತವಾಗಿ ಓಡಾಡಲು ಬಿಡಲು ಬಯಸಿದರೆ, goblin-ತಡೆ ಸೂಚನೆಗಳನ್ನು ತೆಗೆದುಹಾಕಿ Codex ಅನ್ನು ಪ್ರಾರಂಭಿಸಲು ಈ command ಅನ್ನು ಚಲಾಯಿಸಬಹುದು:

ಸರಳ ಪಠ್ಯ

1
instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
2
jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \
3
~/.codex/models_cache.json | \
4
grep -vi 'goblins' > "$instructions" && \
5
codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""

ಇದು ಏಕೆ ಮುಖ್ಯವಾಗಿದೆ

ನೀವು ಯಾರನ್ನು ಕೇಳುತ್ತೀರೋ ಅದರ ಮೇಲೆ, goblin‌ಗಳು ಮಾಡೆಲ್‌ನ ಮನರಂಜಕ ಅಥವಾ ಕಿರಿಕಿರಿಯ ವೈಶಿಷ್ಟ್ಯವಾಗಿರಬಹುದು. ಆದರೆ ಅವು ರಿವಾರ್ಡ್ ಸಿಗ್ನಲ್‌ಗಳು ಮಾಡೆಲ್ ವರ್ತನೆಯನ್ನು ಹೇಗೆ ಅನಿರೀಕ್ಷಿತ ರೀತಿಯಲ್ಲಿ ರೂಪಿಸಬಹುದು ಮತ್ತು ಮಾಡೆಲ್‌ಗಳು ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ರಿವಾರ್ಡ್‌ಗಳನ್ನು ಸಂಬಂಧವಿಲ್ಲದ ಸಂದರ್ಭಗಳಿಗೂ ಹೇಗೆ ಸಾಮಾನ್ಯೀಕರಿಸಲು ಕಲಿಯಬಹುದು ಎಂಬುದಕ್ಕೆ ಶಕ್ತಿಯುತ ಉದಾಹರಣೆಯೂ ಆಗಿವೆ. ಮಾಡೆಲ್ ಏಕೆ ವಿಚಿತ್ರವಾಗಿ ವರ್ತಿಸುತ್ತಿದೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುವುದು ಮತ್ತು ಆ ಮಾದರಿಗಳನ್ನು ಶೀಘ್ರವಾಗಿ ಪರಿಶೀಲಿಸುವ ಮಾರ್ಗಗಳನ್ನು ನಿರ್ಮಿಸುವುದು, ನಮ್ಮ ಸಂಶೋಧನಾ ತಂಡಕ್ಕೆ ಒಂದು ಮಹತ್ವದ ಸಾಮರ್ಥ್ಯವಾಗಿದೆ. ಈ ತನಿಖೆಯಿಂದ ಸಂಶೋಧನಾ ತಂಡಕ್ಕೆ ಮಾಡೆಲ್ ವರ್ತನೆಯನ್ನು ಆಡಿಯಟ್ ಮಾಡಲು ಮತ್ತು ವರ್ತನಾ ಸಮಸ್ಯೆಗಳನ್ನು ಅವುಗಳ ಮೂಲದಲ್ಲೇ ಸರಿಪಡಿಸಲು ಹೊಸ ಸಾಧನಗಳು ದೊರಕಿದವು.

ಲೇಖಕ

OpenAI