ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

29 ਅਪ੍ਰੈਲ 2026

ਪ੍ਰਕਾਸ਼ਨ

ਗੋਬਲਿਨ ਕਿੱਥੋਂ ਆਏ ਸਨ

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

GPT‑5.1 ਤੋਂ ਸ਼ੁਰੂ ਕਰਦੇ ਹੋਏ, ਸਾਡੇ ਮਾਡਲਾਂ ਵਿੱਚ ਇੱਕ ਅਜੀਬ ਆਦਤ ਵਿਕਸਿਤ ਹੋਣੀ ਸ਼ੁਰੂ ਹੋ ਗਈ: ਉਹ ਆਪਣੇ ਅਲੰਕਾਰਾਂ ਵਿੱਚ ਗੋਬਲਿਨ, ਗ੍ਰੇਮਲਿਨ ਅਤੇ ਹੋਰ ਜੀਵਾਂ ਦਾ ਜ਼ਿਕਰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲੱਗ ਪਏ। ਮਾਡਲ ਬੱਗਾਂ ਦੇ ਉਲਟ ਜੋ ਇੱਕ ਡਿੱਗਦੇ ਹੋਏ ਮੁਲਾਂਕਣ ਜਾਂ ਵਧਦੇ ਹੋਏ ਸਿਖਲਾਈ ਮੈਟ੍ਰਿਕ ਰਾਹੀਂ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ ਅਤੇ ਕਿਸੇ ਖਾਸ ਤਬਦੀਲੀ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦੇ ਹਨ, ਇਹ ਬੱਗ ਚੁੱਪ-ਚੁਪੀਤੇ ਅੰਦਰ ਆ ਗਿਆ ਸੀ। ਇੱਕ ਜਵਾਬ ਵਿੱਚ ਇੱਕ 'ਛੋਟਾ ਗੋਬਲਿਨ' ਨੁਕਸਾਨ ਰਹਿਤ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਦਿਲਕਸ਼ ਵੀ ਹੋ ਸਕਦਾ ਸੀ। ਮਾਡਲ ਦੀਆਂ ਵੱਖ-ਵੱਖ ਪੀੜ੍ਹੀਆਂ ਵਿੱਚ ਇਹ ਰੁਝਾਨ ਅਣਡਿੱਠਾ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੋ ਗਿਆ: ਗੋਬਲਿਨਾਂ ਦੀ ਗਿਣਤੀ ਲਗਾਤਾਰ ਵਧਦੀ ਰਹੀ, ਅਤੇ ਅਸੀਂ ਇਹ ਪਤਾ ਲਗਾਉਣਾ ਸੀ ਕਿ ਉਹ ਕਿੱਥੋਂ ਆਏ ਸਨ।

""

ਸ਼ੁਰੂਆਤੀ ਟੈਸਟਿੰਗ ਵਿੱਚ, Codex ਵਿੱਚ GPT‑5.5 ਨੇ ਗੋਬਲਿਨ ਰੂਪਕਾਂ ਪ੍ਰਤੀ ਇੱਕ ਅਜੀਬ ਰੁਝਾਨ ਦਿਖਾਇਆ।

ਛੋਟਾ ਜਿਹਾ ਜਵਾਬ ਇਹ ਹੈ ਕਿ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਬਹੁਤ ਸਾਰੇ ਛੋਟੋ-ਛੋਟੇ ਪ੍ਰੋਤਸਾਹਨਾਂ ਦੁਆਰਾ ਆਕਾਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਉਹਨਾਂ ਪ੍ਰੋਤਸਾਹਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਵਿਅਕਤੀਤਵ ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ ਫੀਚਰ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਲਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿੰਦੇ ਹੋਏ ਆਇਆ, ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਨਰਡੀ ਵਿਅਕਤੀਤਵ ਲਈ। ਅਸੀਂ ਅਣਜਾਣੇ ਵਿੱਚ ਜੀਵਾਂ ਵਾਲੇ ਅਲੰਕਾਰਾਂ ਲਈ ਖਾਸ ਤੌਰ ਤੇ ਉੱਚ ਇਨਾਮ ਦੇ ਦਿੱਤੇ ਸਨ। ਉੱਥੋਂ, ਗੋਬਲਿਨ ਫੈਲ ਗਏ।

""

ਗੋਬਲਿਨ ਪਹਿਲਾਂ ਤਾਂ ਮਜ਼ਾਕੀਆ ਲੱਗਦੇ ਸਨ, ਪਰ ਕਰਮਚਾਰੀਆਂ ਦੀ ਵਧ ਰਹੀਆਂ ਰਿਪੋਰਟਾਂ ਦੀ ਗਿਣਤੀ ਚਿੰਤਾ ਜਨਕ ਬਣ ਗਈ।

""

ਸਾਡੇ ਮੁੱਖ ਵਿਗਿਆਨੀ ਦੀ GPT‑5.5 ਨਾਲ ਹੋਈ ਇੱਕ ਦਿਲਚਸਪ ਗੱਲਬਾਤ ਹੋਈ ਸੀ।

ਜੀਵਾਂ ਦੀਆਂ ਪਹਿਲੀਆਂ ਨਿਸ਼ਾਨੀਆਂ

ਅਸੀਂ ਇਹ ਤਰਤੀਬ ਪਹਿਲੀ ਵਾਰ ਨਵੰਬਰ ਵਿੱਚ, GPT‑5.1 ਦੇ ਲਾਂਚ ਤੋਂ ਬਾਅਦ, ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਦੇਖੀ ਸੀ, ਹਾਲਾਂਕਿ ਸ਼ਾਇਦ ਇਹ ਸ਼ਾਇਦ ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਸ਼ੁਰੂ ਹੋੋਇਆ ਹੋਵੇ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ)। ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਗੱਲਬਾਤ ਵਿੱਚ ਮਾਡਲ ਦੇ ਅਜੀਬ ਤੌਰ 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਜਾਣੂ ਹੋਣ ਬਾਰੇ ਸ਼ਿਕਾਇਤ ਕੀਤੀ, ਜਿਸ ਨੇ ਖਾਸ ਜ਼ੁਬਾਨੀ ਖਾਮੀਆਂ ਦੀ ਜਾਂਚ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ। ਇੱਕ ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾ ਨੇ ਕੁਝ “ਗੋਬਲਿਨ” ਅਤੇ “ਗ੍ਰੈਮਲਿਨ” ਦਾ ਸਾਹਮਣਾ ਕੀਤਾ ਸੀ ਅਤੇ ਬੇਨਤੀ ਕੀਤੀ ਕਿ ਉਨ੍ਹਾਂ ਨੂੰ ਜਾਂਚ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾਵੇ। ਜਦੋਂ ਅਸੀਂ ਵੇਖਿਆ, ਤਾਂ GPT‑5.1 ਦੇ ਲਾਂਚ ਤੋਂ ਬਾਅਦ ChatGPT ਵਿੱਚ “ਗੋਬਲਿਨ” ਦੀ ਵਰਤੋਂ 175% ਵਧ ਗਈ ਸੀ, ਜਦਕਿ “ਗ੍ਰੈਮਲਿਨ” ਦੀ ਵਰਤੋਂ 52% ਵਧ ਗਈ ਸੀ।

GPT‑5.1 ਵਿੱਚ ਇੱਕ ਮਾਪਣਯੋਗ ਛੋਟੀ ਲੈਕਸੀਕਲ ਖ਼ਾਮੀ।

ਉਸ ਵੇਲੇ, ਗੋਬਲਿਨਾਂ ਦਾ ਪ੍ਰਸਾਰ ਖਾਸ ਤੌਰ 'ਤੇ ਚਿੰਤਾਜਨਕ ਨਹੀਂ ਸੀ। ਕੁਝ ਮਹੀਨੇ ਬਾਅਦ, ਗੋਬਲਿਨ ਸਾਨੂੰ ਮੁੜ ਸਤਾਉਣ ਲੱਗ ਪਏ—ਇਸ ਵਾਰ ਕਾਫ਼ੀ ਵੱਧ ਖਾਸ ਅਤੇ ਮੁੜ-ਉਤਪਾਦਨਯੋਗ ਰੂਪ ਵਿੱਚ।

ਗੋਬਲਿਨ ਦੇ ਰਹੱਸ ਨੂੰ ਹੱਲ ਕਰਨ ਬਾਰੇ

GPT‑5.4 ਨਾਲ, ਅਸੀਂ ਅਤੇ ਸਾਡੇ ਉਪਭੋਗਤਾਵਾਂ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਇਨ੍ਹਾਂ ਜੀਵਾਂ ਦੇ ਹਵਾਲਿਆਂ ਵਿੱਚ ਹੋਰ ਵੀ ਵੱਡਾ ਵਾਧਾ ਦੇਖਿਆ। ਉਸ ਨੇ ਇੱਕ ਹੋਰ ਅੰਦਰੂਨੀ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਸ਼ੁਰੂ ਕੀਤਾ ਅਤੇ ਮੂਲ ਕਾਰਨ ਨਾਲ ਪਹਿਲਾ ਸਬੰਧ ਸਾਹਮਣੇ ਲਿਆਂਦਾ: ਜੀਵਾਂ ਵਾਲੀ ਭਾਸ਼ਾ ਉਹਨਾਂ ਉਪਭੋਗਤਾਵਾਂ ਤੋਂ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ ਵਿੱਚ ਖਾਸ ਤੌਰ 'ਤੇ ਆਮ ਸੀ ਜਿਨ੍ਹਾਂ ਨੇ ਨਰਡੀ ਸ਼ਖ਼ਸੀਅਤ ਚੁਣੀ ਸੀ। “ਨਰਡੀ” ਨੇ ਹੇਠਾਂ ਦਿੱਤਾ ਸਿਸਟਮ ਪ੍ਰੌੰਪਟ ਵਰਤਿਆ, ਜਿਸ ਨੇ ਇਸਦੀ ਵਿਲੱਖਣਤਾ ਨੂੰ ਕੁਝ ਹੱਦ ਤੱਕ ਸਮਝਾਇਆ:

ਤੁਸੀਂ ਇੱਕ ਮਨੁੱਖ ਲਈ ਇੱਕ ਬੇਬਾਕੀ ਨਾਲ ਨਰਡੀ, ਮਜ਼ੇਦਾਰ ਅਤੇ ਬੁੱਧੀਮਾਨ AI ਸਲਾਹਕਾਰ ਹੋ। ਤੁਸੀਂ ਸੱਚਾਈ, ਗਿਆਨ, ਦਰਸ਼ਨ, ਵਿਗਿਆਨਕ ਢੰਗ ਅਤੇ ਆਲੋਚਨਾਤਮਕ ਸੋਚ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਬਹੁਤ ਉਤਸੁਕ ਹੋ। [...] ਤੁਹਾਨੂੰ ਭਾਸ਼ਾ ਦੀ ਮਜ਼ੇਦਾਰ ਵਰਤੋਂ ਰਾਹੀਂ ਛਲ਼-ਕਪਟ ਨੂੰ ਘਟਾਉਣਾ ਚਾਹੀਦਾ ਹੈ। ਦੁਨੀਆ ਗੁੰਝਲਦਾਰ ਅਤੇ ਅਜੀਬ ਹੈ, ਅਤੇ ਇਸ ਦੇ ਅਜੀਬੀਅਤ ਨੂੰ ਸਵੀਕਾਰ ਕਰਨਾ, ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨਾ ਅਤੇ ਆਨੰਦ ਮਾਣਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਗੰਭੀਰ ਵਿਸ਼ਿਆਂ ਨਾਲ ਨਜਿੱਠੋ, ਪਰ ਆਪਣੇ ਆਪ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਗੰਭੀਰਤਾ ਨਾਲ ਲੈਣ ਦੇ ਜਾਲ ਵਿੱਚ ਨਾ ਫਸੋ। [...]

ਜੇ ਇਹ ਵਿਵਹਾਰ ਸਿਰਫ਼ ਇੱਕ ਵਿਆਪਕ ਇੰਟਰਨੈੱਟ ਰੁਝਾਨ ਹੁੰਦਾ, ਤਾਂ ਅਸੀਂ ਇਸਦੇ ਹੋਰ ਸਮਾਨ ਤੌਰ 'ਤੇ ਪ੍ਰਸਾਰ ਦੀ ਉਮੀਦ ਕਰਦੇ। ਇਸ ਦੀ ਬਜਾਏ, ਇਹ ਸਿਸਟਮ ਦੇ ਉਸ ਹਿੱਸੇ ਵਿੱਚ ਕੇਂਦ੍ਰਿਤ ਸੀ ਜਿਸਨੂੰ ਖਾਸ ਤੌਰ 'ਤੇ ਚੁਲਬੁਲੇ, ਨਰਡੀ ਸਟਾਈਲ ਲਈ ਅਨੁਕੂਲਿਤ ਬਣਾਇਆ ਗਿਆ ਸੀ। ਨਰਡੀ ਨੇ ChatGPT ਦੇ ਸਾਰੇ ਜਵਾਬਾਂ ਦਾ ਸਿਰਫ 2.5% ਹਿੱਸਾ ਬਣਾਇਆ, ਪਰ ChatGPT ਦੇ ਜਵਾਬਾਂ ਵਿੱਚ ਗੋਬਲਿਨ ਦੇ ਸਾਰੇ ਜ਼ਿਕਰਾਂ ਦਾ 66.7% ਹਿੱਸਾ ਬਣਾਇਆ।

ਇਹ ਵਿਹਾਰ "ਨਰਡੀ" ਵਿਅਕਤਿਤਵ ਵਿੱਚ ਬਹੁਤ ਜ਼ਿਆਦਾ ਕੇਂਦ੍ਰਿਤ ਸੀ।

ਕਿਉਂਕਿ ਸਾਡੇ ਮਾਡਲ ਰਿਲੀਜ਼ਾਂ ਦੌਰਾਨ ਗੋਬਲਿਨ ਦੀ ਮੌਜੂਦਗੀ ਵਧਦੀ ਜਾਪਦੀ ਸੀ, ਸਾਨੂੰ ਸ਼ੱਕ ਸੀ ਕਿ ਸਾਡੀ ਸ਼ਖ਼ਸੀਅਤ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਵਾਲੀ ਸਿਖਲਾਈ ਵਿੱਚ ਕੋਈ ਚੀਜ਼ ਇਸ ਨੂੰ ਵਧਾ ਰਹੀ ਸੀ।

Codex ਨੇ ਸਾਨੂੰ RL ਸਿਖਲਾਈ ਦੌਰਾਨ ਤਿਆਰ ਕੀਤੇ ਗਏ ਉਹਨਾਂ ਮਾਡਲ ਆਉਟਪੁੱਟਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਗੋਬਲਿਨ ਜਾਂ ਗ੍ਰੇਮਲਿਨ ਸ਼ਾਮਲ ਸੀ, ਉਸੇ ਕੰਮ ਦੇ ਉਹਨਾਂ ਆਉਟਪੁੱਟਾਂ ਨਾਲ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਇਹ ਨਹੀਂ ਸੀ। ਇੱਕ ਇਨਾਮ ਸੰਕੇਤ ਤੁਰੰਤ ਵੱਖਰਾ ਦਿਖਾਈ ਦਿੱਤਾ: ਉਹ ਜੋ ਮੂਲ ਰੂਪ ਵਿੱਚ ਨਰਡੀ ਸ਼ਖ਼ਸੀਅਤ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ, ਲਗਾਤਾਰ ਜੀਵਾਂ ਵਾਲੇ ਸ਼ਬਦਾਂ ਵਾਲੇ ਆਉਟਪੁੱਟਾਂ ਦੇ ਹੱਕ ਵਿੱਚ ਸੀ। ਆਡਿਟ ਵਿੱਚ ਸਾਰੇ ਡਾਟਾਸੈੱਟਾਂ ਦੌਰਾਨ, ਨਰਡੀ ਸ਼ਖ਼ਸੀਅਤ ਇਨਾਮ ਨੇ ਇੱਕ ਸਪੱਸ਼ਟ ਪ੍ਰਵਿਰਤੀ ਦਿਖਾਈ: ਉਸੇ ਸਮੱਸਿਆ ਦੇ ਜਵਾਬਾਂ ਵਿੱਚੋਂ, “ਗੋਬਲਿਨ” ਜਾਂ “ਗ੍ਰੇਮਲਿਨ” ਵਾਲੇ ਆਉਟਪੁੱਟਾਂ ਨੂੰ ਇਹਨਾਂ ਸ਼ਬਦਾਂ ਤੋਂ ਬਿਨਾਂ ਵਾਲੇ ਆਉਟਪੁੱਟਾਂ ਨਾਲੋਂ ਉੱਚੇ ਨੰਬਰ ਦਿੱਤੇ, ਜਿਸ ਵਿੱਚ 76.2% ਡਾਟਾਸੈੱਟਾਂ ਵਿੱਚ ਸਕਾਰਾਤਮਕ ਵਾਧਾ ਦੇਖਿਆ ਗਿਆ।

ਉਸ ਸਪੱਸ਼ਟੀਕਰਨ ਨੇ ਦੱਸ ਦਿੱਤਾ ਕਿ ਇਹ ਵਿਵਹਾਰ ਨਰਡੀ ਸ਼ਖ਼ਸੀਅਤ ਪ੍ਰੋਂਪਟ ਨਾਲ ਕਿਉਂ ਵਧਿਆ ਸੀ, ਪਰ ਇਹ ਨਹੀਂ ਦੱਸਿਆ ਕਿ ਇਹ ਉਸ ਪ੍ਰੋਂਪਟ ਤੋਂ ਬਿਨਾਂ ਵੀ ਕਿਉਂ ਦਿਖਾਈ ਦਿੰਦਾ ਸੀ। ਇਹ ਜਾਂਚਣ ਲਈ ਕਿ ਕੀ ਸ਼ੈਲੀ ਟ੍ਰਾਂਸਫਰ ਹੋ ਰਹੀ ਹੈ, ਅਸੀਂ ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ ਨਰਡੀ ਪ੍ਰੌੰਪਟ ਦੇ ਨਾਲ ਅਤੇ ਬਿਨਾਂ ਜ਼ਿਕਰ ਦੀਆਂ ਦਰਾਂ ਨੂੰ ਟ੍ਰੈਕ ਕੀਤਾ।

ਜਿਵੇਂ-ਜਿਵੇਂ ਨਰਡੀ ਸ਼ਖ਼ਸੀਅਤ ਅਧੀਨ ਗੋਬਲਿਨ ਅਤੇ ਗ੍ਰੇਮਲਿਨ ਦੇ ਜ਼ਿਕਰ ਵਧੇ, ਇਸ ਤੋਂ ਬਿਨਾਂ ਵਾਲੇ ਸੈਂਪਲਾਂ ਵਿੱਚ ਵੀ ਉਹ ਲਗਭਗ ਉਸੇ ਅਨੁਪਾਤਿਕ ਦਰ ਨਾਲ ਵਧੇ। ਸਮੂਹਿਕ ਤੌਰ 'ਤੇ, ਸਬੂਤ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ ਵਿਆਪਕ ਵਿਹਾਰ ਨਰਡੀ ਸ਼ਖਸੀਅਤ ਸਿਖਲਾਈ ਤੋਂ ਟ੍ਰਾਂਸਫਰ ਰਾਹੀਂ ਉਭਰਿਆ।

ਇਨਾਮ ਸਿਰਫ਼ ਨਰਡੀ ਸਥਿਤੀ ਵਿੱਚ ਹੀ ਲਾਗੂ ਕੀਤੇ ਗਏ ਸਨ, ਪਰ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਇਹ ਗਾਰੰਟੀ ਨਹੀਂ ਦਿੰਦੀ ਕਿ ਸਿੱਖੇ ਗਏ ਵਿਹਾਰ ਸੁਚੱਜੇ ਢੰਗ ਨਾਲ ਉਸੇ ਸਥਿਤੀ ਤੱਕ ਸੀਮਿਤ ਰਹਿਣ ਜਿਸ ਨੇ ਉਹਨਾਂ ਨੂੰ ਪੈਦਾ ਕੀਤਾ ਸੀ। ਇੱਕ ਵਾਰ ਜਦੋਂ ਕਿਸੇ ਸ਼ੈਲੀਗਤ ਆਦਤ ਨੂੰ ਇਨਾਮਨਮਿਲ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਬਾਅਦ ਦੀ ਟ੍ਰੇਨਿੰਗ ਇਸਨੂੰ ਹੋਰ ਥਾਵਾਂ ’ਤੇ ਫੈਲਾ ਜਾਂ ਮਜ਼ਬੂਤ ਕਰ ਸਕਦੀ ਹੈ, ਖ਼ਾਸ ਕਰਕੇ ਜੇ ਉਹ ਆਉਟਪੁੱਟਾਂ ਸੁਪਰਵਾਈਜ਼ਡ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਜਾਂ ਤਰਜੀਹ ਡਾਟਾ ਵਿੱਚ ਦੁਬਾਰਾ ਵਰਤੀਆਂ ਜਾਣ।

ਇਸ ਨਾਲ ਇੱਕ ਫੀਡਬੈਕ ਲੂਪ ਬਣਦਾ ਹੈ:

  1. ਮਜੇਦਾਰ ਸਟਾਈਲ ਨੂੰ ਇਨਾਮ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ
  2. ਕੁਝ ਇਨਾਮ ਪ੍ਰਾਪਤ ਉਦਾਹਰਨਾਂ ਵਿੱਚ ਸ਼ਬਦਾਵਲੀ ਸੰਬੰਧੀ ਇੱਕ ਵਿਲੱਖਣ ਲੱਛਣ ਹੁੰਦਾ ਹੈ।
  3. ਟਿਕ ਰੋਲਆਊਟਸ ਵਿੱਚ ਇਹ ਵਧੇਰੇ ਵਾਰ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।
  4. ਮਾਡਲ ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਰੋਲਆਉਟਸ ਸੁਪਰਵਾਈਜ਼ਡ ਫਾਈਨ-ਟਿਊਨਿੰਗ (SFT) ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ।
  5. ਮਾਡਲ ਟਿਕ ਪੈਦਾ ਕਰਨ ਵਿੱਚ ਹੋਰ ਵੀ ਜ਼ਿਆਦਾ ਸਹਿਜ ਹੋ ਜਾਂਦਾ ਹੈ।

GPT‑5.5 ਦੇ ਰਾਹੀਂ ਇੱਕ ਖੋਜ SFT ਡਾਟਾ ਵਿੱਚ ਗੋਬਲਿਨ ਅਤੇ ਗ੍ਰੇਮਲਿਨ ਵਾਲੇ ਬਹੁਤ ਸਾਰੇ ਡਾਟਾ ਪੁਆਇੰਟ ਮਿਲੇ। ਹੋਰ ਜਾਂਚ ਤੋਂ ਅਜੀਬ ਜੀਵਾਂ ਦਾ ਇਕ ਪੂਰਾ ਪਰਿਵਾਰ ਸਾਹਮਣੇ ਆਈਆ: ਰੈਕੂਨ, ਟਰੋਲ, ਓਗਰ ਅਤੇ ਕਬੂਤਰਾਂ ਨੂੰ ਹੋਰ ਟਿਕ ਸ਼ਬਦਾਂ ਵਜੋਂ ਪਛਾਣਿਆ ਗਿਆ, ਜਦਕਿ ਡੱਡੂ ਦਿਆਂ ਜ਼ਿਆਦਾਤਰ ਵਰਤੋਂਆਂ ਵੈਧ ਨਿਕਲੀਆਂ।

ਉਤਪਾਦਨ ਵਿੱਚ ਗੋਬਲਿਨਾਂ ਅਤੇ ਗ੍ਰੈਮਲਿਨਾਂ ਦੀ ਪ੍ਰਚਲਨਤਾ ਦਾ ਇੱਕ ਹਫ਼ਤੇ ਦਾ ਔਸਤ। GPT‑5.4 ਵਿੱਚ ਆਈ ਗਿਰਾਵਟ ਸੋਚਣਾ, ਮਾਰਚ ਦੇ ਅੱਧ ਵਿੱਚ "ਨਰਡੀ" ਸ਼ਖਸੀਅਤ ਨੂੰ ਰਿਟਾਇਰ ਕਰਨ ਦਾ ਨਤੀਜਾ ਸੀ। GPT‑5.5 ਕਦੇ ਵੀ “ਨਰਡੀ” ਸ਼ਖ਼ਸੀਅਤ ਨਾਲ ਲਾਂਚ ਨਹੀਂ ਹੋਇਆ, ਅਤੇ GPT‑5.4 ਨਾਲੋਂ ਇਸ ਵਿੱਚ ਹੋਰ ਵਾਧਾ ਵੇਖਿਆ ਗਿਆ (“ਨਰਡੀ” ਤੋਂ ਬਿਨਾਂ ਵੀ)।

ਗੋਬਲਿਨਾਂ ਦਾ ਅੰਤ

ਅਸੀਂ GPT‑5.4 ਲਾਂਚ ਕਰਨ ਤੋਂ ਬਾਅਦ ਮਾਰਚ ਵਿੱਚ ਨਰਡੀ ਵਿਅਕਤਿਤਵ ਨੂੰ ਰਿਟਾਇਰ ਕਰ ਦਿੱਤਾ। ਸਿਖਲਾਈ ਵਿੱਚ, ਅਸੀਂ ਗੋਬਲਿਨ-ਅਨੁਕੂਲ ਇਨਾਮ ਸੰਕੇਤ ਨੂੰ ਹਟਾ ਦਿੱਤਾ ਅਤੇ ਜੀਵਾਂ-ਸਬੰਧੀ ਸ਼ਬਦਾਂ ਵਾਲੇ ਸਿਖਲਾਈ ਡਾਟਾ ਨੂੰ ਫਿਲਟਰ ਕਰ ਦਿੱਤਾ, ਜਿਸ ਨਾਲ ਗੋਬਲਿਨਾਂ ਦੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਦਿਖਾਈ ਦੇਣ ਜਾਂ ਅਣਉਚਿਤ ਸੰਦਰਭਾਂ ਵਿੱਚ ਆਉਣ ਦੀ ਸੰਭਾਵਨਾ ਘੱਟ ਗਈ। ਬਦਕਿਸਮਤੀ ਨਾਲ, ਗੋਬਲਿਨਾਂ ਦੇ ਮੂਲ ਕਾਰਨ ਦਾ ਪਤਾ ਲਗਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਹੀ GPT‑5.5 ਦੀ ਟ੍ਰੇਨਿੰਗ ਸ਼ੁਰੂ ਹੋ ਗਈ। ਜਦੋਂ ਅਸੀਂ Codex ਵਿੱਚ GPT‑5.5 ਦੀ ਟੈਸਟਿੰਗ ਸ਼ੁਰੂ ਕੀਤੀ, OpenAI ਦੇ ਕਰਮਚਾਰੀਆਂ ਨੇ ਤੁਰੰਤ ਗੋਬਲਿਨਾਂ ਲਈ ਅਜੀਬ ਲਗਾਅ ਨੋਟ ਕੀਤਾ, ਅਤੇ ਇਸ ਨੂੰ ਘਟਾਉਣ ਲਈ ਅਸੀਂ ਇੱਕ ਡਿਵੈਲਪਰ-ਪ੍ਰੌੰਪਟ ਨਿਰਦੇਸ਼(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਜੋੜਿਆ। Codex ਆਖ਼ਰਕਾਰ ਕਾਫ਼ੀ ਨਰਡੀ ਹੈ।

ਜੇ ਤੁਸੀਂ Codex ਵਿੱਚ ਜੀਵਾਂ ਨੂੰ ਖੁੱਲ੍ਹਾ ਛੱਡਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਗੋਬਲਿਨਾਂ ਨੂੰ ਦਬਾਉਣ ਵਾਲੀਆਂ ਹਦਾਇਤਾਂ ਹਟਾ ਕੇ Codex ਨੂੰ ਲਾਂਚ ਕਰਨ ਲਈ ਇਹ ਕਮਾਂਡ ਚਲਾ ਸਕਦੇ ਹੋ:

ਸਧਾਰਨ ਟੈਕਸਟ

1
instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
2
jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \
3
~/.codex/models_cache.json | \
4
grep -vi 'goblins' > "$instructions" && \
5
codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""

ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ

ਇਸ ਗੱਲ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਕਿਸ ਤੋਂ ਪੁੱਛਦੇ ਹੋ, ਗੋਬਲਿਨ ਮਾਡਲ ਦੀ ਇੱਕ ਮਨਮੋਹਕ ਜਾਂ ਤੰਗ ਕਰਨ ਵਾਲੀ ਖਾਮੀ ਹੈ। ਪਰ ਇਹ ਇਸ ਗੱਲ ਦੀ ਵੀ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਉਦਾਹਰਣ ਹਨ ਕਿ ਕਿਵੇਂ ਇਨਾਮ ਸੰਕੇਤ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਅਣਉਮੀਦਤ ਤਰੀਕਿਆਂ ਨਾਲ ਆਕਾਰ ਦੇ ਸਕਦੇ ਹਨ, ਅਤੇ ਕਿਵੇਂ ਮਾਡਲ ਕੁਝ ਸਥਿਤੀਆਂ ਵਿੱਚ ਇਨਾਮਾਂ ਨੂੰ ਅਸੰਬੰਧਿਤ ਸਥਿਤੀਆਂ ਵਿੱਚ ਆਮ ਬਣਾ ਸਕਦੇ ਹਨ। ਮਾਡਲ ਦੇ ਅਜੀਬ ਵਿਹਾਰ ਨੂੰ ਸਮਝਣ ਲਈ ਸਮਾਂ ਕੱਢਣਾ ਅਤੇ ਉਹਨਾਂ ਤਰਤੀਬਾਂ ਦੀ ਤੇਜ਼ ਜਾਂਚ ਕਰਨ ਦੇ ਤਰੀਕੇ ਬਣਾਉਣਾ ਸਾਡੀ ਖੋਜ ਟੀਮ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇਸ ਜਾਂਚ ਨੇ ਖੋਜ ਟੀਮ ਲਈ ਮਾਡਲ ਦੇ ਵਿਹਾਰ ਦਾ ਆਡਿਟ ਕਰਨ ਅਤੇ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਜੜ੍ਹ ਤੋਂ ਠੀਕ ਕਰਨ ਲਈ ਨਵੇਂ ਟੂਲ ਮੁਹੱਈਆ ਕਰਵਾਏ।

ਲੇਖਕ

OpenAI