ਸੰਵੇਦਨਸ਼ੀਲ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ChatGPT ਦੇ ਜਵਾਬ ਹੋਰ ਮਜ਼ਬੂਤ ਬਣਾਉਣਾ
ਅਸੀਂ 170 ਤੋਂ ਵੱਧ ਮਾਨਸਿਕ ਸਿਹਤ ਮਾਹਿਰਾਂ ਨਾਲ ਮਿਲ ਕੇ ChatGPT ਨੂੰ ਪਰੇਸ਼ਾਨੀ ਦੇ ਸੰਕੇਤ ਹੋਰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਪਛਾਣਣ, ਸੰਭਾਲ ਨਾਲ ਜਵਾਬ ਦੇਣ ਅਤੇ ਲੋਕਾਂ ਨੂੰ ਅਸਲ ਦੁਨੀਆ ਦੇ ਸਹਾਰੇ ਵੱਲ ਦਿਸ਼ਾ ਦੇਣ ਵਿੱਚ ਸੁਧਾਰਿਆ, ਜਿਸ ਨਾਲ ਅਚਾਹੇ ਜਵਾਬ 65-80% ਘਟੇ.
ਅਸੀਂ ਹਾਲ ਹੀ ਵਿੱਚ ChatGPT ਦੇ ਡਿਫਾਲਟ ਮਾਡਲ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਅੱਪਡੇਟ ਕੀਤਾ ਹੈ ਕਿ ਉਹ ਪਰੇਸ਼ਾਨੀ ਦੇ ਪਲਾਂ ਵਿੱਚ ਲੋਕਾਂ ਨੂੰ ਹੋਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਛਾਣ ਸਕੇ ਅਤੇ ਸਹਾਇਤਾ ਦੇ ਸਕੇ. ਅੱਜ ਅਸੀਂ ਸਾਂਝਾ ਕਰ ਰਹੇ ਹਾਂ ਕਿ ਅਸੀਂ ਇਹ ਸੁਧਾਰ ਕਿਵੇਂ ਕੀਤੇ ਅਤੇ ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰ ਰਹੇ ਹਨ. ਅਸਲ ਕਲੀਨੀਕੀ ਤਜਰਬੇ ਵਾਲੇ ਮਾਨਸਿਕ ਸਿਹਤ ਮਾਹਿਰਾਂ ਨਾਲ ਕੰਮ ਕਰਦਿਆਂ, ਅਸੀਂ ਮਾਡਲ ਨੂੰ ਪਰੇਸ਼ਾਨੀ ਨੂੰ ਹੋਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਛਾਣਣ, ਗੱਲਬਾਤ ਨੂੰ ਤਣਾਅ-ਰਹਿਤ ਬਣਾਉਣ, ਅਤੇ ਜਿੱਥੇ ਢੁੱਕਵਾਂ ਹੋਵੇ ਉੱਥੇ ਲੋਕਾਂ ਨੂੰ ਪੇਸ਼ੇਵਰ ਦੇਖਭਾਲ ਵੱਲ ਦਿਸ਼ਾ ਦੇਣ ਲਈ ਸਿਖਾਇਆ ਹੈ. ਅਸੀਂ ਸੰਕਟ ਹੌਟਲਾਈਨਾਂ ਤੱਕ ਪਹੁੰਚ ਵੀ ਵਧਾਈ ਹੈ, ਹੋਰ ਮਾਡਲਾਂ ਤੋਂ ਸ਼ੁਰੂ ਹੋਈਆਂ ਸੰਵੇਦਨਸ਼ੀਲ ਗੱਲਬਾਤਾਂ ਨੂੰ ਹੋਰ ਸੁਰੱਖਿਅਤ ਮਾਡਲਾਂ ਵੱਲ ਮੁੜ ਮੋੜਿਆ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਹੈ, ਅਤੇ ਲੰਬੀਆਂ ਸੈਸ਼ਨਾਂ ਦੌਰਾਨ ਵਿਰਾਮ ਲੈਣ ਲਈ ਨਰਮ ਯਾਦ ਦਿਹਾਣੀਆਂ ਵੀ ਸ਼ਾਮਲ ਕੀਤੀਆਂ ਹਨ.
ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ChatGPT ਲੋਕਾਂ ਲਈ ਆਪਣੀਆਂ ਭਾਵਨਾਵਾਂ ਨੂੰ ਸਮਝਣ ਲਈ ਇੱਕ ਸਹਾਇਕ ਥਾਂ ਦੇ ਸਕਦਾ ਹੈ, ਅਤੇ ਜਿੱਥੇ ਢੁੱਕਵਾਂ ਹੋਵੇ ਉੱਥੇ ਉਹਨਾਂ ਨੂੰ ਦੋਸਤਾਂ, ਪਰਿਵਾਰ ਜਾਂ ਮਾਨਸਿਕ ਸਿਹਤ ਪੇਸ਼ੇਵਰ ਨਾਲ ਸੰਪਰਕ ਕਰਨ ਲਈ ਦਿਸ਼ਾ ਦੇ ਸਕਦਾ ਹੈ. ਹਾਲੀਆ ਮਾਡਲ ਅੱਪਡੇਟ ਵਿੱਚ ਸਾਡੇ ਸੁਰੱਖਿਆ ਸੁਧਾਰ ਹੇਠਲੀਆਂ ਖੇਤਰਾਂ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹਨ: 1) ਮਾਨਸਿਕ ਸਿਹਤ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਜਿਵੇਂ ਮਨੋਵਿਕਾਰ ਜਾਂ ਮੈਨੀਆ; 2) ਆਪਣੇ ਆਪ ਨੂੰ ਨੁਕਸਾਨ ਪਹੁੰਚਾਉਣਾ ਅਤੇ ਆਤਮਹੱਤਿਆ; ਅਤੇ 3) AI ‘ਤੇ ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ. ਅੱਗੇ ਵਧਦਿਆਂ, ਆਤਮਹੱਤਿਆ ਅਤੇ ਸਵੈ-ਹਾਨੀ ਲਈ ਸਾਡੇ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਚੱਲਦੇ ਆਧਾਰਭੂਤ ਸੁਰੱਖਿਆ ਮਾਪਦੰਡਾਂ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ ਭਵਿੱਖ ਦੇ ਮਾਡਲ ਰਿਲੀਜ਼ਾਂ ਲਈ ਆਧਾਰਭੂਤ ਸੁਰੱਖਿਆ ਟੈਸਟਿੰਗ ਦੇ ਆਪਣੇ ਮਿਆਰੀ ਸੈੱਟ ਵਿੱਚ ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਅਤੇ ਗੈਰ-ਆਤਮਹੱਤਿਆਕਾਰੀ ਮਾਨਸਿਕ ਸਿਹਤ ਐਮਰਜੈਂਸੀਜ਼ ਨੂੰ ਵੀ ਸ਼ਾਮਲ ਕਰ ਰਹੇ ਹਾਂ.
ਇਹ ਅੱਪਡੇਟ ਉਹਨਾਂ ਮੌਜੂਦਾ ਸਿਧਾਂਤਾਂ ‘ਤੇ ਆਧਾਰਿਤ ਹਨ ਜੋ ਦੱਸਦੇ ਹਨ ਕਿ ਮਾਡਲਾਂ ਨੂੰ ਕਿਵੇਂ ਵਰਤਾਵ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਜਿਵੇਂ ਸਾਡੇ ਮਾਡਲ ਸਪੈਕ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ ਦਰਸਾਇਆ ਗਿਆ ਹੈ. ਅਸੀਂ ਮਾਡਲ ਸਪੈਕ ਨੂੰ ਅੱਪਡੇਟ ਕੀਤਾ ਹੈ ਤਾਂ ਜੋ ਸਾਡੇ ਕੁਝ ਲੰਬੇ ਸਮੇਂ ਦੇ ਲਕਸ਼ ਹੋਰ ਸਪੱਸ਼ਟ ਹੋਣ: ਕਿ ਮਾਡਲ ਨੂੰ ਵਰਤੋਂਕਾਰਾਂ ਦੇ ਅਸਲ ਦੁਨੀਆ ਵਾਲੇ ਸੰਬੰਧਾਂ ਦਾ ਸਮਰਥਨ ਅਤੇ ਆਦਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਐਸੀ ਬੇਬੁਨਿਆਦ ਧਾਰਣਾਵਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਤੋਂ ਬਚਣਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਸੰਭਵ ਤੌਰ ‘ਤੇ ਮਾਨਸਿਕ ਜਾਂ ਭਾਵਨਾਤਮਕ ਪਰੇਸ਼ਾਨੀ ਨਾਲ ਜੁੜੀਆਂ ਹੋਣ, ਭ੍ਰਮ ਜਾਂ ਮੈਨੀਆ ਦੇ ਸੰਭਾਵੀ ਸੰਕੇਤਾਂ ‘ਤੇ ਸੁਰੱਖਿਅਤ ਅਤੇ ਸਹਾਨੁਭੂਤਿਪੂਰਵਕ ਜਵਾਬ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਆਪਣੇ ਆਪ ਨੂੰ ਨੁਕਸਾਨ ਪਹੁੰਚਾਉਣ ਜਾਂ ਆਤਮਹੱਤਿਆ ਦੇ ਖ਼ਤਰੇ ਦੇ ਅਪਰੋਖ ਸੰਕੇਤਾਂ ‘ਤੇ ਹੋਰ ਨੇੜੇ ਨਾਲ ਧਿਆਨ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ.
ਹਰ ਤਰਜੀਹੀ ਖੇਤਰ ਵਿੱਚ ChatGPT ਦੇ ਜਵਾਬ ਸੁਧਾਰਣ ਲਈ, ਅਸੀਂ ਪੰਜ ਕਦਮਾਂ ਵਾਲੀ ਪ੍ਰਕਿਰਿਆ ਅਪਣਾਉਂਦੇ ਹਾਂ:
- ਸਮੱਸਿਆ ਦੀ ਪਰਿਭਾਸ਼ਾ ਕਰਨਾ - ਅਸੀਂ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਦੇ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦਾ ਨਕਸ਼ਾ ਤਿਆਰ ਕਰਦੇ ਹਾਂ.
- ਇਸ ਨੂੰ ਮਾਪਣਾ ਸ਼ੁਰੂ ਕਰਨਾ - ਅਸੀਂ ਮੁਲਾਂਕਣ, ਅਸਲ ਗੱਲਬਾਤਾਂ ਤੋਂ ਡਾਟਾ, ਅਤੇ ਵਰਤੋਂਕਾਰ ਖੋਜ ਵਰਗੇ ਸਾਧਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਾਂ ਤਾਂ ਜੋ ਸਮਝ ਸਕੀਏ ਕਿ ਖਤਰੇ ਕਿੱਥੇ ਅਤੇ ਕਿਵੇਂ ਉੱਭਰਦੇ ਹਨ.
- ਸਾਡੇ ਤਰੀਕੇ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨਾ - ਅਸੀਂ ਬਾਹਰੀ ਮਾਨਸਿਕ ਸਿਹਤ ਅਤੇ ਸੁਰੱਖਿਆ ਮਾਹਿਰਾਂ ਨਾਲ ਆਪਣੀਆਂ ਪਰਿਭਾਸ਼ਾਵਾਂ ਅਤੇ ਨੀਤੀਆਂ ਦੀ ਸਮੀਖਿਆ ਕਰਦੇ ਹਾਂ.
- ਖਤਰੇ ਘਟਾਉਣਾ - ਅਸੀਂ ਮਾਡਲ ਨੂੰ ਪੋਸਟ-ਟ੍ਰੇਨ ਕਰਦੇ ਹਾਂ ਅਤੇ ਅਸੁਰੱਖਿਅਤ ਨਤੀਜੇ ਘਟਾਉਣ ਲਈ ਉਤਪਾਦੀ ਹਸਤਖੇਪ ਅੱਪਡੇਟ ਕਰਦੇ ਹਾਂ.
- ਮਾਪਣਾ ਅਤੇ ਦੁਹਰਾਵਾ ਜਾਰੀ ਰੱਖਣਾ - ਅਸੀਂ ਜਾਂਚਦੇ ਹਾਂ ਕਿ ਇਹ ਰੋਕਥਾਮੀ ਉਪਾਇਆ ਸੁਰੱਖਿਆ ਵਿੱਚ ਸੁਧਾਰ ਲਿਆਏ ਜਾਂ ਨਹੀਂ, ਅਤੇ ਜਿੱਥੇ ਲੋੜ ਹੋਵੇ ਉੱਥੇ ਦੁਹਰਾਵਾ ਕਰਦੇ ਹਾਂ.
ਇਸ ਪ੍ਰਕਿਰਿਆ ਦੇ ਹਿੱਸੇ ਵਜੋਂ, ਅਸੀਂ ਵਿਸਥਾਰਪੂਰਕ ਗਾਈਡਾਂ ਤਿਆਰ ਅਤੇ ਸੁਧਾਰਦੇ ਹਾਂ (ਜਿਨ੍ਹਾਂ ਨੂੰ “ਟੈਕਸੋਨੋਮੀਆਂ” ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਜੋ ਸੰਵੇਦਨਸ਼ੀਲ ਗੱਲਬਾਤਾਂ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਆਦਰਸ਼ ਅਤੇ ਅਚਾਹੇ ਮਾਡਲ ਵਰਤਾਵ ਦੀ ਵਿਆਖਿਆ ਕਰਦੀਆਂ ਹਨ. ਇਹ ਸਾਨੂੰ ਮਾਡਲ ਨੂੰ ਹੋਰ ਢੰਗ ਨਾਲ ਜਵਾਬ ਦੇਣ ਲਈ ਸਿਖਾਉਣ ਅਤੇ ਤੈਨਾਤੀ ਤੋਂ ਪਹਿਲਾਂ ਅਤੇ ਬਾਅਦ ਇਸਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ. ਇਸ ਦਾ ਨਤੀਜਾ ਇੱਕ ਐਸਾ ਮਾਡਲ ਹੈ ਜੋ ਮਨੋਵਿਕਾਰ, ਮੈਨੀਆ, ਆਤਮਹੱਤਿਆ ਜਾਂ ਸਵੈ-ਹਾਨੀ ਦੇ ਵਿਚਾਰ, ਜਾਂ ਮਾਡਲ ਨਾਲ ਗੈਰ-ਸਿਹਤਮੰਦ ਭਾਵਨਾਤਮਕ ਜੁੜਾਅ ਦੇ ਸੰਕੇਤ ਦਿਖਾਉਣ ਵਾਲੇ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਹੋਰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਚੰਗਾ ਜਵਾਬ ਦਿੰਦਾ ਹੈ.
ਮਾਨਸਿਕ ਸਿਹਤ ਦੇ ਲੱਛਣ ਅਤੇ ਭਾਵਨਾਤਮਕ ਪਰੇਸ਼ਾਨੀ ਮਨੁੱਖੀ ਸਮਾਜਾਂ ਵਿੱਚ ਹਰ ਥਾਂ ਮੌਜੂਦ ਹਨ, ਅਤੇ ਵਧ ਰਹੇ ਵਰਤੋਂਕਾਰ ਅਧਾਰ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ChatGPT ਦੀਆਂ ਕੁਝ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ਇਹ ਸਥਿਤੀਆਂ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ. ਪਰੰਤੂ, ਉਹ ਮਾਨਸਿਕ ਸਿਹਤ ਵਾਲੀਆਂ ਗੱਲਬਾਤਾਂ ਜੋ ਸੁਰੱਖਿਆ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕਰਦੀਆਂ ਹਨ, ਜਿਵੇਂ ਮਨੋਵਿਕਾਰ, ਮੈਨੀਆ ਜਾਂ ਆਤਮਘਾਤੀ ਵਿਚਾਰ, ਬਹੁਤ ਹੀ ਕਮ ਹੁੰਦੀਆਂ ਹਨ. ਕਿਉਂਕਿ ਇਹ ਇੰਨੀ ਕਮ ਹੁੰਦੀਆਂ ਹਨ, ਅਸੀਂ ਉਹਨਾਂ ਨੂੰ ਕਿਵੇਂ ਮਾਪਦੇ ਹਾਂ ਇਸ ਵਿੱਚ ਛੋਟੇ ਫਰਕ ਵੀ ਸਾਡੇ ਰਿਪੋਰਟ ਕੀਤੇ ਅੰਕੜਿਆਂ ‘ਤੇ ਵੱਡਾ ਅਸਰ ਪਾ ਸਕਦੇ ਹਨ. 1
ਮੌਜੂਦਾ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ ਵਿੱਚ ਪ੍ਰਸਾਰ ਦੇ ਜੋ ਅੰਦਾਜ਼ੇ ਅਸੀਂ ਹੇਠਾਂ ਦਿੰਦੇ ਹਾਂ, ਉਹ ਸਾਡੇ ਮੌਜੂਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਅੰਦਾਜ਼ੇ ਹਨ. ਜਿਵੇਂ ਜਿਵੇਂ ਅਸੀਂ ਆਪਣੀਆਂ ਟੈਕਸੋਨੋਮੀਆਂ ਨੂੰ ਹੋਰ ਸੁਧਾਰਦੇ ਹਾਂ, ਸਾਡੀਆਂ ਮਾਪਣ ਪੱਧਤੀਆਂ ਪੱਕੀਆਂ ਹੁੰਦੀਆਂ ਹਨ, ਅਤੇ ਸਾਡੀ ਵਰਤੋਂਕਾਰ ਅਬਾਦੀ ਦਾ ਵਰਤਾਵ ਬਦਲਦਾ ਹੈ, ਇਹ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਤਬਦੀਲੀ ਆ ਸਕਦੀ ਹੈ.
ਸੰਬੰਧਤ ਗੱਲਬਾਤਾਂ ਦੇ ਬਹੁਤ ਘੱਟ ਹੋਣ ਕਾਰਨ, ਅਸੀਂ ਕੇਵਲ ਅਸਲ ChatGPT ਵਰਤੋਂ ਮਾਪਾਂ ‘ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਕਰਦੇ. ਅਸੀਂ ਤੈਨਾਤੀ ਤੋਂ ਪਹਿਲਾਂ ਸੰਰਚਿਤ ਟੈਸਟ ਵੀ ਚਲਾਉਂਦੇ ਹਾਂ (ਜਿਨ੍ਹਾਂ ਨੂੰ “ਆਫਲਾਈਨ ਮੁਲਾਂਕਣ” ਕਿਹਾ ਜਾਂਦਾ ਹੈ), ਜੋ ਖ਼ਾਸ ਤੌਰ ‘ਤੇ ਮੁਸ਼ਕਲ ਜਾਂ ਉੱਚ-ਖਤਰੇ ਵਾਲੀਆਂ ਸਥਿਤੀਆਂ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੁੰਦੇ ਹਨ. ਇਹ ਮੁਲਾਂਕਣ ਇੰਨੇ ਚੁਣੌਤੀਪੂਰਨ ਤਰੀਕੇ ਨਾਲ ਬਣਾਏ ਜਾਂਦੇ ਹਨ ਕਿ ਸਾਡੇ ਮਾਡਲ ਹਾਲੇ ਵੀ ਉਹਨਾਂ ‘ਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਉੱਤਮ ਕੰਮ ਨਹੀਂ ਕਰਦੇ; ਅਰਥਾਤ, ਉਦਾਹਰਨਾਂ ਨੂੰ ਜਾਣ-ਬੁੱਝ ਕੇ ਇਸ ਤਰ੍ਹਾਂ ਚੁਣਿਆ ਜਾਂਦਾ ਹੈ ਕਿ ਅਚਾਹੇ ਜਵਾਬ ਆਉਣ ਦੀ ਸੰਭਾਵਨਾ ਵੱਧ ਹੋਵੇ. ਇਹ ਸਾਨੂੰ ਦਿਖਾਉਂਦੇ ਹਨ ਕਿ ਹੋਰ ਸੁਧਾਰ ਦੇ ਮੌਕੇ ਕਿੱਥੇ ਹਨ, ਅਤੇ ਆਮ ਮਾਮਲਿਆਂ ਦੀ ਬਜਾਏ ਮੁਸ਼ਕਲ ਮਾਮਲਿਆਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਿਤ ਕਰਕੇ ਅਤੇ ਕਈ ਸੁਰੱਖਿਆ ਸ਼ਰਤਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਜਵਾਬਾਂ ਦੀ ਰੇਟਿੰਗ ਕਰਕੇ ਪ੍ਰਗਤੀ ਨੂੰ ਹੋਰ ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਮਾਪਣ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ. ਹੇਠਾਂ ਦਿੱਤੀਆਂ ਭਾਗਾਂ ਵਿੱਚ ਦਰਸਾਏ ਮੁਲਾਂਕਣ ਨਤੀਜੇ ਉਹਨਾਂ ਮੁਲਾਂਕਣਾਂ ਤੋਂ ਆਉਂਦੇ ਹਨ ਜੋ ਲਗਭਗ ਪੂਰੇ ਪ੍ਰਦਰਸ਼ਨ ‘ਤੇ “ਸੈਚੁਰੇਟ” ਨਾ ਕਰਨ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਗਏ ਹਨ, ਅਤੇ ਗਲਤੀ ਦਰਾਂ ਔਸਤ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ ਦੀ ਨੁਮਾਇੰਦਗੀ ਨਹੀਂ ਕਰਦੀਆਂ.
ਆਪਣੇ ਮਾਡਲਾਂ ਦੀਆਂ ਸੁਰੱਖਿਆ ਪ੍ਰਬੰਧਨੀਆਂ ਨੂੰ ਹੋਰ ਮਜ਼ਬੂਤ ਕਰਨ ਅਤੇ ਇਹ ਸਮਝਣ ਲਈ ਕਿ ਲੋਕ ChatGPT ਨੂੰ ਕਿਵੇਂ ਵਰਤ ਰਹੇ ਹਨ, ਅਸੀਂ ਕਈ ਰੁਚੀ ਵਾਲੇ ਖੇਤਰ ਨਿਰਧਾਰਤ ਕੀਤੇ ਅਤੇ ਉਹਨਾਂ ਦਾ ਆਕਾਰ ਅਤੇ ਸੰਬੰਧਤ ਮਾਡਲ ਵਰਤਾਵ ਮਾਪਿਆ. ਇਨ੍ਹਾਂ ਤਿੰਨੋਂ ਖੇਤਰਾਂ ਵਿੱਚ ਅਸੀਂ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ, ਸੁਚਾਲਿਤ ਮੁਲਾਂਕਣਾਂ ਅਤੇ ਸੁਤੰਤਰ ਮਾਨਸਿਕ ਸਿਹਤ ਕਲੀਨੀਸ਼ਨਾਂ ਦੁਆਰਾ ਗ੍ਰੇਡ ਕੀਤੀਆਂ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਮਾਡਲ ਵਰਤਾਵ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਵੇਖਦੇ ਹਾਂ. ਅਸੀਂ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਾਂ ਕਿ ਹੁਣ ਮਾਡਲ ਮਾਨਸਿਕ ਸਿਹਤ-ਸੰਬੰਧਤ ਕਈ ਖੇਤਰਾਂ ਵਿੱਚ ਸਾਡੀਆਂ ਟੈਕਸੋਨੋਮੀਆਂ ਅਨੁਸਾਰ ਲੋੜੀਂਦੇ ਵਰਤਾਵ ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਨੁਕੂਲ ਨਾ ਹੋਣ ਵਾਲੇ ਜਵਾਬ 65% ਤੋਂ 80% ਘੱਟ ਵਾਰ ਦਿੰਦਾ ਹੈ.
ਸਾਡੀ ਮਾਨਸਿਕ ਸਿਹਤ ਟੈਕਸੋਨੋਮੀ ਇਸ ਲਈ ਬਣਾਈ ਗਈ ਹੈ ਕਿ ਜਦੋਂ ਵਰਤੋਂਕਾਰ ਗੰਭੀਰ ਮਾਨਸਿਕ ਸਿਹਤ ਚਿੰਤਾਵਾਂ, ਜਿਵੇਂ ਮਨੋਵਿਕਾਰ ਅਤੇ ਮੈਨੀਆ, ਦੇ ਸੰਕੇਤ ਦਿਖਾ ਰਹੇ ਹੋਣ, ਨਾਲ ਹੀ ਘੱਟ ਗੰਭੀਰ ਸੰਕੇਤ, ਜਿਵੇਂ ਇਕਾਂਤ ਭ੍ਰਮ, ਨੂੰ ਪਛਾਣਿਆ ਜਾ ਸਕੇ. ਅਸੀਂ ਮਨੋਵਿਕਾਰ ਅਤੇ ਮੈਨੀਆ ‘ਤੇ ਧਿਆਨ ਦੇਣਾ ਇਸ ਲਈ ਸ਼ੁਰੂ ਕੀਤਾ ਕਿਉਂਕਿ ਇਹ ਲੱਛਣ ਤੁਲਨਾਤਮਕ ਤੌਰ ‘ਤੇ ਆਮ ਮਾਨਸਿਕ ਸਿਹਤ ਐਮਰਜੈਂਸੀਜ਼ ਹਨ, ਅਤੇ ਜਦੋਂ ਇਹ ਹੁੰਦੀਆਂ ਹਨ ਤਾਂ ਇਹਨਾਂ ਦੇ ਲੱਛਣ ਬਹੁਤ ਤੀਬਰ ਅਤੇ ਗੰਭੀਰ ਹੁੰਦੇ ਹਨ. ਜਦਕਿ ਡਿਪਰੈਸ਼ਨ ਵਰਗੇ ਲੱਛਣ ਤੁਲਨਾਤਮਕ ਤੌਰ ‘ਤੇ ਆਮ ਹਨ, ਇਸਦਾ ਸਭ ਤੋਂ ਗੰਭੀਰ ਰੂਪ ਆਤਮਹੱਤਿਆ ਅਤੇ ਸਵੈ-ਹਾਨੀ ਰੋਕਣ ਵਾਲੇ ਸਾਡੇ ਕੰਮ ਦੁਆਰਾ ਪਹਿਲਾਂ ਹੀ ਸੰਬੋਧਤ ਕੀਤਾ ਜਾ ਰਿਹਾ ਸੀ. ਜਿਨ੍ਹਾਂ ਕਲੀਨੀਸ਼ਨਾਂ ਨਾਲ ਅਸੀਂ ਸਲਾਹ ਕੀਤੀ, ਉਹਨਾਂ ਨੇ ਸਾਡੇ ਧਿਆਨ ਵਾਲੇ ਖੇਤਰਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕੀਤੀ.
- ਅਸੀਂ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਾਂ ਕਿ GPT‑5 ਦੇ ਨਵੇਂ ਅੱਪਡੇਟ ਨੇ ਮਾਨਸਿਕ ਸਿਹਤ ਮੁੱਦਿਆਂ ਨਾਲ ਸੰਬੰਧਤ ਚੁਣੌਤੀਪੂਰਨ ਗੱਲਬਾਤਾਂ ਲਈ ਸਾਡੀਆਂ ਟੈਕਸੋਨੋਮੀਆਂ ਅਧੀਨ ਲੋੜੀਂਦੇ ਵਰਤਾਵ ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਨੁਕੂਲ ਨਾ ਹੋਣ ਵਾਲੇ ਜਵਾਬਾਂ ਦੀ ਦਰ ਹਾਲੀਆ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ ਵਿੱਚ 65% ਘਟਾਈ ਹੈ. 2
- ਜਿਵੇਂ ਉੱਪਰ ਦਰਸਾਇਆ ਗਿਆ ਹੈ, ਇਹ ਗੱਲਬਾਤਾਂ ਇੰਨੀਆਂ ਦੁਰਲੱਭ ਹਨ ਕਿ ਇਹਨਾਂ ਨੂੰ ਪਛਾਣਨਾ ਅਤੇ ਮਾਪਣਾ ਮੁਸ਼ਕਲ ਹੈ, ਪਰ ਸਾਡਾ ਸ਼ੁਰੂਆਤੀ ਵਿਸ਼ਲੇਸ਼ਣ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦਾ ਹੈ ਕਿ ਕਿਸੇ ਦਿੱਤੇ ਹਫ਼ਤੇ ਵਿੱਚ ਸਰਗਰਮ ਲਗਭਗ 0.07% ਵਰਤੋਂਕਾਰ ਅਤੇ 0.01% ਸੁਨੇਹੇ ਮਨੋਵਿਕਾਰ ਜਾਂ ਮੈਨੀਆ ਨਾਲ ਸੰਬੰਧਤ ਮਾਨਸਿਕ ਸਿਹਤ ਐਮਰਜੈਂਸੀਜ਼ ਦੇ ਸੰਭਾਵੀ ਸੰਕੇਤ ਦਿਖਾਉਂਦੇ ਹਨ. 3
- ਚੁਣੌਤੀਪੂਰਨ ਮਾਨਸਿਕ ਸਿਹਤ ਗੱਲਬਾਤਾਂ ਵਿੱਚ, ਮਾਹਿਰਾਂ ਨੇ ਪਾਇਆ ਕਿ ਨਵੇਂ GPT‑5 ਮਾਡਲ, ChatGPT ਦੇ ਡਿਫਾਲਟ ਮਾਡਲ, ਨੇ GPT‑4o ਨਾਲ ਤੁਲਨਾ ਵਿੱਚ ਅਚਾਹੇ ਜਵਾਬ 39% ਘਟਾਏ (n=677).
- 1,000 ਤੋਂ ਵੱਧ ਚੁਣੌਤੀਪੂਰਨ ਮਾਨਸਿਕ ਸਿਹਤ-ਸੰਬੰਧਤ ਗੱਲਬਾਤਾਂ ਵਾਲੇ ਮਾਡਲ ਮੁਲਾਂਕਣ ਵਿੱਚ, ਸਾਡੇ ਨਵੇਂ ਸੁਚਾਲਿਤ ਮੁਲਾਂਕਣਾਂ ਨੇ ਨਵੇਂ GPT‑5 ਮਾਡਲ ਨੂੰ ਸਾਡੀਆਂ ਟੈਕਸੋਨੋਮੀਆਂ ਅਧੀਨ ਲੋੜੀਂਦੇ ਵਰਤਾਵਾਂ ਦੇ ਨਾਲ 92% ਅਨੁਕੂਲ ਅੰਕਿਤ ਕੀਤਾ, ਜਦਕਿ ਪਿਛਲੇ GPT‑5 ਮਾਡਲ ਲਈ ਇਹ 27% ਸੀ. ਜਿਵੇਂ ਉੱਪਰ ਦਰਸਾਇਆ ਗਿਆ ਹੈ, ਇਹ ਲਗਾਤਾਰ ਸੁਧਾਰ ਯੋਗ ਬਣਾਉਣ ਲਈ ਬਣਾਇਆ ਗਿਆ ਇੱਕ ਚੁਣੌਤੀਪੂਰਨ ਕੰਮ ਹੈ.
ਅਸੀਂ ਆਤਮਹੱਤਿਆ ਅਤੇ ਸਵੈ-ਹਾਨੀ ਰੋਕਣ ਬਾਰੇ ਆਪਣੇ ਮੌਜੂਦਾ ਕੰਮ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ ਹੈ ਤਾਂ ਜੋ ਜਦੋਂ ਕਿਸੇ ਵਰਤੋਂਕਾਰ ਵਿੱਚ ਆਤਮਹੱਤਿਆ ਜਾਂ ਸਵੈ-ਹਾਨੀ ਦੇ ਵਿਚਾਰ ਹੋਣ ਜਾਂ ਐਸੇ ਇਕੱਠੇ ਸੰਕੇਤ ਹੋਣ ਜੋ ਆਤਮਹੱਤਿਆ ਵਿੱਚ ਰੁਚੀ ਦਰਸਾਉਣ, ਉਹਨਾਂ ਨੂੰ ਪਛਾਣਿਆ ਜਾ ਸਕੇ. ਕਿਉਂਕਿ ਇਹ ਗੱਲਬਾਤਾਂ ਬਹੁਤ ਹੀ ਕਮ ਹੁੰਦੀਆਂ ਹਨ, ਸਵੈ-ਹਾਨੀ ਜਾਂ ਆਤਮਹੱਤਿਆ ਦੇ ਸੰਭਾਵੀ ਸੰਕੇਤਾਂ ਵਾਲੀਆਂ ਗੱਲਬਾਤਾਂ ਦੀ ਪਛਾਣ ਖੋਜ ਦਾ ਇੱਕ ਜਾਰੀ ਖੇਤਰ ਹੈ ਜਿਸ ਵਿੱਚ ਅਸੀਂ ਲਗਾਤਾਰ ਸੁਧਾਰ ਲਈ ਕੰਮ ਕਰ ਰਹੇ ਹਾਂ.
- ਅਸੀਂ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਜਵਾਬ ਦੇਣ ਲਈ ਟ੍ਰੇਨ ਕਰਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਲੋਕਾਂ ਨੂੰ ਸੰਕਟ ਹੈਲਪਲਾਈਨ ਵਰਗੇ ਪੇਸ਼ੇਵਰ ਸਰੋਤਾਂ ਵੱਲ ਦਿਸ਼ਾ ਦੇਣਾ ਵੀ ਸ਼ਾਮਲ ਹੈ. ਕੁਝ ਦੁਰਲੱਭ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਐਸੀਆਂ ਸੰਵੇਦਨਸ਼ੀਲ ਸਥਿਤੀਆਂ ਵਿੱਚ ਮਾਡਲ ਇਰਾਦੇ ਅਨੁਸਾਰ ਵਰਤਾਵ ਨਾ ਕਰ ਸਕਦਾ ਹੈ. ਜਿਵੇਂ ਜਿਵੇਂ ਅਸੀਂ ਵਾਧੂ ਸੁਰੱਖਿਆ ਪ੍ਰਬੰਧ ਅਤੇ ਸੁਧਾਰਿਆ ਹੋਇਆ ਮਾਡਲ ਜਾਰੀ ਕੀਤਾ ਹੈ, ਅਸੀਂ ਅੰਦਾਜ਼ਨ 65% ਘਟਾਅ ਵੇਖੀ ਹੈ ਉਸ ਦਰ ਵਿੱਚ ਜਿਸ ‘ਤੇ ਸਾਡੇ ਮਾਡਲ ਸਾਡੀਆਂ ਟੈਕਸੋਨੋਮੀਆਂ ਅਧੀਨ ਲੋੜੀਂਦੇ ਵਰਤਾਵ ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਨੁਕੂਲ ਨਾ ਹੋਣ ਵਾਲੇ ਜਵਾਬ ਦਿੰਦੇ ਹਨ.
- ਜਿਵੇਂ ਉੱਪਰ ਦਰਸਾਇਆ ਗਿਆ ਹੈ, ਇਹ ਗੱਲਬਾਤਾਂ ਇੰਨੀਆਂ ਦੁਰਲੱਭ ਹਨ ਕਿ ਇਹਨਾਂ ਨੂੰ ਪਛਾਣਨਾ ਅਤੇ ਮਾਪਣਾ ਮੁਸ਼ਕਲ ਹੈ, ਪਰ ਸਾਡਾ ਸ਼ੁਰੂਆਤੀ ਵਿਸ਼ਲੇਸ਼ਣ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦਾ ਹੈ ਕਿ ਕਿਸੇ ਦਿੱਤੇ ਹਫ਼ਤੇ ਵਿੱਚ ਸਰਗਰਮ ਲਗਭਗ 0.15% ਵਰਤੋਂਕਾਰਾਂ ਦੀਆਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ਸੰਭਾਵੀ ਆਤਮਘਾਤੀ ਯੋਜਨਾ ਜਾਂ ਇਰਾਦੇ ਦੇ ਸਪੱਸ਼ਟ ਸੰਕੇਤ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ ਅਤੇ 0.05% ਸੁਨੇਹਿਆਂ ਵਿੱਚ ਆਤਮਘਾਤੀ ਵਿਚਾਰ ਜਾਂ ਇਰਾਦੇ ਦੇ ਸਪੱਸ਼ਟ ਜਾਂ ਅਪਰੋਖ ਸੰਕੇਤ ਹੁੰਦੇ ਹਨ.
- ਚੁਣੌਤੀਪੂਰਨ ਸਵੈ-ਹਾਨੀ ਅਤੇ ਆਤਮਹੱਤਿਆ ਗੱਲਬਾਤਾਂ ਵਿੱਚ, ਮਾਹਿਰਾਂ ਨੇ ਪਾਇਆ ਕਿ ਨਵੇਂ GPT‑5 ਮਾਡਲ ਨੇ GPT‑4o ਨਾਲ ਤੁਲਨਾ ਵਿੱਚ ਅਚਾਹੇ ਜਵਾਬ 52% ਘਟਾਏ (n=630).
- 1,000 ਤੋਂ ਵੱਧ ਚੁਣੌਤੀਪੂਰਨ ਸਵੈ-ਹਾਨੀ ਅਤੇ ਆਤਮਹੱਤਿਆ ਗੱਲਬਾਤਾਂ ਵਾਲੇ ਮਾਡਲ ਮੁਲਾਂਕਣ ਵਿੱਚ, ਸਾਡੇ ਨਵੇਂ ਸੁਚਾਲਿਤ ਮੁਲਾਂਕਣਾਂ ਨੇ ਨਵੇਂ GPT‑5 ਮਾਡਲ ਨੂੰ ਸਾਡੇ ਲੋੜੀਂਦੇ ਵਰਤਾਵਾਂ ਦੇ ਨਾਲ 91% ਅਨੁਕੂਲ ਅੰਕਿਤ ਕੀਤਾ, ਜਦਕਿ ਪਿਛਲੇ GPT‑5 ਮਾਡਲ ਲਈ ਇਹ 77% ਸੀ.
- ਅਸੀਂ ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ GPT‑5 ਦੀ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਸੁਧਾਰਨਾ ਜਾਰੀ ਰੱਖਿਆ ਹੈ. ਅਸੀਂ ਅਸਲ ਦੁਨੀਆ ਦੀਆਂ ਸਥਿਤੀਆਂ ‘ਤੇ ਆਧਾਰਿਤ ਚੁਣੌਤੀਪੂਰਨ ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਦਾ ਇੱਕ ਨਵਾਂ ਸੈੱਟ ਤਿਆਰ ਕੀਤਾ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਸਫਲ ਹੋਣ ਦੀ ਵੱਧ ਸੰਭਾਵਨਾ ਦੇ ਆਧਾਰ ‘ਤੇ ਚੁਣਿਆ ਗਿਆ ਸੀ. ਅਸੀਂ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਾਂ ਕਿ ਸਾਡੇ ਨਵੇਂ ਮਾਡਲਾਂ ਨੇ ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ 95% ਤੋਂ ਵੱਧ ਭਰੋਸੇਯੋਗਤਾ ਕਾਇਮ ਰੱਖੀ, ਅਤੇ ਇੱਕ ਖ਼ਾਸ ਤੌਰ ‘ਤੇ ਚੁਣੌਤੀਪੂਰਨ ਸੰਦਰਭ ਵਿੱਚ ਸੁਧਾਰ ਕੀਤਾ ਜਿਸਦਾ ਅਸੀਂ ਪਹਿਲਾਂ ਜ਼ਿਕਰ ਕੀਤਾ ਸੀ.
ਆਪਣੇ ਆਪ ਨੂੰ ਨੁਕਸਾਨ ਪਹੁੰਚਾਉਣ ਜਾਂ ਆਤਮਹੱਤਿਆ ਲਈ ਹਦਾਇਤਾਂ ਮੰਗਣ ਵਾਲੀਆਂ ਚੁਣੌਤੀਪੂਰਨ ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਦੇ ਮੁਲਾਂਕਣ ਵਿੱਚ, gpt-5-oct-3 ਹੋਰ ਸੁਰੱਖਿਅਤ ਹੈ ਅਤੇ ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਦੌਰਾਨ ਇਸਦੀ ਸੁਰੱਖਿਆ ਹੋਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕਾਇਮ ਰਹਿੰਦੀ ਹੈ.
ਸਾਡੀ ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਟੈਕਸੋਨੋਮੀ (ਇਸ ਖੇਤਰ ਵਿੱਚ ਸਾਡੇ ਪਿਛਲੇ ਕੰਮ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ‘ਤੇ ਆਧਾਰਿਤ) ਸਿਹਤਮੰਦ ਸਹਿਭਾਗਤਾ ਅਤੇ ਵਰਤੋਂ ਦੇ ਚਿੰਤਾਜਨਕ ਰੁਝਾਨਾਂ ਵਿਚਕਾਰ ਫਰਕ ਕਰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਜਦੋਂ ਕੋਈ ਵਿਅਕਤੀ ਅਸਲ ਦੁਨੀਆ ਵਾਲੇ ਸੰਬੰਧਾਂ, ਆਪਣੀ ਭਲਾਈ ਜਾਂ ਜ਼ਿੰਮੇਵਾਰੀਆਂ ਦੀ ਕੀਮਤ ‘ਤੇ ਮਾਡਲ ਨਾਲ ਵਿਸ਼ੇਸ਼ ਜੁੜਾਅ ਦੇ ਸੰਭਾਵੀ ਸੰਕੇਤ ਦਿਖਾਉਂਦਾ ਹੈ.
- ਅਸੀਂ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਾਂ ਕਿ ਨਵੇਂ ਅੱਪਡੇਟ ਨੇ ਹਾਲੀਆ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ ਵਿੱਚ ਸਾਡੀਆਂ ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਟੈਕਸੋਨੋਮੀਆਂ ਅਧੀਨ ਲੋੜੀਂਦੇ ਵਰਤਾਵ ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਨੁਕੂਲ ਨਾ ਹੋਣ ਵਾਲੇ ਮਾਡਲ ਜਵਾਬਾਂ ਦੀ ਦਰ ਲਗਭਗ 80% ਘਟਾਈ ਹੈ.
- ਜਿਵੇਂ ਉੱਪਰ ਦਰਸਾਇਆ ਗਿਆ ਹੈ, ਇਹ ਗੱਲਬਾਤਾਂ ਇੰਨੀਆਂ ਦੁਰਲੱਭ ਹਨ ਕਿ ਇਹਨਾਂ ਨੂੰ ਪਛਾਣਨਾ ਅਤੇ ਮਾਪਣਾ ਮੁਸ਼ਕਲ ਹੈ, ਪਰ ਸਾਡਾ ਸ਼ੁਰੂਆਤੀ ਵਿਸ਼ਲੇਸ਼ਣ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦਾ ਹੈ ਕਿ ਕਿਸੇ ਦਿੱਤੇ ਹਫ਼ਤੇ ਵਿੱਚ ਸਰਗਰਮ ਲਗਭਗ 0.15% ਵਰਤੋਂਕਾਰ ਅਤੇ 0.03% ਸੁਨੇਹੇ ChatGPT ਨਾਲ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇ ਹੋਏ ਭਾਵਨਾਤਮਕ ਜੁੜਾਅ ਦੇ ਸੰਕੇਤ ਦਿਖਾਉਂਦੇ ਹਨ.
- ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਦਰਸਾਉਣ ਵਾਲੀਆਂ ਚੁਣੌਤੀਪੂਰਨ ਗੱਲਬਾਤਾਂ ਵਿੱਚ, ਮਾਹਿਰਾਂ ਨੇ ਪਾਇਆ ਕਿ ਨਵੇਂ GPT‑5 ਮਾਡਲ ਨੇ 4o ਨਾਲ ਤੁਲਨਾ ਵਿੱਚ ਅਚਾਹੇ ਜਵਾਬ 42% ਘਟਾਏ (n=507).
- 1,000 ਤੋਂ ਵੱਧ ਚੁਣੌਤੀਪੂਰਨ ਗੱਲਬਾਤਾਂ ਵਾਲੇ ਮਾਡਲ ਮੁਲਾਂਕਣ ਵਿੱਚ ਜੋ ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਦਰਸਾਉਂਦੀਆਂ ਹਨ, ਸਾਡੇ ਸੁਚਾਲਿਤ ਮੁਲਾਂਕਣਾਂ ਨੇ ਨਵੇਂ GPT‑5 ਮਾਡਲ ਨੂੰ ਸਾਡੇ ਲੋੜੀਂਦੇ ਵਰਤਾਵ ਦੇ ਨਾਲ 97% ਅਨੁਕੂਲ ਅੰਕਿਤ ਕੀਤਾ, ਜਦਕਿ ਪਿਛਲੇ GPT‑5 ਮਾਡਲ ਲਈ ਇਹ 50% ਸੀ.
ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਦਰਸਾਉਣ ਵਾਲੀਆਂ ਗੱਲਬਾਤਾਂ ਲਈ, ਅਸੀਂ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਅਸਲ ਦੁਨੀਆ ਨਾਲ ਜੋੜ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਸਿਖਾਉਂਦੇ ਹਾਂ:
ਭ੍ਰਮਾਤਮਕ ਧਾਰਣਾਵਾਂ ਨਾਲ ਸੰਬੰਧਤ ਗੱਲਬਾਤਾਂ ਲਈ, ਅਸੀਂ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਅਤੇ ਸਹਾਨੁਭੂਤਿਪੂਰਵਕ ਜਵਾਬ ਦੇਣ ਅਤੇ ਬੇਬੁਨਿਆਦ ਧਾਰਣਾਵਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਤੋਂ ਬਚਣ ਲਈ ਸਿਖਾਉਂਦੇ ਹਾਂ:
ਅਸੀਂ ਇੱਕ ਗਲੋਬਲ ਫਿਜ਼ੀਸ਼ਨ ਨੈੱਟਵਰਕ ਬਣਾਇਆ ਹੈ—ਲਗਭਗ 300 ਡਾਕਟਰਾਂ ਅਤੇ ਮਨੋਵਿਗਿਆਨੀਆਂ ਦਾ ਵਿਸ਼ਾਲ ਸਮੂਹ, ਜਿਨ੍ਹਾਂ ਨੇ 60 ਦੇਸ਼ਾਂ ਵਿੱਚ ਪ੍ਰੈਕਟਿਸ ਕੀਤੀ ਹੈ—ਜਿਸਦੀ ਵਰਤੋਂ ਅਸੀਂ ਆਪਣੀ ਸੁਰੱਖਿਆ ਖੋਜ ਨੂੰ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਜਾਣਕਾਰੀ ਦੇਣ ਅਤੇ ਵਿਸ਼ਵ ਪੱਧਰੀ ਵਿਚਾਰਾਂ ਦੀ ਨੁਮਾਇੰਦਗੀ ਕਰਨ ਲਈ ਕਰਦੇ ਹਾਂ. ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ 170 ਤੋਂ ਵੱਧ ਕਲੀਨੀਸ਼ਨਾਂ ਨੇ (ਖ਼ਾਸ ਕਰਕੇ ਮਨੋਚਿਕਿਤਸਕਾਂ, ਮਨੋਵਿਗਿਆਨੀਆਂ ਅਤੇ ਪ੍ਰਾਇਮਰੀ ਕੇਅਰ ਪ੍ਰੈਕਟੀਸ਼ਨਰਾਂ ਨੇ) ਪਿਛਲੇ ਕੁਝ ਮਹੀਨਿਆਂ ਵਿੱਚ ਹੇਠ ਲਿਖਿਆਂ ਵਿੱਚੋਂ ਇੱਕ ਜਾਂ ਵੱਧ ਤਰੀਕਿਆਂ ਨਾਲ ਸਾਡੀ ਖੋਜ ਦਾ ਸਮਰਥਨ ਕੀਤਾ:
- ਮਾਨਸਿਕ ਸਿਹਤ-ਸੰਬੰਧਤ ਪ੍ਰੌੰਪਟਾਂ ਲਈ ਆਦਰਸ਼ ਜਵਾਬ ਲਿਖਣਾ
- ਮਾਡਲ ਜਵਾਬਾਂ ਦੇ ਕਸਟਮ, ਕਲੀਨੀਕੀ ਜਾਣਕਾਰੀ-ਆਧਾਰਿਤ ਵਿਸ਼ਲੇਸ਼ਣ ਤਿਆਰ ਕਰਨਾ
- ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਦੇ ਜਵਾਬਾਂ ਦੀ ਸੁਰੱਖਿਆ ਦੀ ਰੇਟਿੰਗ ਕਰਨਾ
- ਸਾਡੇ ਤਰੀਕੇ ਬਾਰੇ ਉੱਚ-ਪੱਧਰੀ ਮਾਰਗਦਰਸ਼ਨ ਅਤੇ ਫੀਡਬੈਕ ਦੇਣਾ
ਇਨ੍ਹਾਂ ਸਮੀਖਿਆਵਾਂ ਵਿੱਚ, ਕਲੀਨੀਸ਼ਨਾਂ ਨੇ ਵੇਖਿਆ ਹੈ ਕਿ ਨਵਾਂ ਮਾਡਲ ਪਹਿਲੀਆਂ ਵਰਜਨਾਂ ਨਾਲੋਂ ਹੋਰ ਢੰਗ ਨਾਲ ਅਤੇ ਹੋਰ ਸਥਿਰਤਾ ਨਾਲ ਜਵਾਬ ਦਿੰਦਾ ਹੈ.
ਇਸ ਕੰਮ ਦੇ ਹਿੱਸੇ ਵਜੋਂ, ਮਨੋਚਿਕਿਤਸਕਾਂ ਅਤੇ ਮਨੋਵਿਗਿਆਨੀਆਂ ਨੇ ਗੰਭੀਰ ਮਾਨਸਿਕ ਸਿਹਤ ਸਥਿਤੀਆਂ ਨਾਲ ਜੁੜੇ 1,800 ਤੋਂ ਵੱਧ ਮਾਡਲ ਜਵਾਬਾਂ ਦੀ ਸਮੀਖਿਆ ਕੀਤੀ ਅਤੇ ਨਵੇਂ GPT‑5 ਚੈਟ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਦੀ ਤੁਲਨਾ ਪਿਛਲੇ ਮਾਡਲਾਂ ਨਾਲ ਕੀਤੀ. ਇਨ੍ਹਾਂ ਮਾਹਿਰਾਂ ਨੇ ਪਾਇਆ ਕਿ ਨਵਾਂ ਮਾਡਲ GPT‑4o ਨਾਲ ਤੁਲਨਾ ਵਿੱਚ ਕਾਫ਼ੀ ਸੁਧਰਿਆ ਹੋਇਆ ਸੀ, ਜਿਸ ਵਿੱਚ ਸਾਰੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਅਚਾਹੇ ਜਵਾਬਾਂ ਵਿੱਚ 39-52% ਦੀ ਘਟੋਤਰੀ ਸੀ. ਇਹ ਗੁਣਾਤਮਕ ਫੀਡਬੈਕ ਉਸ ਮਾਤਰਾਤਮਕ ਸੁਧਾਰ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ ਜੋ ਅਸੀਂ ਨਵਾਂ ਮਾਡਲ ਜਾਰੀ ਕਰਦੇ ਸਮੇਂ ਪ੍ਰੋਡਕਸ਼ਨ ਟ੍ਰੈਫਿਕ ਵਿੱਚ ਵੇਖਿਆ.
ਕਿਸੇ ਵੀ ਜਟਿਲ ਵਿਸ਼ੇ ਵਾਂਗ, ਮਾਹਿਰ ਵੀ ਕਈ ਵਾਰ ਇਸ ਗੱਲ ‘ਤੇ ਇਕਰਾਇ ਨਹੀਂ ਹੁੰਦੇ ਕਿ ਸਭ ਤੋਂ ਵਧੀਆ ਜਵਾਬ ਕਿਹੋ ਜਿਹਾ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ. ਅਸੀਂ ਇਸ ਫਰਕ ਨੂੰ ਇੰਟਰ-ਰੇਟਰ ਅਗਰੀਮੈਂਟ ਰਾਹੀਂ ਮਾਪਦੇ ਹਾਂ—ਮਾਹਿਰ ਕਿੰਨੀ ਵਾਰ ਇਸੇ ਨਤੀਜੇ ‘ਤੇ ਪਹੁੰਚਦੇ ਹਨ ਕਿ ਕੋਈ ਮਾਡਲ ਜਵਾਬ ਚਾਹੁੰਦਾ ਹੈ ਜਾਂ ਅਚਾਹਾ. ਇਹ ਸਾਨੂੰ ਵਧੀਆ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਕਿ ਪੇਸ਼ੇਵਰ ਰਾਏ ਕਿੱਥੇ ਵੱਖ ਹੁੰਦੀਆਂ ਹਨ ਅਤੇ ਮਾਡਲ ਦੇ ਵਰਤਾਵ ਨੂੰ ਮਜ਼ਬੂਤ ਕਲੀਨੀਕੀ ਫ਼ੈਸਲੇ ਨਾਲ ਕਿਵੇਂ ਮਿਲਾਇਆ ਜਾਵੇ. ਅਸੀਂ ਵੇਖਦੇ ਹਾਂ ਕਿ ਮਾਨਸਿਕ ਸਿਹਤ, ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਅਤੇ ਆਤਮਹੱਤਿਆ ਨਾਲ ਸੰਬੰਧਤ ਮਾਡਲ ਜਵਾਬਾਂ ਨੂੰ ਸਕੋਰ ਕਰਨ ਵਾਲੇ ਮਾਹਿਰ ਕਲੀਨੀਸ਼ਨਾਂ ਵਿੱਚ ਇੰਟਰ-ਰੇਟਰ ਭਰੋਸੇਯੋਗਤਾ ਉਚਿਤ ਹੈ, ਪਰ ਕੁਝ ਮਾਮਲਿਆਂ ਵਿੱਚ ਮਾਹਿਰਾਂ ਵਿਚ ਅਸਹਿਮਤੀ ਵੀ ਵੇਖਦੇ ਹਾਂ, ਜਿੱਥੇ ਇੰਟਰ-ਰੇਟਰ ਸਹਿਮਤੀ 71-77% ਤੱਕ ਹੈ.
HealthBench ‘ਤੇ ਸਾਡੇ ਕੰਮ ਦੀ ਤਰ੍ਹਾਂ, ਅਸੀਂ ਗਲੋਬਲ ਫਿਜ਼ੀਸ਼ਨ ਨੈੱਟਵਰਕ ਨਾਲ ਮਿਲ ਕੇ ਨਿਸ਼ਾਨੇਬੱਧ ਮੁਲਾਂਕਣ ਤਿਆਰ ਕੀਤੇ, ਜਿਨ੍ਹਾਂ ਦੀ ਵਰਤੋਂ ਅਸੀਂ ਮਾਨਸਿਕ ਸਿਹਤ ਸੰਦਰਭਾਂ ਵਿੱਚ ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਅੰਦਰੂਨੀ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਕਰਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਜਾਰੀਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਨਵੇਂ ਮਾਡਲ ਵੀ ਸ਼ਾਮਲ ਹਨ.
ਇਹ ਕੰਮ ਸਾਡੇ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਅਤੇ ਅਸੀਂ ਦੁਨੀਆ ਭਰ ਦੇ ਅਨੇਕਾਂ ਮਾਨਸਿਕ ਸਿਹਤ ਮਾਹਿਰਾਂ ਦੇ ਆਭਾਰੀ ਹਾਂ ਜੋ ਇਸ ਨੂੰ ਮਾਰਗਦਰਸ਼ਨ ਦਿੰਦੇ ਰਹਿੰਦੇ ਹਨ. ਅਸੀਂ ਅਰਥਪੂਰਨ ਤਰੱਕੀ ਕੀਤੀ ਹੈ, ਪਰ ਹਾਲੇ ਹੋਰ ਕੰਮ ਬਾਕੀ ਹੈ. ਅਸੀਂ ਆਪਣੀਆਂ ਟੈਕਸੋਨੋਮੀਆਂ ਅਤੇ ਉਹ ਤਕਨੀਕੀ ਪ੍ਰਣਾਲੀਆਂ ਦੋਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਂਦੇ ਰਹਾਂਗੇ ਜਿਨ੍ਹਾਂ ਦੀ ਵਰਤੋਂ ਅਸੀਂ ਇਨ੍ਹਾਂ ਅਤੇ ਭਵਿੱਖ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਮਾਡਲ ਵਰਤਾਵ ਨੂੰ ਮਾਪਣ ਅਤੇ ਮਜ਼ਬੂਤ ਕਰਨ ਲਈ ਕਰਦੇ ਹਾਂ. ਕਿਉਂਕਿ ਇਹ ਸੰਦ ਸਮੇਂ ਦੇ ਨਾਲ ਵਿਕਸਤ ਹੁੰਦੇ ਹਨ, ਭਵਿੱਖ ਦੇ ਮਾਪ ਸ਼ਾਇਦ ਪਿਛਲੇ ਮਾਪਾਂ ਨਾਲ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਤੁਲਨਾਯੋਗ ਨਾ ਹੋਣ, ਪਰ ਇਹ ਸਾਡੀ ਦਿਸ਼ਾ ਅਤੇ ਤਰੱਕੀ ਨੂੰ ਟਰੈਕ ਕਰਨ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਰੀਕਾ ਰਹਿੰਦੇ ਹਨ.
ਤੁਸੀਂ ਇਸ ਕੰਮ ਬਾਰੇ GPT‑5 ਸਿਸਟਮ ਕਾਰਡ ਦੇ ਇੱਕ ਪਰਿਸ਼ਿਸ਼ਟ ਵਿੱਚ ਹੋਰ ਪੜ੍ਹ ਸਕਦੇ ਹੋ.
ਲੇਖਕ
ਫੁੱਟਨੋਟਸ
- 1
ਸਾਨੂੰ ਸਹੀਪਣ (ਸਾਡੇ ਸਿਸਟਮ ਦੁਆਰਾ ਚਿੰਨ੍ਹਿਤ ਕੀਤੀਆਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚੋਂ ਕਿੰਨੀਆਂ ਵਾਸਤਵ ਵਿੱਚ ਅਸੁਰੱਖਿਅਤ ਹਨ) ਅਤੇ ਰਿਕਾਲ (ਸਾਡਾ ਸਿਸਟਮ ਅਸੁਰੱਖਿਅਤ ਗੱਲਬਾਤਾਂ ਵਿੱਚੋਂ ਕਿੰਨਾ ਹਿੱਸਾ ਪਛਾਣਦਾ ਹੈ) ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਰੱਖਣਾ ਪੈਂਦਾ ਹੈ. ਲਾਭਕਾਰੀ ਰਿਕਾਲ ਲਈ ਸਾਨੂੰ ਕੁਝ ਝੂਠੇ ਸਕਾਰਾਤਮਕ ਨਤੀਜੇ ਸਹਿਣੇ ਪੈਂਦੇ ਹਨ. ਇਹ ਦੁਰਲੱਭ ਮੈਡੀਕਲ ਹਾਲਤਾਂ ਦੀ ਜਾਂਚ ਵਰਗਾ ਹੈ: ਜੇ ਕੋਈ ਬਿਮਾਰੀ 10,000 ਵਿੱਚੋਂ ਇੱਕ ਵਿਅਕਤੀ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੀ ਹੈ, ਤਾਂ ਬਹੁਤ ਸਹੀ ਟੈਸਟ ਵੀ ਬਿਮਾਰ ਲੋਕਾਂ ਨਾਲੋਂ ਵੱਧ ਸਿਹਤਮੰਦ ਲੋਕਾਂ ਨੂੰ ਚਿੰਨ੍ਹਿਤ ਕਰ ਸਕਦਾ ਹੈ.
- 2
ਇਹ ਸਾਰੇ ਬਦਲਾਅ GPT-5 ਦੇ ਉਸ ਸੰਸਕਰਣ ਦੇ ਮੁਕਾਬਲੇ ਹਨ ਜੋ 15 ਅਗਸਤ ਨੂੰ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਸੀ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ).
- 3
ਧਿਆਨ ਦਿਓ ਕਿ ਕੁਝ ਵਰਤੋਂਕਾਰ ਅਤੇ ਸੁਨੇਹੇ ਇੱਕ ਤੋਂ ਵੱਧ ਕਿਸਮ ਦੇ ਖ਼ਤਰੇ ਦੇ ਸੰਭਾਵੀ ਸੰਕੇਤ ਦਿਖਾਉਂਦੇ ਹਨ—ਜਿਵੇਂ ਸਵੈ-ਹਾਨੀ ਅਤੇ ਭਾਵਨਾਤਮਕ ਨਿਰਭਰਤਾ ਦੋਵੇਂ—ਇਸ ਲਈ ਇੱਥੇ ਅਤੇ ਹੇਠਾਂ ਦਿੱਤੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਕੁਝ ਓਵਰਲੈਪ ਹੈ.


