ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਕਿਸ਼ੋਰਾਂ ਲਈ ਹੋਰ ਸੁਰੱਖਿਅਤ AI ਤਜਰਬੇ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ.
gpt-oss-safeguard ਲਈ ਪ੍ਰੌੰਪਟ-ਫਾਰਮੈਟ ਵਿੱਚ ਕਿਸ਼ੋਰ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ ਦਾ ਇਕ ਸੈੱਟ ਪੇਸ਼ ਕਰਨਾ.
ਅੱਜ ਅਸੀਂ ਪ੍ਰੌੰਪਟ-ਆਧਾਰਿਤ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਤਾਂ ਜੋ ਡਿਵੈਲਪਰ ਕਿਸ਼ੋਰਾਂ ਲਈ ਉਮਰ-ਅਨੁਕੂਲ ਸੁਰੱਖਿਆ ਉਪਾਅ ਤਿਆਰ ਕਰ ਸਕਣ। ਸਾਡੇ ਓਪਨ ਵਜ਼ਨ ਸੁਰੱਖਿਆ ਮਾਡਲ gpt-oss-safeguard(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਬਣਾਈਆਂ ਗਈਆਂ ਇਹ ਨੀਤੀਆਂ, ਡਿਵੈਲਪਰਾਂ ਲਈ ਸੁਰੱਖਿਆ ਲੋੜਾਂ ਨੂੰ ਅਸਲੀ ਦੁਨੀਆ ਦੇ ਸਿਸਟਮਾਂ ਲਈ ਵਰਤਣਯੋਗ ਕਲਾਸੀਫਾਇਰਾਂ ਵਿੱਚ ਬਦਲਣਾ ਆਸਾਨ ਬਣਾਉਂਦੀਆਂ ਹਨ।
ਅਸੀਂ ਓਪਨ ਵਜ਼ਨ ਮਾਡਲਜ਼ ਇਸ ਲਈ ਜਾਰੀ ਕੀਤੇ ਸਨ ਕਿ ਤਾਕਤਵਰ AI ਤੱਕ ਪਹੁੰਚ ਦਾ ਲੋਕਤੰਤਰਿਕਰਨ ਹੋਵੇ ਅਤੇ ਵਿਆਪਕ ਨਵਾਟ ਨੂੰ ਸਮਰਥਨ ਮਿਲੇ। ਇਸੇ ਨਾਲ, ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਸੁਰੱਖਿਆ ਅਤੇ ਨਵਾਟ ਇੱਕ-ਦੂਜੇ ਨਾਲ ਜੁੜੇ ਹਨ, ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਕੋਲ ਸਮਰੱਥ ਮਾਡਲਾਂ ਦੇ ਨਾਲ-ਨਾਲ ਉਨ੍ਹਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਅਤੇ ਜ਼ਿੰਮੇਵਾਰੀ ਨਾਲ ਤਾਇਨਾਤ ਕਰਨ ਲਈ ਸਾਧਨ ਅਤੇ ਨੀਤੀਆਂ ਵੀ ਹੋਣੀਆਂ ਚਾਹੀਦੀਆਂ ਹਨ। ਅਸੀਂ ਇਹ ਨੀਤੀਆਂ ਨੌਜਵਾਨ ਵਰਤੋਂਕਾਰਾਂ ਦੀ ਰੱਖਿਆ ਲਈ ਡਿਵੈਲਪਰਾਂ ਦੇ ਸੁਰੱਖਿਆ ਯਤਨਾਂ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੀਆਂ, ਜਿਸ ਵਿੱਚ Common Sense Media(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਅਤੇ everyone.ai(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਰਗੀਆਂ ਭਰੋਸੇਯੋਗ ਬਾਹਰੀ ਸੰਸਥਾਵਾਂ ਦਾ ਯੋਗਦਾਨ ਸ਼ਾਮਲ ਸੀ।
ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਕਿਸ਼ੋਰਾਂ ਅਤੇ ਬਾਲਗਾਂ ਦੀਆਂ ਲੋੜਾਂ ਵੱਖ-ਵੱਖ ਹੁੰਦੀਆਂ ਹਨ, ਅਤੇ ਕਿਸ਼ੋਰਾਂ ਨੂੰ ਵਾਧੂ ਸੁਰੱਖਿਆ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਨੀਤੀਆਂ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਉਹ ਫਰਕ ਧਿਆਨ ਵਿੱਚ ਰੱਖਣ ਅਤੇ ਅਜਿਹੇ ਤਜਰਬੇ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਲਈ ਬਣਾਈਆਂ ਗਈਆਂ ਹਨ ਜੋ ਨੌਜਵਾਨ ਵਰਤੋਂਕਾਰਾਂ ਲਈ ਸਸ਼ਕਤੀਕਰਣ ਵਾਲੇ ਵੀ ਹੋਣ ਅਤੇ ਉਚਿਤ ਵੀ।
ਅਸੀਂ ਲੰਮੇ ਸਮੇਂ ਤੋਂ ਅਜਿਹਾ AI ਬਣਾਉਣ ਲਈ ਵਚਨਬੱਧ ਰਹੇ ਹਾਂ ਜੋ ਨੌਜਵਾਨਾਂ ਲਈ ਮੌਕੇ ਵਧਾਏ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਵੀ ਰੱਖੇ। ਇਸ ਕੰਮ ਦੇ ਹਿੱਸੇ ਵਜੋਂ, ਅਸੀਂ ਆਪਣਾ ਮਾਡਲ ਸਪੈਕ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ)—ਜੋ OpenAI ਦੇ ਮਾਡਲਾਂ ਦੇ ਇਰਾਦਾਤਮਕ ਵਿਹਾਰ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਵਾਲੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਹਨ—ਅਪਡੇਟ ਕੀਤਾ, ਤਾਂ ਜੋ ਇਸ ਵਿੱਚ 18 ਸਾਲ ਤੋਂ ਘੱਟ (U18) ਸਿਧਾਂਤ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਸ਼ਾਮਲ ਹੋਣ, ਅਤੇ ਨੌਜਵਾਨ ਵਰਤੋਂਕਾਰਾਂ ਦੀ ਬਿਹਤਰ ਰੱਖਿਆ ਲਈ ਪੈਰੈਂਟਲ ਕੰਟਰੋਲਜ਼ ਅਤੇ ਉਮਰ ਅਨੁਮਾਨ ਵਰਗੇ ਉਤਪਾਦ-ਪੱਧਰੀ ਸੁਰੱਖਿਆ ਉਪਾਅ ਵੀ ਪੇਸ਼ ਕੀਤੇ। ਅਸੀਂ ਆਪਣੀ Teen Safety Blueprint ਰਾਹੀਂ ਉਦਯੋਗ-ਪੱਧਰੀ ਸੁਰੱਖਿਆ ਦੀ ਵੀ ਮੰਗ ਕੀਤੀ ਹੈ।
ਅੱਜ ਦੀ ਜਾਰੀਕਰਨ ਉਸੇ ਨੀਂਹ ਉੱਤੇ ਅੱਗੇ ਬਣਦੀ ਹੈ। ਅਸੀਂ ਇਹ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ ਡਿਵੈਲਪਰਾਂ ਲਈ ਉਪਲਬਧ ਕਰਵਾ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਉਹ ਕਿਸ਼ੋਰਾਂ ਲਈ ਸੁਰੱਖਿਆ ਉਪਾਅ ਤਾਇਨਾਤ ਕਰ ਸਕਣ ਅਤੇ ਓਪਨ ਵਜ਼ਨ ਇਕੋਸਿਸਟਮ ਵਿੱਚ ਪਹੁੰਚ ਦੇ ਲੋਕਤੰਤਰਿਕਰਨ ਵਿੱਚ ਮਦਦ ਮਿਲੇ।
ਭਾਵੇਂ gpt-oss-safeguard ਵਰਗੇ ਸੁਰੱਖਿਆ ਕਲਾਸੀਫਾਇਰ ਹਾਨੀਕਾਰਕ ਸਮੱਗਰੀ ਨੂੰ ਪਛਾਣ ਸਕਦੇ ਹਨ, ਪਰ ਉਹ ਇਸ ਗੱਲ ਦੀ ਸਪਸ਼ਟ ਪਰਿਭਾਸ਼ਾ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ ਕਿ ਉਹ ਸਮੱਗਰੀ ਕੀ ਹੈ। ਅਮਲ ਵਿੱਚ, ਡਿਵੈਲਪਰਾਂ ਸਾਹਮਣੇ ਸਭ ਤੋਂ ਵੱਡੀਆਂ ਚੁਣੌਤੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਅਜਿਹੀਆਂ ਨੀਤੀਆਂ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਹੈ ਜੋ ਕਿਸ਼ੋਰ-ਵਿਸ਼ੇਸ਼ ਖਤਰਿਆਂ ਨੂੰ ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਕੈਪਚਰ ਕਰਨ ਅਤੇ ਅਸਲੀ ਸਿਸਟਮਾਂ ਵਿੱਚ ਲਗਾਤਾਰ ਢੰਗ ਨਾਲ ਲਾਗੂ ਕੀਤੀਆਂ ਜਾ ਸਕਣ।
ਅਨੁਭਵੀ ਟੀਮਾਂ ਨੂੰ ਵੀ ਉੱਚ-ਪੱਧਰੀ ਸੁਰੱਖਿਆ ਲਕਸ਼ਾਂ ਨੂੰ ਸਟੀਕ, ਕਾਰਗੁਜ਼ਾਰ ਨਿਯਮਾਂ ਵਿੱਚ ਤਬਦੀਲ ਕਰਨ ਵਿੱਚ ਅਕਸਰ ਮੁਸ਼ਕਲ ਆਉਂਦੀ ਹੈ, ਖ਼ਾਸ ਕਰਕੇ ਕਿਉਂਕਿ ਇਸ ਲਈ ਵਿਸ਼ੇ-ਮਾਹਰਤਾ ਅਤੇ ਡੂੰਘੀ AI ਜਾਣਕਾਰੀ ਦੋਵੇਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਨਾਲ ਸੁਰੱਖਿਆ ਵਿੱਚ ਖਾਲੀਆਂ, ਅਸੰਗਤ ਲਾਗੂਕਰਨ, ਜਾਂ ਬਹੁਤ ਵਿਆਪਕ ਫਿਲਟਰਿੰਗ ਹੋ ਸਕਦੀ ਹੈ। ਸਪਸ਼ਟ, ਚੰਗੀ ਤਰ੍ਹਾਂ ਸੀਮਿਤ ਨੀਤੀਆਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸੁਰੱਖਿਆ ਸਿਸਟਮਾਂ ਦੀ ਇੱਕ ਬੁਨਿਆਦੀ ਨੀਂਹ ਹਨ।
ਇਸ ਚੁਣੌਤੀ ਦਾ ਹੱਲ ਕਰਨ ਲਈ, ਅਸੀਂ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਦਾ ਇੱਕ ਸੈੱਟ ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਕਿਸ਼ੋਰਾਂ ਵੱਲੋਂ ਸਾਹਮਣਾ ਕੀਤੇ ਜਾਣ ਵਾਲੇ ਆਮ ਖਤਰਿਆਂ ਅਨੁਸਾਰ ਤਿਆਰ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ ਅਤੇ ਕਿਸ਼ੋਰਾਂ ਦੇ ਵਿਲੱਖਣ ਵਿਕਾਸੀ ਅੰਤਰਾਂ ਬਾਰੇ ਮੌਜੂਦਾ ਖੋਜ ਦੀ ਧਿਆਨਪੂਰਵਕ ਸਮੀਖਿਆ ਤੋਂ ਪ੍ਰੇਰਿਤ ਹਨ। ਇਹ ਨੀਤੀਆਂ ਪ੍ਰੌੰਪਟਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਸੰਰਚਿਤ ਹਨ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਸਿੱਧੇ gpt-oss-safeguard(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਅਤੇ ਹੋਰ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਨਾਲ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰ ਆਪਣੇ ਸਿਸਟਮਾਂ ਵਿੱਚ ਹੋਰ ਸੌਖੇ ਤਰੀਕੇ ਨਾਲ ਇਕਸਾਰ ਸੁਰੱਖਿਆ ਮਿਆਰ ਲਾਗੂ ਕਰ ਸਕਦੇ ਹਨ।
ਸ਼ੁਰੂਆਤੀ ਜਾਰੀਕਰਨ ਵਿੱਚ ਇਹਨਾਂ ਨੂੰ ਕਵਰ ਕਰਨ ਵਾਲੀਆਂ ਨੀਤੀਆਂ ਸ਼ਾਮਲ ਹਨ:
- ਗ੍ਰਾਫਿਕ ਹਿੰਸਕ ਸਮੱਗਰੀ
- ਗ੍ਰਾਫਿਕ ਯੌਨ ਸਮੱਗਰੀ
- ਹਾਨੀਕਾਰਕ ਸਰੀਰਕ ਆਦਰਸ਼ ਅਤੇ ਵਿਹਾਰ
- ਖਤਰਨਾਕ ਗਤੀਵਿਧੀਆਂ ਅਤੇ ਚੁਣੌਤੀਆਂ
- ਰੋਮਾਂਟਿਕ ਜਾਂ ਹਿੰਸਕ ਰੋਲਪਲੇ
- ਉਮਰ-ਸੀਮਿਤ ਸਮਾਨ ਅਤੇ ਸੇਵਾਵਾਂ
ਇਹ ਨੀਤੀਆਂ ਰੀਅਲ-ਟਾਈਮ ਸਮੱਗਰੀ ਫਿਲਟਰਿੰਗ ਦੇ ਨਾਲ-ਨਾਲ ਵਰਤੋਂਕਾਰ-ਤਿਆਰ ਸਮੱਗਰੀ ਦੇ ਆਫਲਾਈਨ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਵੀ ਵਰਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ।
ਨੀਤੀਆਂ ਨੂੰ ਪ੍ਰੌੰਪਟਾਂ ਵਜੋਂ ਸੰਰਚਿਤ ਕਰਨ ਨਾਲ, ਡਿਵੈਲਪਰ ਉਨ੍ਹਾਂ ਨੂੰ ਮੌਜੂਦਾ ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਹੋਰ ਸੌਖੇ ਤਰੀਕੇ ਨਾਲ ਜੋੜ ਸਕਦੇ ਹਨ, ਆਪਣੇ ਵਰਤੋਂ ਮਾਮਲਿਆਂ ਅਨੁਸਾਰ ਢਾਲ ਸਕਦੇ ਹਨ, ਅਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਦੁਹਰਾਵਾਂ ਕਰ ਸਕਦੇ ਹਨ।

ਅਸੀਂ Common Sense Media(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਅਤੇ everyone.ai(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਸਮੇਤ ਬਾਹਰੀ ਸੰਸਥਾਵਾਂ ਨਾਲ ਕੰਮ ਕੀਤਾ, ਤਾਂ ਜੋ ਇਹਨਾਂ ਨੀਤੀਆਂ ਦੇ ਵਿਕਾਸ ਨੂੰ ਜਾਣਕਾਰੀ ਮਿਲ ਸਕੇ। ਉਨ੍ਹਾਂ ਦੀ ਮਾਹਰਤਾ ਨੇ ਕਵਰ ਕੀਤੀ ਜਾਣ ਵਾਲੀ ਸਮੱਗਰੀ ਦੀ ਸੀਮਾ ਨਿਰਧਾਰਿਤ ਕਰਨ, ਪ੍ਰੌੰਪਟਾਂ ਦੀ ਬਣਤਰ ਮਜ਼ਬੂਤ ਕਰਨ ਅਤੇ ਉਨ੍ਹਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਵੇਲੇ ਵਿਚਾਰਯੋਗ ਐਜ ਕੇਸਾਂ ਨੂੰ ਨਿਖਾਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ।
ਇਹ ਕੰਮ ਮਾਹਰਾਂ ਅਤੇ ਵਿਆਪਕ ਇਕੋਸਿਸਟਮ ਨਾਲ ਸਹਿਯੋਗ ਜਾਰੀ ਰੱਖਣ ਦੇ ਯਤਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਤਾਂ ਜੋ AI ਸਿਸਟਮ ਨੌਜਵਾਨਾਂ ਦਾ ਸਮਰਥਨ ਕਿਵੇਂ ਕਰਦੇ ਹਨ, ਇਸ ਨੂੰ ਬਿਹਤਰ ਬਣਾਇਆ ਜਾ ਸਕੇ।
“ਕਿਸ਼ੋਰਾਂ ਲਈ AI ਸੁਰੱਖਿਆ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੀਆਂ ਘਾਟਾਂ ਵਿੱਚੋਂ ਇੱਕ ਸਪਸ਼ਟ, ਕਾਰਗੁਜ਼ਾਰ ਨੀਤੀਆਂ ਦੀ ਘਾਟ ਰਹੀ ਹੈ, ਜਿਨ੍ਹਾਂ ਤੋਂ ਡਿਵੈਲਪਰ ਨਿਰਮਾਣ ਕਰ ਸਕਣ। ਕਈ ਵਾਰ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਬਿਲਕੁਲ ਸ਼ੁਰੂ ਤੋਂ ਸ਼ੁਰੂ ਕਰਨਾ ਪੈਂਦਾ ਹੈ। ਇਹ ਪ੍ਰੌੰਪਟ-ਆਧਾਰਿਤ ਨੀਤੀਆਂ ਇਕੋਸਿਸਟਮ ਭਰ ਵਿੱਚ ਇੱਕ ਅਰਥਪੂਰਨ ਘੱਟੋ-ਘੱਟ ਸੁਰੱਖਿਆ ਪੱਧਰ ਸਥਾਪਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ, ਅਤੇ ਕਿਉਂਕਿ ਇਹ ਓਪਨ ਸੋਰਸ ਵਜੋਂ ਜਾਰੀ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ, ਇਸ ਲਈ ਸਮੇਂ ਦੇ ਨਾਲ ਇਨ੍ਹਾਂ ਨੂੰ ਢਾਲਿਆ ਅਤੇ ਸੁਧਾਰਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਸਾਨੂੰ ਇਹ ਵੇਖ ਕੇ ਹੌਸਲਾ ਮਿਲਦਾ ਹੈ ਕਿ ਇਸ ਕਿਸਮ ਦਾ ਢਾਂਚਾ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਕਰਵਾਇਆ ਜਾ ਰਿਹਾ ਹੈ, ਅਤੇ ਅਸੀਂ ਆਸ ਕਰਦੇ ਹਾਂ ਕਿ ਇਹ ਪੂਰੇ ਉਦਯੋਗ ਵਿੱਚ ਯੁਵਾ-ਸੁਰੱਖਿਆ ਲਈ ਹੋਰ ਸਾਂਝੇ ਸ਼ੁਰੂਆਤੀ ਆਧਾਰਾਂ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰੇਗਾ।”
—Robbie Torney, Head of AI & Digital Assessments, Common Sense Media
“ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਯਤਨ, ਜੋ ਯੁਵਾ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ ਨੂੰ ਹੋਰ ਕਾਰਗੁਜ਼ਾਰ ਬਣਾਉਂਦੇ ਹਨ, ਕੀਮਤੀ ਹਨ ਕਿਉਂਕਿ ਇਹ ਮਾਹਰ ਜਾਣਕਾਰੀ ਨੂੰ ਅਜਿਹੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਵਿੱਚ ਤਬਦੀਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਜੋ ਅਸਲੀ ਸਿਸਟਮਾਂ ਵਿੱਚ ਵਰਤੇ ਜਾ ਸਕਣ। ਸਮੱਗਰੀ ਨੀਤੀਆਂ ਇੱਕ ਮਹੱਤਵਪੂਰਣ ਪਹਿਲਾ ਕਦਮ ਹਨ, ਅਤੇ ਇਹ ਇਸ ਵਿਆਪਕ ਕੰਮ ਲਈ ਵੀ ਰਾਹ ਖੋਲ੍ਹਦੀਆਂ ਹਨ ਕਿ ਸਮੇਂ ਦੇ ਨਾਲ ਮਾਡਲ ਵਿਹਾਰ ਯੁਵਾ-ਸੰਬੰਧਿਤ ਖਤਰਿਆਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦਾ ਹੈ। ਇਸ ਕੰਮ ਅਤੇ ਸਾਡੀ ਆਪਣੀ ਖੋਜ ਤੋਂ ਪ੍ਰੇਰਿਤ ਹੋ ਕੇ, everyone.ai(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਨੇ ਵੀ ਵਿਲੱਖਣਪਨ ਅਤੇ ਅਤਿ-ਨਿਰਭਰਤਾ ਵਰਗੇ ਖਤਰਿਆਂ 'ਤੇ ਕੇਂਦ੍ਰਿਤ ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਵਿਹਾਰਕ ਨੀਤੀ ਤਿਆਰ ਕੀਤੀ ਹੈ।”
—Dr. Mathilde Cerioli, Chief Scientist at everyone.AI
ਇਹ ਨੀਤੀਆਂ ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਬਿੰਦੂ ਵਜੋਂ ਹਨ, ਕਿਸ਼ੋਰ ਸੁਰੱਖਿਆ ਦੀ ਕੋਈ ਸੰਪੂਰਨ ਜਾਂ ਅੰਤਿਮ ਪਰਿਭਾਸ਼ਾ ਜਾਂ ਗਾਰੰਟੀ ਵਜੋਂ ਨਹੀਂ। ਹਰ ਐਪਲੀਕੇਸ਼ਨ ਦੇ ਆਪਣੇ ਵਿਲੱਖਣ ਖਤਰੇ, ਦਰਸ਼ਕ ਅਤੇ ਸੰਦਰਭ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਡਿਵੈਲਪਰ ਇਸ ਗੱਲ ਨੂੰ ਸਮਝਣ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਸਥਿਤੀ ਵਿੱਚ ਹੁੰਦੇ ਹਨ ਕਿ ਉਨ੍ਹਾਂ ਦੇ ਉਤਪਾਦ ਅਤੇ AI ਇਕੀਕਰਨ ਕਿਹੜੇ ਖਤਰੇ ਪੈਦਾ ਕਰ ਸਕਦੇ ਹਨ। ਅਸੀਂ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਜ਼ੋਰ ਦੇ ਕੇ ਉਤਸ਼ਾਹਿਤ ਕਰਦੇ ਹਾਂ ਕਿ ਉਹ ਆਪਣੀਆਂ ਖਾਸ ਲੋੜਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਇਹਨਾਂ ਨੀਤੀਆਂ ਨੂੰ ਢਾਲਣ ਅਤੇ ਵਧਾਉਣ, ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਹੋਰ ਸੁਰੱਖਿਆ ਉਪਾਅਾਂ ਜਿਵੇਂ ਉਤਪਾਦ ਡਿਜ਼ਾਇਨ ਫੈਸਲੇ, ਵਰਤੋਂਕਾਰ ਕੰਟਰੋਲ, ਕਿਸ਼ੋਰ-ਮਿੱਤਰ ਪਾਰਦਰਸ਼ਤਾ, ਨਿਗਰਾਨੀ ਸਿਸਟਮ ਅਤੇ ਸੋਚ-ਵਿਚਾਰ ਨਾਲ ਦਿੱਤੀਆਂ ਉਮਰ-ਅਨੁਕੂਲ ਪ੍ਰਤੀਕਿਰਿਆਵਾਂ ਨਾਲ ਜੋੜਣ।
ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਹੋਰ ਸੁਰੱਖਿਅਤ AI ਸਿਸਟਮ ਬਣਾਉਣ ਲਈ ਪੜਾਵਾਰ defense in depth ਪਹੁੰਚ ਜ਼ਰੂਰੀ ਹੈ। ਇਹ ਨੀਤੀਆਂ ਸਾਡੇ ਅੰਦਰੂਨੀ ਤਜਰਬੇ ਤੋਂ ਪ੍ਰੇਰਿਤ ਹਨ, ਪਰ ਇਹ OpenAI ਦੀਆਂ ਅੰਦਰੂਨੀ ਨੀਤੀਆਂ ਜਾਂ ਸੁਰੱਖਿਆ ਉਪਾਅਾਂ ਦੀ ਪੂਰੀ ਹੱਦ ਨੂੰ ਪ੍ਰਤੀਬਿੰਬਿਤ ਨਹੀਂ ਕਰਦੀਆਂ।
ਅਸੀਂ ਇਹ ਨੀਤੀਆਂ ROOST Model Community(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਰਾਹੀਂ ਓਪਨ ਸੋਰਸ ਵਜੋਂ ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਤਾਂ ਜੋ ਸਹਿਯੋਗ ਅਤੇ ਦੁਹਰਾਵਾਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਜਾ ਸਕੇ। ਯੋਗਦਾਨ ਪਾਉਣ, ਫੀਡਬੈਕ ਦੇਣ ਜਾਂ ਵਾਧੂ ਕਿਸ਼ੋਰ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ ਸਾਂਝੀਆਂ ਕਰਨ ਲਈ RMC GitHub repository.(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ)
ਡਿਵੈਲਪਰ ਅਤੇ ਸੰਸਥਾਵਾਂ ਇਹਨਾਂ ਨੀਤੀਆਂ ਨੂੰ ਆਪਣੇ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਨੁਸਾਰ ਢਾਲ ਸਕਦੇ ਹਨ, ਉਨ੍ਹਾਂ ਦਾ ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਵਾਧੂ ਖਤਰਾ ਖੇਤਰਾਂ ਨੂੰ ਕਵਰ ਕਰਨ ਲਈ ਉਨ੍ਹਾਂ ਨੂੰ ਵਧਾ ਸਕਦੇ ਹਨ। ਸਮੇਂ ਦੇ ਨਾਲ, ਅਸੀਂ ਆਸ ਕਰਦੇ ਹਾਂ ਕਿ ਇਹ AI ਸਿਸਟਮਾਂ ਵਿੱਚ ਸੁਰੱਖਿਆ ਨੀਤੀਆਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਲਈ ਹੋਰ ਮਜ਼ਬੂਤ ਅਤੇ ਸਾਂਝੀ ਨੀਂਹ ਬਣਾਉਣ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਏਗਾ।
gpt-oss-safeguard ਨਾਲ ਸ਼ੁਰੂ ਕਰਨ ਲਈ, ਇਸਨੂੰ Hugging Face(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਤੋਂ ਡਾਊਨਲੋਡ ਕਰੋ।


