ਪ੍ਰਕਾਸ਼ਿਤ: 27 ਮਾਰਚ, 2024

ਓਪਨ ਮਾਡਲ weights ਬਾਰੇ NTIA ਲਈ OpenAI ਦੀ ਟਿੱਪਣੀ

ਇਹ ਟਿੱਪਣੀ OpenAI ਵੱਲੋਂ NTIA ਦੀ ਮਾਰਚ 2024 ਦੀ Dual-Use Foundation Models with Widely Available Weights ਸੰਬੰਧੀ ਜਾਣਕਾਰੀ ਮੰਗ ਦੇ ਜਵਾਬ ਵਿੱਚ ਜਮ੍ਹਾਂ ਕਰਾਈ ਗਈ ਸੀ.

ਸੁਰੱਖਿਅਤ ਅਤੇ ਲਾਭਕਾਰੀ AI ਵੱਲ ਕਈ ਰਾਹ ਹਨ.

OpenAI ਮੰਨਦਾ ਹੈ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਕਿ AI ਬਣਾਉਣਾ, ਇਸਨੂੰ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਤੈਨਾਤ ਕਰਨਾ ਅਤੇ ਵਰਤਣਾ ਲੋਕਾਂ ਦੀ ਜ਼ਿੰਦਗੀ ਸੁਧਾਰ ਸਕਦਾ ਹੈ ਅਤੇ ਇੱਕ ਬਿਹਤਰ ਭਵਿੱਖ ਖੋਲ੍ਹ ਸਕਦਾ ਹੈ। ਤਰੱਕੀ ਨਵੀਨਤਾ ਅਤੇ ਮੁਕਤ ਬਾਜ਼ਾਰ ਮੁਕਾਬਲੇ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ। ਉਹਨਾਂ ਵਿਸ਼ਾਲ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੇ ਅੰਦਰ, ਕਈ ਵੱਖ-ਵੱਖ ਰਾਹ ਹਨ ਜਿਨ੍ਹਾਂ ਰਾਹੀਂ ਲੋਕ AI ਦੇ ਵਾਅਦੇ ਨੂੰ ਅੱਗੇ ਵਧਾ ਸਕਦੇ ਹਨ। OpenAI ਉਹਨਾਂ ਪਹਿਲੇ AI ਡਿਵੈਲਪਰਾਂ ਵਿੱਚੋਂ ਸੀ ਜਿਸਨੇ ਅਭੂਤਪੂਰਵ ਸਮਰੱਥਾ ਵਾਲੇ foundation ਮਾਡਲਾਂ ਦੇ ਲਾਭ ਕਿਵੇਂ ਵੰਡਣੇ ਹਨ ਇਸ ਸਵਾਲ ਨਾਲ ਜੂਝਿਆ, ਅਤੇ NTIA ਦੀਆਂ ਵਿਚਾਰ-ਵਟਾਂਦਰਿਆਂ ਨੂੰ ਜਾਣਕਾਰੀ ਦੇਣ ਲਈ ਅਸੀਂ ਇਹ ਇਤਿਹਾਸਕ ਸੰਦਰਭ ਦੇ ਕੇ ਸ਼ੁਰੂ ਕਰਦੇ ਹਾਂ.

2019 ਵਿੱਚ, ਅਸੀਂ GPT‑2 ਬਣਾਇਆ, ਜਿਸ ਵਿੱਚ ਲਗਾਤਾਰ ਅਰਥਪੂਰਨ ਪੈਰਾਗ੍ਰਾਫ ਲਿਖਣ ਦੀ ਨਵੀਂ ਸਮਰੱਥਾ ਸੀ, ਅਤੇ ਸਾਡੇ ਸਾਹਮਣੇ ਇਹ ਸਵਾਲ ਸੀ ਕਿ ਇਸਨੂੰ ਕਿਵੇਂ ਤੈਨਾਤ ਕਰਨਾ ਹੈ। ਇੱਕ ਪਾਸੇ, ਮਾਡਲ ਬਹੁਤ ਲਾਭਕਾਰੀ ਲੱਗਦਾ ਸੀ; ਦੂਜੇ ਪਾਸੇ, ਸਾਨੂੰ ਪੂਰਾ ਯਕੀਨ ਨਹੀਂ ਸੀ⁠ ਕਿ ਕੀ ਇਹ phishing email generation ਵਰਗੇ ਦੁਸ਼ਟ ਮਕਸਦਾਂ ਲਈ ਲਾਭਕਾਰੀ ਹੋ ਸਕਦਾ ਹੈ। ਅਸੀਂ “ਚਰਣਬੱਧ ਜਾਰੀਕਰਨ” ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ। ਜਿਵੇਂ ਅਸੀਂ ਉਸ ਵੇਲੇ ਲਿਖਿਆ⁠ ਸੀ, “ਚਰਣਬੱਧ ਜਾਰੀਕਰਨ ਵਿੱਚ ਸਮੇਂ ਦੇ ਨਾਲ ਮਾਡਲਾਂ ਦੇ ਇੱਕ ਪਰਿਵਾਰ ਨੂੰ ਹੌਲੀ-ਹੌਲੀ ਜਾਰੀ ਕਰਨਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। GPT‑2 ਦੇ ਸਾਡੇ ਚਰਣਬੱਧ ਜਾਰੀਕਰਨ ਦਾ ਉਦੇਸ਼ ਲੋਕਾਂ ਨੂੰ ਇਨ੍ਹਾਂ ਮਾਡਲਾਂ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ, ਉਨ੍ਹਾਂ ਦੇ ਸਮਾਜਕ ਪ੍ਰਭਾਵਾਂ 'ਤੇ ਚਰਚਾ ਕਰਨ ਅਤੇ ਹਰ ਪੜਾਅ ਤੋਂ ਬਾਅਦ ਜਾਰੀਕਰਨ ਦੇ ਪ੍ਰਭਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਸਮਾਂ ਦੇਣਾ ਹੈ।” ਜਦੋਂ ਅਸੀਂ ਦੁਰੁਪਯੋਗ ਦੇ ਕੋਈ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਭਾਵ ਨਹੀਂ ਵੇਖੇ, ਤਾਂ ਇਸ ਨੇ ਸਾਨੂੰ ਪੂਰੇ ਮਾਡਲ ਦੇ weights ਨੂੰ ਖੁੱਲ੍ਹੇ ਤੌਰ 'ਤੇ ਜਾਰੀ ਕਰਨ⁠ ਦਾ ਭਰੋਸਾ ਦਿੱਤਾ.

2020 ਵਿੱਚ, ਅਸੀਂ GPT‑3 ਬਣਾਇਆ, ਜੋ ਹਰ benchmark 'ਤੇ ਪਿਛਲੇ ਕਿਸੇ ਵੀ language ਮਾਡਲ ਨਾਲੋਂ ਕਾਫ਼ੀ ਵੱਧ ਸਮਰੱਥਾ ਵਾਲਾ ਸੀ, ਅਤੇ ਫਿਰ ਸਾਡੇ ਸਾਹਮਣੇ ਇਹੀ ਸਵਾਲ ਸੀ ਕਿ ਇਸਨੂੰ ਕਿਵੇਂ ਜਾਰੀ ਕੀਤਾ ਜਾਵੇ। ਇਸ ਵਾਰ, ਅਸੀਂ ਇਸਨੂੰ ਆਪਣੇ ਪਹਿਲੇ ਉਤਪਾਦ, OpenAI API (Application Programming Interface, ਜੋ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸਾਡੀ ਤਕਨਾਲੋਜੀ 'ਤੇ ਐਪ ਬਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ) ਰਾਹੀਂ ਜਾਰੀ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ। ਜਿਵੇਂ ਅਸੀਂ ਉਸ ਵੇਲੇ ਲਿਖਿਆ⁠ ਸੀ, ਇਸ ਨਵੀਂ ਜਾਰੀਕਰਨ ਰਣਨੀਤੀ ਲਈ ਸਾਡੇ ਕੋਲ ਕਈ ਪ੍ਰੇਰਣਾਵਾਂ ਸਨ: “ਤਕਨਾਲੋਜੀ ਦਾ ਵਪਾਰੀਕਰਨ ਸਾਨੂੰ ਆਪਣੇ ਜਾਰੀ AI ਖੋਜ, ਸੁਰੱਖਿਆ ਅਤੇ ਨੀਤੀ ਯਤਨਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ” ਅਤੇ “API ਮਾਡਲ ਸਾਨੂੰ ਤਕਨਾਲੋਜੀ ਦੇ ਦੁਰੁਪਯੋਗ ਲਈ ਹੋਰ ਆਸਾਨੀ ਨਾਲ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਕਿਉਂਕਿ ਸਾਡੇ ਮਾਡਲਾਂ ਦੇ downstream ਵਰਤੋਂ ਮਾਮਲਿਆਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੈ, ਇਸ ਲਈ ਉਨ੍ਹਾਂ ਨੂੰ API ਰਾਹੀਂ ਜਾਰੀ ਕਰਨਾ ਅਤੇ ਸਮੇਂ ਨਾਲ ਪਹੁੰਚ ਵਧਾਉਣਾ ਆਪਣੇ ਆਪ ਵਿੱਚ ਵੱਧ ਸੁਰੱਖਿਅਤ ਲੱਗਦਾ ਹੈ, ਬਜਾਏ ਇੱਕ open source ਮਾਡਲ ਜਾਰੀ ਕਰਨ ਦੇ ਜਿੱਥੇ ਪਹੁੰਚ ਨੂੰ ਸੋਧਿਆ ਨਹੀਂ ਜਾ ਸਕਦਾ ਜੇ ਇਹ ਹਾਨੀਕਾਰਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਾਲਾ ਨਿਕਲੇ।” ਕਈ ਸਾਲਾਂ ਦੌਰਾਨ, ਇਸ API ਜਾਰੀਕਰਨ ਨੇ ਸਾਨੂੰ ਅਤੇ ਭਾਈਚਾਰੇ ਨੂੰ GPT‑3 ਪੱਧਰ ਦੇ ਮਾਡਲਾਂ ਦੀ ਸੁਰੱਖਿਆ ਅਤੇ ਦੁਰੁਪਯੋਗ ਦੇ ਰੁਝਾਨਾਂ ਬਾਰੇ ਸਬਕ⁠ ਸਿਖਾਏ.

ਉਸ ਤੋਂ ਬਾਅਦ ਦੇ ਸਾਲਾਂ ਵਿੱਚ, ਅਸੀਂ open-source AI ecosystem ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਅਤੇ ਉਸਦੇ ਵਾਅਦੇ 'ਤੇ ਵਿਸ਼ਵਾਸ ਕਰਦੇ ਰਹੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਸਾਡੇ ਕੁਝ state-of-the-art ਮਾਡਲਾਂ (ਜਿਵੇਂ CLIP ਅਤੇ Whisper) ਦੇ weights ਨੂੰ ਖੁੱਲ੍ਹੇ ਤੌਰ 'ਤੇ ਜਾਰੀ ਕਰਨਾ ਅਤੇ ਹੋਰ AI ਡਿਵੈਲਪਰਾਂ ਲਈ open-source infrastructure ਵਿਕਸਿਤ ਕਰਨਾ (ਜਿਵੇਂ Triton GPU programming language) ਸ਼ਾਮਲ ਹੈ। ਅਸੀਂ ਵੇਖਿਆ ਹੈ ਕਿ ਖੁੱਲ੍ਹੇ ਤੌਰ 'ਤੇ ਜਾਰੀ ਕੀਤੇ weights ਕਈ ਮਹੱਤਵਪੂਰਨ ਲਾਭ ਲਿਆਉਂਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ AI ਮਾਡਲਾਂ ਦੇ ਅੰਦਰੂਨੀ ਢਾਂਚੇ 'ਤੇ ਅਕਾਦਮਿਕ ਖੋਜ ਨੂੰ ਆਸਾਨ ਬਣਾਉਣਾ, ਉਪਭੋਗਤਾਵਾਂ ਅਤੇ ਸੰਸਥਾਵਾਂ ਨੂੰ ਆਪਣੇ edge devices 'ਤੇ ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਮਾਡਲ ਚਲਾਉਣ ਦੀ ਸਮਰੱਥਾ ਦੇਣਾ, ਅਤੇ ਮਾਡਲਾਂ ਵਿੱਚ ਰਚਨਾਤਮਕ ਸੋਧਾਂ ਨੂੰ ਆਸਾਨ ਬਣਾਉਣਾ ਸ਼ਾਮਲ ਹੈ ਤਾਂ ਜੋ ਉਹ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਮੰਤਵਾਂ ਅਨੁਸਾਰ ਬਣ ਸਕਣ। ਕਈ AI ਕੰਪਨੀਆਂ ਨੇ ਵੱਖ-ਵੱਖ ਕਾਰਨਾਂ ਕਰਕੇ open ਮਾਡਲ weight releases ਵਿੱਚ ਵੱਡਾ ਨਿਵੇਸ਼ ਕਰਨ ਦੀ ਚੋਣ ਕੀਤੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਬ੍ਰਾਂਡ, ਭਰਤੀ, ਅਤੇ ਡਿਵੈਲਪਰ ecosystem ਨੂੰ ਆਕਰਸ਼ਿਤ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ ਜੋ ਕੰਪਨੀ ਦੀ ਤਕਨਾਲੋਜੀ ਦੇ ਅੰਦਰੂਨੀ ਹਿੱਸਿਆਂ 'ਤੇ ਨਿਰਮਾਣ ਕਰੇ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ ਕਰੇ.

ਇਸੇ ਵੇਲੇ, APIs ਅਤੇ ChatGPT ਵਰਗੇ ਵਪਾਰਕ ਉਤਪਾਦਾਂ ਰਾਹੀਂ ਆਪਣੇ ਮੁੱਖ AI ਮਾਡਲਾਂ ਨੂੰ ਜਾਰੀ ਕਰਨ ਦੀ ਸਾਡੀ ਪਹੁੰਚ ਨੇ ਸਾਨੂੰ ਉਹਨਾਂ ਖਤਰਿਆਂ ਦਾ ਅਧਿਐਨ ਅਤੇ ਰੋਕਥਾਮ ਜਾਰੀ ਰੱਖਣ ਦੇ ਯੋਗ ਬਣਾਇਆ ਹੈ ਜੋ ਅਸੀਂ ਸ਼ੁਰੂਆਤੀ ਜਾਰੀਕਰਨ ਤੋਂ ਬਾਅਦ ਲੱਭੇ, ਅਤੇ ਅਕਸਰ ਉਹਨਾਂ ਤਰੀਕਿਆਂ ਨਾਲ ਜੋ ਸੰਭਵ ਨਾ ਹੁੰਦੇ ਜੇ weights ਆਪ ਹੀ ਜਾਰੀ ਕਰ ਦਿੱਤੇ ਜਾਂਦੇ। ਉਦਾਹਰਨ ਲਈ, ਅਸੀਂ ਹਾਲ ਹੀ ਵਿੱਚ Microsoft ਨਾਲ ਮਿਲ ਕੇ ਕੁਝ ਰਾਸ਼ਟਰ-ਰਾਜ ਸਾਈਬਰ ਖਤਰਾ ਅਦਾਕਾਰਾਂ ਦੀਆਂ ਕਾਰਵਾਈਆਂ ਨੂੰ ਪਤਾ ਲਗਾਉਣ, ਅਧਿਐਨ ਕਰਨ ਅਤੇ ਵਿਘਟਿਤ ਕਰਨ⁠ ਲਈ ਭਾਗੀਦਾਰੀ ਕੀਤੀ, ਜੋ ਸਾਡੇ GPT‑3.5‑Turbo ਅਤੇ GPT‑4 ਮਾਡਲਾਂ ਦਾ cyberoffensive ਕਾਰਵਾਈਆਂ ਵਿੱਚ ਸਹਾਇਤਾ ਲਈ ਦੁਰੁਪਯੋਗ ਕਰ ਰਹੇ ਸਨ। ਜੇ ਉਸ ਵੇਲੇ ਦੇ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲਾਂ ਦੇ weights ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਜਾਰੀ ਕਰ ਦਿੱਤੇ ਜਾਂਦੇ, ਤਾਂ ਇਨ੍ਹਾਂ ਖਤਰਾ ਅਦਾਕਾਰਾਂ ਨੂੰ ਵਿਘਟਿਤ ਕਰਨਾ ਸੰਭਵ ਨਾ ਹੁੰਦਾ, ਕਿਉਂਕਿ ਉਹੀ ਸਾਈਬਰ ਖਤਰਾ ਅਦਾਕਾਰ ਮਾਡਲ ਨੂੰ ਆਪਣੇ ਹੀ hardware 'ਤੇ host ਕਰ ਸਕਦੇ ਸਨ ਅਤੇ ਕਦੇ ਵੀ ਮੂਲ ਡਿਵੈਲਪਰ ਨਾਲ ਸੰਪਰਕ ਵਿੱਚ ਨਾ ਆਉਂਦੇ। ਇਸ ਪਹੁੰਚ ਨੇ ਸਾਨੂੰ AI ਦੇ ਲਾਭਾਂ ਨੂੰ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵੰਡਣਾ ਜਾਰੀ ਰੱਖਣ ਯੋਗ ਬਣਾਇਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਮੁਫ਼ਤ ਅਤੇ ਘੱਟ ਲਾਗਤ ਵਾਲੀਆਂ ਸੇਵਾਵਾਂ ਰਾਹੀਂ ਵੀ ਸ਼ਾਮਲ ਹੈ.

ਇਨ੍ਹਾਂ ਤਜਰਬਿਆਂ ਨੇ ਸਾਨੂੰ ਯਕੀਨ ਦਿਵਾਇਆ ਹੈ ਕਿ open weights releases ਅਤੇ API ਅਤੇ ਉਤਪਾਦ-ਅਧਾਰਿਤ releases ਦੋਵੇਂ ਲਾਭਕਾਰੀ AI ਹਾਸਲ ਕਰਨ ਦੇ ਸਾਧਨ ਹਨ, ਅਤੇ ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਸਭ ਤੋਂ ਵਧੀਆ ਅਮਰੀਕੀ AI ecosystem ਵਿੱਚ ਦੋਵੇਂ ਸ਼ਾਮਲ ਹੋਣਗੇ.

ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਨਾਲ ਦੁਹਰਾਏ ਜਾਣ ਵਾਲੇ ਤੈਨਾਤੀਕਰਨ ਦਾ ਸੰਯੋਗ

ਬਾਰ-ਬਾਰ, ਉਤਪਾਦ ਜਾਰੀਕਰਨਾਂ ਅਤੇ weight releases ਦੋਵੇਂ ਵਿੱਚ, ਅਸੀਂ “ਦੁਹਰਾਏ ਜਾਣ ਵਾਲੇ ਤੈਨਾਤੀਕਰਨ” ਦੇ ਅਦਭੁਤ ਲਾਭ ਵੇਖੇ ਹਨ: ਵਧਦੀ ਸਮਰੱਥਾ ਵਾਲੇ AI ਨੂੰ ਹੌਲੀ-ਹੌਲੀ ਲੋਕਾਂ ਦੇ ਹੱਥਾਂ ਵਿੱਚ ਦੇਣਾ ਤਾਂ ਜੋ ਉਹ ਇਸਦੀ ਵਰਤੋਂ ਆਪਣੀ ਜ਼ਿੰਦਗੀ ਸੁਧਾਰਣ ਲਈ ਕਰ ਸਕਣ, ਅਤੇ ਸਮਾਜ ਨੂੰ ਇਨ੍ਹਾਂ ਨਵੀਆਂ ਤਕਨਾਲੋਜੀਆਂ ਨਾਲ ਅਨੁਕੂਲ ਹੋਣ ਵਿੱਚ ਮਦਦ ਕਰਨਾ। ਜਿਵੇਂ ਅਸੀਂ 2023 ਵਿੱਚ ਲਿਖਿਆ⁠ ਸੀ: “ਅਸੀਂ ਤੈਨਾਤੀਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਅਗਾਊਂ ਦਿੱਸਣ ਵਾਲੇ ਖਤਰਿਆਂ ਨੂੰ ਰੋਕਣ ਲਈ ਬਹੁਤ ਮਿਹਨਤ ਕਰਦੇ ਹਾਂ, ਪਰ ਇੱਕ ਹੱਦ ਹੈ ਕਿ ਅਸੀਂ ਲੈਬ ਵਿੱਚ ਕੀ ਕੁਝ ਸਿੱਖ ਸਕਦੇ ਹਾਂ। ਵਿਸਤ੍ਰਿਤ ਖੋਜ ਅਤੇ ਟੈਸਟਿੰਗ ਦੇ ਬਾਵਜੂਦ, ਅਸੀਂ ਨਾ ਤਾਂ ਲੋਕਾਂ ਵੱਲੋਂ ਸਾਡੀ ਤਕਨਾਲੋਜੀ ਦੇ ਸਾਰੇ ਲਾਭਕਾਰੀ ਵਰਤੋਂ ਤਰੀਕਿਆਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰ ਸਕਦੇ ਹਾਂ ਅਤੇ ਨਾ ਹੀ ਸਾਰੇ ਦੁਰੁਪਯੋਗ ਦੇ ਤਰੀਕਿਆਂ ਦੀ। ਇਸੀ ਲਈ ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਅਸਲ ਦੁਨੀਆ ਦੀ ਵਰਤੋਂ ਤੋਂ ਸਿੱਖਣਾ ਸਮੇਂ ਦੇ ਨਾਲ ਹੋਰ ਸੁਰੱਖਿਅਤ AI ਸਿਸਟਮ ਬਣਾਉਣ ਅਤੇ ਜਾਰੀ ਕਰਨ ਦਾ ਇੱਕ ਨਿਰਣਾਇਕ ਹਿੱਸਾ ਹੈ।”

ਜਿਵੇਂ-जਿਵੇਂ AI ਮਾਡਲ ਹੋਰ ਤਾਕਤਵਰ ਬਣਦੇ ਹਨ ਅਤੇ ਉਨ੍ਹਾਂ ਦੀ ਤੈਨਾਤੀ ਜਾਂ ਜਾਰੀਕਰਨ ਦੇ ਲਾਭ ਅਤੇ ਖਤਰੇ ਵਧਦੇ ਹਨ, ਇਹ ਵੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ ਅਸੀਂ ਇਹ ਫੈਸਲਾ ਕਰਨ ਵਿੱਚ ਹੋਰ ਸੁਧਰੇ ਹੋਈਏ ਕਿ ਕਿਸੇ ਮਾਡਲ ਨੂੰ ਕਦੋਂ ਅਤੇ ਕਿਵੇਂ ਤੈਨਾਤ ਕਰਨਾ ਹੈ। ਇਹ ਖਾਸ ਤੌਰ 'ਤੇ ਤਦ ਸੱਚ ਹੈ ਜੇ AI ਸਮਰੱਥਾਵਾਂ ਜਨਤਕ ਸੁਰੱਖਿਆ ਜਾਂ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਲਈ ਮਹੱਤਵਪੂਰਨ ਅਰਥ ਰੱਖਣ ਲੱਗਣ। ਹੋਰ ਉੱਨਤ AI ਸਿਸਟਮਾਂ ਤੋਂ ਅਜਿਹੇ “ਤਬਾਹੀਕਾਰ” ਖਤਰਿਆਂ ਦੀ ਭਵਿੱਖੀ ਮੌਜੂਦਗੀ ਆਪਣੇ ਸੁਭਾਵ ਵਿੱਚ ਅਨਿਸ਼ਚਿਤ ਹੈ, ਅਤੇ ਇਸ ਬਾਰੇ ਵਿਦਵਾਨਾਂ ਵਿਚ ਅਸਹਿਮਤੀ ਹੈ ਕਿ ਅਜੇਹੇ ਖਤਰੇ ਕਿੰਨੇ ਸੰਭਾਵੀ ਹਨ ਅਤੇ ਕਿੰਨੀ ਜਲਦੀ ਉੱਭਰਨਗੇ। ਅਸੀਂ ਨਹੀਂ ਮੰਨਦੇ ਕਿ ਅਜੇ ਕਾਫ਼ੀ ਸਬੂਤ ਹਨ; ਅਸੀਂ ਉਨ੍ਹਾਂ ਨੂੰ ਨਕਾਰ ਨਹੀਂ ਸਕਦੇ, ਨਾ ਹੀ ਇਹ ਯਕੀਨੀ ਕਹਿ ਸਕਦੇ ਹਾਂ ਕਿ ਉਹ ਤੁਰੰਤ ਆ ਰਹੇ ਹਨ। AI ਸਮਰੱਥਾਵਾਂ ਦੇ ਅਤਿ-ਆਧੁਨਿਕ ਪੱਧਰ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਵਾਲੇ ਡਿਵੈਲਪਰ ਹੋਣ ਦੇ ਨਾਤੇ, ਤਾਂ ਜੋ ਉਨ੍ਹਾਂ ਦੇ ਲਾਭ ਵੱਧ ਤੋਂ ਵੱਧ ਹੋਣ, ਅਸੀਂ ਇਸ ਤਕਨਾਲੋਜੀ ਦੇ ਖਤਰਿਆਂ ਦੇ ਵਿਗਿਆਨ ਨੂੰ ਬਣਾਉਣਾ (ਜਿਸ ਵਿੱਚ ਉਨ੍ਹਾਂ ਖਤਰਿਆਂ ਨਾਲ ਜੁੜੇ ਸਬੂਤ ਇਕੱਠੇ ਕਰਨੇ ਸ਼ਾਮਲ ਹਨ) ਆਪਣੇ ਕੰਮ ਦਾ ਅਭਿੰਨ ਹਿੱਸਾ ਮੰਨਦੇ ਹਾਂ.

ਇਨ੍ਹਾਂ ਅਨਿਸ਼ਚਿਤਤਾਵਾਂ ਨੂੰ ਅਨੁਭਵ-ਚਲਿਤ ਢੰਗ ਨਾਲ ਸਮਝਣ ਲਈ, OpenAI ਨੇ ਜਨਤਕ ਤੌਰ 'ਤੇ ਆਪਣਾ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਸ਼ੁਰੂ ਕੀਤਾ, ਜੋ ਇੱਕ ਵਿਗਿਆਨ-ਆਧਾਰਿਤ ਪਹੁੰਚ ਹੈ ਜਿਸ ਰਾਹੀਂ ਸਾਡੇ AI ਮਾਡਲਾਂ ਵੱਲੋਂ ਪੈਦਾ ਹੋ ਸਕਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਦਾ ਲਗਾਤਾਰ ਮੁਲਾਂਕਣ ਅਤੇ ਨਿਬਾਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ ਕਿ ਅਸੀਂ ਕਈ ਉੱਚ-ਖਤਰਾ ਖੇਤਰਾਂ ਵਿੱਚ ਆਪਣੇ AI ਮਾਡਲਾਂ ਦੀ ਸਮਰੱਥਾ ਦੇ ਪੱਧਰਾਂ ਦਾ ਕਿਵੇਂ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ cybersecurity, autonomous operation, individualized persuasion, ਅਤੇ CBRN (Chemical, Biological, Radiological, and Nuclear) threats ਸ਼ਾਮਲ ਹਨ। ਇਸ ਫ੍ਰੇਮਵਰਕ ਦੇ ਕਾਰਜਰੂਪ ਦਾ ਇੱਕ ਉਦਾਹਰਨ ਦੇਖਣ ਲਈ GPT‑4 ਦੀ ਜੈਵਿਕ ਖਤਰਾ-ਸਿਰਜਣ ਵਿੱਚ ਸਹਾਇਤਾ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦੀ ਜਾਂਚ ਕਰਨ ਵਾਲਾ ਸਾਡਾ ਹਾਲੀਆ ਅਧਿਐਨ⁠ ਵੇਖੋ, ਜਿਸ ਦਾ ਨਤੀਜਾ ਸੀ ਕਿ ਇਹ ਕੋਈ ਮਹੱਤਵਪੂਰਨ ਵਾਧੂ ਖਤਰਾ ਪੈਦਾ ਨਹੀਂ ਕਰਦਾ.

ਇਨ੍ਹਾਂ ਮੁਲਾਂਕਣਾਂ ਦੇ ਆਧਾਰ 'ਤੇ, ਅਸੀਂ ਹਰ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਮਾਡਲਾਂ ਦੇ ਖਤਰਾ ਪੱਧਰ ਨੂੰ Low, Medium, High, ਜਾਂ Critical ਵਜੋਂ ਮਾਪਦੇ ਹਾਂ। ਮਹੱਤਵਪੂਰਨ ਤੌਰ 'ਤੇ, ਸਾਡੇ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਅਧੀਨ, ਅਸੀਂ ਉਹ AI ਸਿਸਟਮ ਤੈਨਾਤ ਨਹੀਂ ਕਰਾਂਗੇ ਜੋ ਸਾਡੀ taxonomy ਵਿੱਚ “High” ਜਾਂ “Critical” ਖਤਰਾ ਪੱਧਰ ਰੱਖਦੇ ਹਨ (ਅਤੇ “Critical” ਵਾਲਿਆਂ ਨੂੰ ਤਾਂ ਉਨ੍ਹਾਂ ਦੇ ਖਤਰੇ ਦੇ ਪੱਧਰ ਕਰਕੇ ਟ੍ਰੇਨ ਵੀ ਨਹੀਂ ਕਰਾਂਗੇ), ਜਦ ਤੱਕ ਸਾਡੇ mitigation ਉਪਾਅ ਇਨ੍ਹਾਂ ਸਿਸਟਮਾਂ ਦੇ ਖਤਰੇ ਨੂੰ ਘਟਾ ਕੇ ਵੱਧ ਤੋਂ ਵੱਧ “Medium” ਪੱਧਰ ਤੱਕ ਨਾ ਲਿਆਉਣ। ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਇਸ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿਉਂਕਿ ਇਹ ਸਾਨੂੰ ਵਧਦੀ ਸਮਰੱਥਾ ਵਾਲੇ AI ਦੇ ਲਾਭ ਬਣਾਉਣ ਅਤੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਸਾਂਝੇ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਨਾਲ ਹੀ ਜੇ ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਉੱਭਰਨ ਤਾਂ ਉਨ੍ਹਾਂ ਨੂੰ ਸਭ ਤੋਂ ਜਲਦੀ ਪਛਾਣਣ ਅਤੇ ਰੋਕਣ ਲਈ ਸਾਨੂੰ ਤਿਆਰ ਕਰਦਾ ਹੈ.

ਬਹੁਤ ਸਮਰੱਥਾ ਵਾਲੇ AI ਦੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਅਭਿਆਸ

ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਲੋਕਾਂ ਅਤੇ ਕੰਪਨੀਆਂ ਨੂੰ ਆਪਣੀ ਚੋਣ ਅਨੁਸਾਰ AI ਵਿੱਚ ਭਾਗ ਲੈ ਸਕਣਾ ਚਾਹੀਦਾ ਹੈ — ਜਿਸ ਵਿੱਚ ਆਪਣੀਆਂ ਮੁੱਲਾਂ ਅਤੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਦਰਸਾਉਣ ਵਾਲਾ AI ਤਿਆਰ ਕਰਨਾ ਜਾਂ ਵਰਤਣਾ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ — ਤਾਂ ਜੋ AI ਦੇ ਲਾਭ ਹਾਸਲ ਕੀਤੇ ਜਾ ਸਕਣ। ਇਸੇ ਵੇਲੇ, ਬਹੁਤ ਉੱਚ ਸਮਰੱਥਾ ਵਾਲੇ AI ਸਿਸਟਮ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਬਣਾਏ ਅਤੇ ਵਰਤੇ ਜਾਣੇ ਚਾਹੀਦੇ ਹਨ, ਅਤੇ ਪਤਾ ਲੱਗਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਨੂੰ ਢੰਗ ਨਾਲ ਘਟਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ ਹਿੱਤ ਕਈ ਵਾਰ ਆਪਸੀ ਤਣਾਅ ਵਿੱਚ ਹੋ ਸਕਦੇ ਹਨ, ਅਤੇ ਸਮਾਜ ਲਈ ਸਭ ਤੋਂ ਚੰਗੇ ਨਤੀਜੇ ਹਾਸਲ ਕਰਨ ਲਈ ਇਨ੍ਹਾਂ ਨੂੰ ਖਾਸ ਮਾਮਲੇ ਅਨੁਸਾਰ ਸੋਚ-ਵਿਚਾਰ ਨਾਲ ਸੰਭਾਲਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਉਹਨਾਂ ਬਹੁਤ ਸਮਰੱਥਾ ਵਾਲੇ foundation ਮਾਡਲਾਂ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਜਿਨ੍ਹਾਂ ਨੂੰ ਬਣਾਉਣ ਲਈ ਵੱਡੇ ਸਰੋਤਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ (ਲਗਭਗ ਸੈਂਕੜਿਆਂ ਮਿਲੀਅਨ ਡਾਲਰ ਜਾਂ ਇਸ ਤੋਂ ਵੱਧ ਦੇ ਪੱਧਰ 'ਤੇ), ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ AI ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਆਪਣੇ ਮਾਡਲ ਵੱਲੋਂ ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਪੈਦਾ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਜੇ ਮਾਡਲ ਦਾ ਖਤਰਾ ਪੱਧਰ ਉੱਚਾ ਮਿਲੇ, ਤਾਂ ਇਸਨੂੰ ਤੈਨਾਤ ਜਾਂ ਜਾਰੀ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਉਚਿਤ ਰੋਕਥਾਮੀ ਉਪਾਅ ਲਾਗੂ ਕਰਨੇ ਚਾਹੀਦੇ ਹਨ। ਇਹ ਖਤਰਾ-ਪ੍ਰਬੰਧਨ ਅਤੇ ਨਵੀਨਤਾ ਵਿਚਕਾਰ ਉਚਿਤ ਸੰਤੁਲਨ ਬਣਾਉਂਦਾ ਹੈ: ਇਹ ਮਾਡਲ ਸਭ ਤੋਂ ਵੱਧ ਸਮਰੱਥਾਵਾਂ ਵਾਲੇ ਹੋਣ ਦੀ ਉਮੀਦ ਕੀਤੀ ਜਾਂਦੀ ਹੈ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ), ਜਦਕਿ ਮੁਲਾਂਕਣ ਦੀ ਲਾਗਤ ਉਨ੍ਹਾਂ ਦੇ ਵਿਕਾਸ ਖਰਚ ਦਾ ਵੱਧ ਤੋਂ ਵੱਧ ਸਿਰਫ਼ ਇੱਕ ਛੋਟਾ ਹਿੱਸਾ ਹੁੰਦੀ ਹੈ। ਅਜੇਹੇ ਮੁਲਾਂਕਣ ਤਦ ਵੀ ਤਰਕਸੰਗਤ ਹਨ ਜਦੋਂ ਮਾਡਲ ਦੇ weights ਨੂੰ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਜਾਂ API ਰਾਹੀਂ ਜਾਰੀ ਕਰਨ ਦਾ ਇਰਾਦਾ ਹੋਵੇ ਜਾਂ ਨਾ ਹੋਵੇ.

ਦੂਜੇ ਪਾਸੇ, ਘੱਟ ਸਰੋਤ-ਗਾਹਕ foundation ਮਾਡਲਾਂ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਹਿੱਤਾਂ ਦਾ ਸੰਤੁਲਨ ਵੱਖਰਾ ਹੈ। ਮੌਜੂਦਾ ਸਬੂਤਾਂ ਦੇ ਆਧਾਰ 'ਤੇ, ਅਜੇਹੇ ਮਾਡਲ ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਪੈਦਾ ਕਰਨ ਦੀ ਬਹੁਤ ਘੱਟ ਸੰਭਾਵਨਾ ਵਾਲੇ ਦਿਸਦੇ ਹਨ, ਭਾਵੇਂ finetuning ਅਤੇ ਮਾਡਲ-ਸੋਧ ਤਕਨੀਕਾਂ ਵਿੱਚ ਸੰਭਾਵਿਤ ਤਰੱਕੀ ਵੀ ਹੋਵੇ। ਇਸੇ ਦੌਰਾਨ, ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਲਈ ਮੁਲਾਂਕਣ ਛੋਟੀਆਂ ਟ੍ਰੇਨਿੰਗ ਦੌੜਾਂ ਦੇ ਬਜਟ ਦਾ ਇੱਕ ਵੱਡਾ ਹਿੱਸਾ ਖਾ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਨਵੀਨਤਾ ਅਤੇ ਮੁਕਾਬਲੇ 'ਤੇ ਠੰਢਾ ਪ੍ਰਭਾਵ ਪੈ ਸਕਦਾ ਹੈ। ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਇਨ੍ਹਾਂ ਮਾਡਲਾਂ ਲਈ ਤਬਾਹੀਕਾਰ ਖਤਰੇ ਦੇ ਅਜੇਹੇ ਮੁਲਾਂਕਣ ਦੀ ਉਮੀਦ ਨਹੀਂ ਰੱਖਣੀ ਚਾਹੀਦੀ, ਕਿਉਂਕਿ ਡਿਵੈਲਪਰਾਂ ਦੀ ਨਵੀਆਂ ਤੇ ਰੋਮਾਂਚਕ AI ਸਮਰੱਥਾਵਾਂ 'ਤੇ ਨਵੀਨਤਾ ਕਰਨ ਦੀ ਵਿਭਿੰਨ ਯੋਗਤਾ ਦੀ ਰੱਖਿਆ ਕਰਨ ਅਤੇ ਵਿਚਾਰਾਂ ਤੇ ਉਤਪਾਦਾਂ ਦੇ ਬਾਜ਼ਾਰ ਨੂੰ ਫਲਣ-ਫੂਲਣ ਦੇਣ ਵਿੱਚ ਬਹੁਤ ਵੱਡੀ ਕਦਰ ਹੈ, ਅਤੇ ਵਿਗਿਆਨ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਇਨ੍ਹਾਂ ਮਾਡਲਾਂ ਦਾ ਖਤਰਾ ਤੁਲਨਾਤਮਕ ਤੌਰ 'ਤੇ ਘੱਟ ਹੈ.

ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਵਰਗੇ ਮੁਲਾਂਕਣ ਪ੍ਰੋਟੋਕੋਲ ਕਿਸੇ ਵੀ ਕਿਸਮ ਦੇ ਮਾਡਲ ਜਾਰੀਕਰਨ, ਜਿਸ ਵਿੱਚ ਓਪਨ ਮਾਡਲ weight ਜਾਰੀਕਰਨ ਵੀ ਸ਼ਾਮਲ ਹਨ, ਤੋਂ ਹੋਣ ਵਾਲੇ ex ante ਖਤਰਿਆਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਇੱਕ ਲਾਭਕਾਰੀ ਸਾਧਨ ਹਨ। ਉਨ੍ਹਾਂ ਨੂੰ open weights releases 'ਤੇ ਲਾਗੂ ਕਰਨ ਲਈ ਕੁਝ ਵਿਚਾਰ ਖਾਸ ਹਨ।

ਇੱਕ ਅਜਿਹਾ ਵਿਚਾਰ ਇਹ ਹੈ ਕਿ ਟੈਸਟਿੰਗ ਹਾਲਾਤ ਆਦਰਸ਼ ਤੌਰ 'ਤੇ ਉਨ੍ਹਾਂ ਤਰੀਕਿਆਂ ਦੀ ਰੇਂਜ ਨੂੰ ਦਰਸਾਉਣ ਜਿਸ ਰਾਹੀਂ downstream ਪੱਖ ਮਾਡਲ ਨੂੰ ਸੋਧ ਸਕਦੇ ਹਨ। ਓਪਨ ਮਾਡਲਾਂ ਦੀਆਂ ਸਭ ਤੋਂ ਲਾਭਕਾਰੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਹ ਹੈ ਕਿ downstream ਪੱਖ ਮਾਡਲਾਂ ਨੂੰ ਸੋਧ ਕੇ ਉਨ੍ਹਾਂ ਦੀਆਂ ਸ਼ੁਰੂਆਤੀ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾ ਸਕਦੇ ਹਨ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਡਿਵੈਲਪਰ ਦੀਆਂ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਨੁਸਾਰ ਢਾਲ ਸਕਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਇਸਦਾ ਇਹ ਵੀ ਮਤਲਬ ਹੈ ਕਿ ਦੁਸ਼ਟ ਪੱਖ ਸੰਭਵਤ: ਮਾਡਲ ਦੀਆਂ ਹਾਨੀਕਾਰਕ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾ ਸਕਦੇ ਹਨ। ਇਸ ਲਈ open-weights release ਦੇ ਖਤਰਿਆਂ ਦਾ ਸਖ਼ਤੀ ਨਾਲ ਮੁਲਾਂਕਣ ਕਰਨ ਵਿੱਚ ਉਨ੍ਹਾਂ ਵਾਜਬ ਤਰੀਕਿਆਂ ਲਈ ਟੈਸਟਿੰਗ ਸ਼ਾਮਲ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ ਜਿਨ੍ਹਾਂ ਰਾਹੀਂ ਕੋਈ ਦੁਸ਼ਟ ਪੱਖ ਹਕੀਕਤ ਵਿੱਚ ਮਾਡਲ ਨੂੰ ਸੋਧ ਸਕਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ finetuning ਰਾਹੀਂ ਵੀ ਸ਼ਾਮਲ ਹੈ। OpenAI ਪਹਿਲਾਂ ਹੀ ਸਾਡੇ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਕੁਝ modification-testing ਕਰਦਾ ਹੈ (ਜਿਵੇਂ ਅਸੀਂ ਆਪਣੇ ਜੈਵਿਕ ਖਤਰਾ ਮੁਲਾਂਕਣ⁠ ਵਿੱਚ ਕੀਤਾ ਸੀ)।

ਇੱਕ ਹੋਰ ਮੁੱਖ ਵਿਚਾਰ ਇਹ ਹੈ ਕਿ ਓਪਨ ਮਾਡਲ ਡਿਵੈਲਪਰ ਆਪਣੇ ਮਾਡਲ ਦੇ ਦੁਰੁਪਯੋਗ ਦੇ ਖਤਰੇ ਨੂੰ ਘਟਾਉਣ ਲਈ ਸਿਸਟਮ-ਪੱਧਰੀ ਸੁਰੱਖਿਆ ਉਪਾਅ 'ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਕਿਉਂਕਿ ਜੇ ਕਿਸੇ ਦੁਸ਼ਟ downstream ਉਪਭੋਗਤਾ ਕੋਲ ਮਾਡਲ ਦੇ weights ਹੋਣ ਤਾਂ ਉਹ ਅਕਸਰ ਇਨ੍ਹਾਂ ਸੁਰੱਖਿਆਵਾਂ ਨੂੰ ਹਟਾ ਸਕਦਾ ਹੈ। ਅੱਜ, ਖਤਰਾ ਘਟਾਉਣ ਦੀ ਸਮਰੱਥਾ ਵਿੱਚ ਇਹ ਫ਼ਰਕ ਸੀਮਿਤ ਨਤੀਜੇ ਰੱਖਦਾ ਹੈ, ਕਿਉਂਕਿ ਸਾਡੇ ਮੌਜੂਦਾ ਸਭ ਤੋਂ ਸਮਰੱਥਾ ਵਾਲੇ ਮਾਡਲ ਵੀ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਖਤਰਨਾਕ ਦਰਜ ਨਹੀਂ ਕੀਤੇ ਗਏ। ਪਰ ਜੇ ਭਵਿੱਖ ਦਾ ਕੋਈ ਮਾਡਲ ਵਿਗਿਆਨਕ ਤੌਰ 'ਤੇ ਇਹ ਨਿਰਧਾਰਤ ਹੋਵੇ ਕਿ ਜਾਰੀ ਹੋਣ 'ਤੇ ਉਹ ਗੰਭੀਰ ਖਤਰੇ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਤਾਂ open-weights release ਦੇ ਖਤਰੇ ਨੂੰ ਘਟਾਉਣ ਦਾ ਰਸਤਾ ਉਸ ਬਾਹਰੀ ਵਾਤਾਵਰਣ ਦੀ ਲਚੀਲਤਾਪਣ ਵਧਾਉਣ 'ਤੇ ਨਿਰਭਰ ਕਰ ਸਕਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਮਾਡਲ ਜਾਰੀ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

AI ਦੇ ਦੁਰੁਪਯੋਗ ਵਿਰੁੱਧ ਸਮਾਜਕ ਲਚੀਲਤਾਪਣ ਦੀ ਲੋੜ ਕਿਸੇ ਇੱਕ ਸੰਸਥਾ ਦੇ ਜਾਰੀਕਰਨ ਫੈਸਲਿਆਂ ਨਾਲੋਂ ਕਾਫ਼ੀ ਵੱਡੀ ਹੈ। AI algorithms ਵਿੱਚ ਜਾਰੀ ਤਰੱਕੀ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਪ੍ਰਸਾਰ, ਅਤੇ compute ਤੱਕ ਵਧ ਰਹੀ ਵਿਆਪਕ ਪਹੁੰਚ (ਜਿਸ ਵਿੱਚ ਸੰਯੁਕਤ ਰਾਜ ਲਈ ਚਿੰਤਾਜਨਕ ਦੇਸ਼ ਵੀ ਸ਼ਾਮਲ ਹਨ) ਨੂੰ ਵੇਖਦਿਆਂ, ਅੱਜ ਦੀਆਂ ਅਤਿ-ਆਧੁਨਿਕ AI ਸਮਰੱਥਾਵਾਂ — ਜੋ ਬਣਨ ਦੇ ਵੇਲੇ ਅਕਸਰ ਕੁਝ ਹੀ ਪੱਖਾਂ ਲਈ ਉਪਲਬਧ ਹੁੰਦੀਆਂ ਹਨ — ਆਖ਼ਿਰਕਾਰ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਫੈਲ ਜਾਣਗੀਆਂ। ਸੰਯੁਕਤ ਰਾਜ ਅਤੇ ਦੁਨੀਆ ਭਰ ਦੇ ਦੇਸ਼ਾਂ ਕੋਲ ਅਜਿਹੇ ਉਪਾਅ ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰਨ ਅਤੇ ਅਗਵਾਈ ਕਰਨ ਦਾ ਮੌਕਾ ਵੀ ਹੈ ਜੋ ਦੁਰੁਪਯੋਗ ਦੇ ਨਤੀਜਿਆਂ ਨੂੰ ਸੀਮਿਤ ਕਰਨਗੇ, ਤਾਂ ਜੋ ਨਤੀਜਿਆਂ ਦਾ ਸੰਤੁਲਨ ਸਭ ਤੋਂ ਵੱਧ ਸਕਾਰਾਤਮਕ ਹੋਵੇ।

ਉਦਾਹਰਨ ਲਈ, AI-ਦੁਆਰਾ ਤੇਜ਼ ਕੀਤੇ ਗਏ ਸਾਈਬਰ ਹਮਲੇ ਦੇ ਖਤਰਿਆਂ ਵਿਰੁੱਧ ਲਚੀਲਤਾਪਣ ਮਜ਼ਬੂਤ ਕਰਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਪ੍ਰਦਾਤਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਹੀ AI ਮਾਡਲਾਂ ਤੱਕ ਪਹਿਲਾਂ ਪਹੁੰਚ ਦੇਣਾ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ, ਤਾਂ ਜੋ ਉਹ ਸਾਈਬਰ-ਰੱਖਿਆ ਸੁਧਾਰਨ ਲਈ ਵਰਤੇ ਜਾ ਸਕਣ (ਜਿਵੇਂ ਕਿ OpenAI Cybersecurity Grant Program⁠ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਸਾਡੇ ਵੱਲੋਂ ਫੰਡ ਕੀਤੀਆਂ ਸ਼ੁਰੂਆਤੀ ਪਰਿਯੋਜਨਾਵਾਂ ਵਿੱਚ)। AI-ਦੁਆਰਾ ਤੇਜ਼ ਕੀਤੇ ਗਏ ਜੈਵਿਕ ਖਤਰਾ-ਸਿਰਜਣ ਦੇ ਜੋਖਮਾਂ ਵਿਰੁੱਧ ਲਚੀਲਤਾਪਣ ਮਜ਼ਬੂਤ ਕਰਨ ਵਿੱਚ AI ਨਾਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਸੰਬੰਧਤ ਹੱਲ ਵੀ ਸ਼ਾਮਲ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਵੇਂ nucleic acid synthesis screening mechanisms ਨੂੰ ਸੁਧਾਰਨਾ (ਜਿਵੇਂ Executive Order 14110 ਵਿੱਚ ਕਿਹਾ ਗਿਆ ਹੈ), ਜਾਂ ਨਵੀਆਂ ਰੋਗਕਾਰਕ ਫੈਲਾਵਾਂ ਦੀ ਜਾਂਚ ਅਤੇ ਪਛਾਣ ਕਰਨ ਲਈ ਜਨਤਕ ਸਿਹਤ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਯੋਗਤਾ ਸੁਧਾਰਨਾ। ਜੇ ਕਿਸੇ AI ਮਾਡਲ ਨੂੰ ਸਖ਼ਤੀ ਨਾਲ ਇਹ ਦਰਸਾਇਆ ਜਾਏ ਕਿ ਉਹ ਜਨਤਕ ਸੁਰੱਖਿਆ ਜਾਂ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਲਈ ਗੰਭੀਰ ਖਤਰੇ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਤਾਂ ਡਿਵੈਲਪਰ ਦੀ ਇਹ ਵੀ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਹੋ ਸਕਦੀ ਹੈ ਕਿ ਉਹ ਵਿਆਪਕ ਜਾਰੀਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ ਬਾਰੇ ਜਾਗਰੂਕਤਾ ਪੈਦਾ ਕਰੇ (ਜਿਵੇਂ infrastructure providers ਨੂੰ ਸੂਚਿਤ ਕਰਨਾ ਜਾਂ API deployment ਸੀਮਿਤ ਕਰਨਾ), ਤਾਂ ਜੋ ਤੁਰੰਤ ਲੋੜੀਂਦੇ ਲਚੀਲਤਾਪਣ ਯਤਨਾਂ ਲਈ ਸਮਾਂ ਅਤੇ ਪ੍ਰੇਰਣਾ ਦੋਵੇਂ ਬਣ ਸਕਣ। ਇਹ ਸਾਈਬਰ ਖੇਤਰ ਦੇ “ਜ਼ਿੰਮੇਵਾਰ ਖੁਲਾਸੇ” ਵਾਲੇ ਮਾਪਦੰਡ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿੱਥੇ ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾ ਆਪਣੇ ਲੱਭੇ vulnerabilities ਦੇ ਜਾਰੀਕਰਨ ਨੂੰ ਅਸਥਾਈ ਤੌਰ 'ਤੇ ਰੋਕਦੇ ਹਨ ਤਾਂ ਜੋ ਰੱਖਿਆਕਾਰਾਂ ਨੂੰ ਆਪਣੇ ਸਿਸਟਮ patch ਕਰਨ ਲਈ ਸਮਾਂ ਮਿਲੇ, ਜਦਕਿ ਹੋਰ ਸੁਰੱਖਿਆ ਖੋਜ ਨੂੰ ਧੀਮਾ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ.

ਸਾਨੂੰ AI ਖਤਰਿਆਂ ਬਾਰੇ ਹੋਰ ਵਧੀਆ ਵਿਗਿਆਨ ਦੀ ਲੋੜ ਹੈ

ਹਾਲਾਂਕਿ ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ ਸਭ ਤੋਂ ਸਮਰੱਥਾ ਵਾਲੇ ਮਾਡਲਾਂ ਦੇ ਖਤਰਿਆਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ, AI ਖਤਰਾ ਮੁਲਾਂਕਣ ਦਾ ਵਿਗਿਆਨ ਅਜੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਅ ਵਿੱਚ ਹੈ। OpenAI ਅਤੇ ਵਿਆਪਕ AI ਭਾਈਚਾਰਾ ਅਜੇ ਵੀ AI ਖਤਰਿਆਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਦੇ ਅਧਾਰ ਤਿਆਰ ਕਰ ਰਹੇ ਹਨ, ਅਤੇ ਅਸੀਂ ਪ੍ਰਿਪੇਅਰਡਨੈਸ ਫ੍ਰੇਮਵਰਕ ਵਿੱਚ ਕਾਰਜਾਨਵਿਨ ਦੇ ਕਈ ਵੇਰਵਿਆਂ 'ਤੇ ਲਗਾਤਾਰ ਦੁਹਰਾਈ ਕਰ ਰਹੇ ਹਾਂ। ਸਰਕਾਰਾਂ ਦੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਹੈ ਕਿ ਉਹ AI ecosystem ਨੂੰ ਉਸਦੇ ਖਤਰਾ ਅਤੇ ਸਮਰੱਥਾ ਮੁਲਾਂਕਣ ਅਭਿਆਸਾਂ ਵਿੱਚ ਪਕਵਾਈ ਲਿਆਉਣ ਵਿੱਚ ਮਦਦ ਕਰਨ, ਉਦਾਹਰਨ ਵਜੋਂ offensive cybersecurity, critical infrastructure, ਅਤੇ AI ਦੁਨਿਆ ਦੇ ਵਿਸ਼ੇਸ਼ਗਿਆਨ ਨੂੰ ਇਕੱਠਾ ਕਰਕੇ ਪ੍ਰਾਥਮਿਕ AI cyber threat models ਦੇ ਇੱਕ ਸੈੱਟ 'ਤੇ ਸਹਿਮਤੀ ਬਣਾਉਣ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਮੁਲਾਂਕਣ ਲਈ ਸਖ਼ਤ ਅਤੇ ਅਨੁਭਵਾਤਮਕ testbeds ਤਿਆਰ ਕਰਨ। ਅਸੀਂ USAISI ਵੱਲੋਂ ਅਪਣਾਈ ਜਾ ਰਹੀ ਸੁਇੱਛਿਕ, ਨਵੀਨਤਾ-ਅਨੁਕੂਲ ਅਤੇ science-first ਪਹੁੰਚ ਦਾ ਪੂਰਾ ਸਮਰਥਨ ਕਰਦੇ ਹਾਂ.

2019 ਵਿੱਚ ਜਦੋਂ OpenAI ਨੂੰ GPT‑2 ਨੂੰ ਕਿਵੇਂ ਜਾਰੀ ਕਰਨਾ ਹੈ ਇਹ ਚੋਣ ਕਰਨੀ ਪਈ ਸੀ — ਅਤੇ ਪਹਿਲਾਂ ਮਾਡਲ ਦਾ ਕੇਵਲ ਇੱਕ ਛੋਟਾ ਸੰਸਕਰਣ ਜਾਰੀ ਕਰਨ ਦਾ ਫੈਸਲਾ ਕੀਤਾ ਗਿਆ ਸੀ — ਉਸ ਤੋਂ ਲੈ ਕੇ foundation ਮਾਡਲ weights ਦੀ open release ਸੰਬੰਧੀ ਵਿਚਾਰਾਂ ਦਾ ਦ੍ਰਿਸ਼ ਨਵੇਂ ਨਤੀਜਿਆਂ ਅਤੇ ਘਟਨਾਵਾਂ ਨਾਲ ਲਗਾਤਾਰ ਬਦਲਦਾ ਰਿਹਾ ਹੈ, ਕਈ ਵਾਰ ਹਰ ਕੁਝ ਮਹੀਨਿਆਂ ਵਿੱਚ। ਅਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹਾਂ ਕਿ ਇਹ ਰੁਝਾਨ ਜਾਰੀ ਰਹੇਗਾ। ਕਿਸੇ ਵੀ ਸਰਕਾਰੀ ਨੀਤੀ ਪਹੁੰਚ ਨੂੰ ਭਵਿੱਖ ਦੇ ਬਦਲਾਵਾਂ ਲਈ ਲਚਕੀਲਾ ਅਤੇ ਅਨੁਕੂਲ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ.