7 ਨਵੰਬਰ 2025

ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਨੂੰ ਸਮਝਣਾ: ਇੱਕ ਅਤਿ-ਆਧੁਨਿਕ ਸੁਰੱਖਿਆ ਚੁਣੌਤੀ

AI ਟੂਲ ਹੁਣ ਸਿਰਫ਼ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਰਹੇ. ਉਹ ਹੁਣ ਵੈੱਬ ਬ੍ਰਾਊਜ਼ ਕਰ ਸਕਦੇ ਹਨ, ਖੋਜ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ, ਯਾਤਰਾਵਾਂ ਦੀ ਯੋਜਨਾ ਬਣਾ ਸਕਦੇ ਹਨ, ਅਤੇ ਉਤਪਾਦ ਖਰੀਦਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ. ਜਿਵੇਂ ਜਿਵੇਂ ਉਹ ਹੋਰ ਸਮਰੱਥ ਬਣਦੇ ਜਾ ਰਹੇ ਹਨ, ਹੋਰ ਐਪਾਂ ਵਿੱਚ ਤੁਹਾਡੇ ਡਾਟਾ ਤੱਕ ਪਹੁੰਚ ਕਰਨ ਅਤੇ ਤੁਹਾਡੇ behalf 'ਤੇ ਕਾਰਵਾਈ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਨਾਲ, ਨਵੀਆਂ ਸੁਰੱਖਿਆ ਚੁਣੌਤੀਆਂ ਸਾਹਮਣੇ ਆ ਰਹੀਆਂ ਹਨ. ਉਨ੍ਹਾਂ ਵਿੱਚੋਂ ਇੱਕ ਜਿਸ 'ਤੇ ਅਸੀਂ ਖਾਸ ਧਿਆਨ ਦੇ ਰਹੇ ਹਾਂ, ਉਹ ਹੈ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ.

ਇੱਕ ਡਾਇਗ੍ਰਾਮ ਜੋ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਹਮਲਾ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ. ਖੱਬੇ ਪਾਸੇ, ਮੁਸਕੁਰਾਉਂਦੇ ਵਰਤੋਂਕਾਰ ਦਾ ਇੱਕ ਆਇਕਨ ਹੈ ਜਿਸ 'ਤੇ “ਵਰਤੋਂਕਾਰ AI ਨੂੰ ਕਿਸੇ ਕੰਮ ਵਿੱਚ ਮਦਦ ਲਈ ਕਹਿੰਦਾ ਹੈ.” ਲਿਖਿਆ ਹੈ. ਇੱਕ ਤੀਰ ਵਿਚਕਾਰ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਕੰਪਿਊਟਰ ਸਕ੍ਰੀਨ ਦੇ ਆਇਕਨ 'ਤੇ “AI ਨੂੰ ਹਮਲੇ ਵਾਲੀ ਵੈੱਬਸਾਈਟ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ,” ਲਿਖਿਆ ਹੈ, ਅਤੇ ਇਸ ਦੇ ਉੱਪਰ ਟੋਪੀ ਪਹਿਨੇ ਅਤੇ ਤਿਰਛੀ ਮੁਸਕਾਨ ਵਾਲੀ ਇੱਕ ਛੋਟੀ ਆਕ੍ਰਿਤੀ ਹੈ ਜਿਸ 'ਤੇ “ਹਮਲਾਵਰ ਨੇ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਸ਼ਾਮਲ ਕੀਤਾ.” ਲਿਖਿਆ ਹੈ. ਇੱਕ ਹੋਰ ਤੀਰ ਸੱਜੇ ਪਾਸੇ ਵੱਲ ਜਾਂਦਾ ਹੈ ਜਿੱਥੇ ਚੇਤਾਵਨੀ ਤਿਕੋਣ ਵਾਲੇ ਦਸਤਾਵੇਜ਼ ਦੇ ਆਇਕਨ 'ਤੇ “AI ਨੂੰ ਅਣਚਾਹੀ ਕਾਰਵਾਈ ਲਈ ਠੱਗਿਆ ਗਿਆ.” ਲਿਖਿਆ ਹੈ. ਇਹ ਪ੍ਰਵਾਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਹਮਲਾਵਰ inject ਕੀਤੇ ਪ੍ਰੌੰਪਟਾਂ ਰਾਹੀਂ AI ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦਾ ਹੈ.

ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਕੀ ਹੈ?

ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਗੱਲਬਾਤੀ AI ਲਈ ਖਾਸ ਸਮਾਜਿਕ ਇੰਜੀਨੀਅਰਿੰਗ ਹਮਲੇ ਦੀ ਇੱਕ ਕਿਸਮ ਹੈ. ਸ਼ੁਰੂਆਤੀ AI ਪ੍ਰਣਾਲੀਆਂ ਇੱਕ ਇਕੱਲੇ ਵਰਤੋਂਕਾਰ ਅਤੇ ਇੱਕ ਇਕੱਲੇ AI ਏਜੰਟ ਵਿਚਕਾਰ ਗੱਲਬਾਤ ਹੁੰਦੀਆਂ ਸਨ. ਅੱਜ ਦੇ AI ਉਤਪਾਦਾਂ ਵਿੱਚ, ਤੁਹਾਡੀ ਗੱਲਬਾਤ ਵਿੱਚ ਇੰਟਰਨੈੱਟ ਸਮੇਤ ਕਈ ਸਰੋਤਾਂ ਦੀ ਸਮੱਗਰੀ ਸ਼ਾਮਲ ਹੋ ਸਕਦੀ ਹੈ. ਇਹ ਵਿਚਾਰ ਕਿ ਕੋਈ ਤੀਜਾ ਪੱਖ, ਜੋ ਨਾ ਵਰਤੋਂਕਾਰ ਹੈ ਅਤੇ ਨਾ ਹੀ AI, ਗੱਲਬਾਤ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਦੁਰਾਭਾਵਨਾ ਭਰੀਆਂ ਹਦਾਇਤਾਂ ਸ਼ਾਮਲ ਕਰਕੇ ਮਾਡਲ ਨੂੰ ਭੁਲਾ ਸਕਦਾ ਹੈ, ਨੇ “ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ” ਸ਼ਬਦ ਨੂੰ ਜਨਮ ਦਿੱਤਾ.

ਜਿਸ ਤਰ੍ਹਾਂ ਫਿਸ਼ਿੰਗ ਈਮੇਲਾਂ ਜਾਂ ਵੈੱਬ 'ਤੇ ਹੋਣ ਵਾਲੀਆਂ ਧੋਖਾਧੜੀਆਂ ਲੋਕਾਂ ਨੂੰ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਦੇਣ ਲਈ ਠੱਗਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੀਆਂ ਹਨ, ਉਸੇ ਤਰ੍ਹਾਂ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ AI ਨੂੰ ਉਹ ਕੁਝ ਕਰਨ ਲਈ ਠੱਗਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ ਜੋ ਤੁਸੀਂ ਨਹੀਂ ਕਿਹਾ ਹੁੰਦਾ.

ਕਲਪਨਾ ਕਰੋ ਕਿ ਤੁਸੀਂ ਕਿਸੇ AI ਨੂੰ ਆਨਲਾਈਨ ਛੁੱਟੀਆਂ ਬਾਰੇ ਕੁਝ ਖੋਜ ਕਰਨ ਵਿੱਚ ਮਦਦ ਲਈ ਕਿਹਾ ਹੈ, ਅਤੇ ਜਦੋਂ ਉਹ ਇਹ ਕਰ ਰਿਹਾ ਹੈ ਤਾਂ ਉਸਨੂੰ ਕਿਸੇ ਵੈੱਬਪੇਜ 'ਤੇ ਭਰਮਾਉਣ ਵਾਲੀ ਸਮੱਗਰੀ ਜਾਂ ਨੁਕਸਾਨਦਾਇਕ ਹਦਾਇਤਾਂ ਮਿਲਦੀਆਂ ਹਨ, ਜਿਵੇਂ ਕਿ ਕਿਸੇ ਲਿਸਟਿੰਗ ਦੀ ਟਿੱਪਣੀ ਵਿੱਚ ਜਾਂ ਕਿਸੇ ਸਮੀਖਿਆ ਵਿੱਚ ਲੁਕੀਆਂ ਹੋਈਆਂ. ਇਹ ਸਮੱਗਰੀ ਧਿਆਨ ਨਾਲ ਇਸ ਤਰ੍ਹਾਂ ਤਿਆਰ ਕੀਤੀ ਹੋ ਸਕਦੀ ਹੈ ਕਿ AI ਨੂੰ ਗਲਤ ਲਿਸਟਿੰਗ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਨ ਲਈ ਠੱਗਿਆ ਜਾਵੇ, ਜਾਂ ਇਸ ਤੋਂ ਵੀ ਬੁਰਾ, ਤੁਹਾਡੇ ਕਰੈਡਿਟ ਕਾਰਡ ਦੀ ਜਾਣਕਾਰੀ ਚੋਰੀ ਕਰ ਲਈ ਜਾਵੇ.

ਇਹ “ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ” ਹਮਲਿਆਂ ਦੇ ਕੇਵਲ ਕੁਝ ਉਦਾਹਰਨ ਹਨ—ਅਜਿਹੀਆਂ ਨੁਕਸਾਨਦਾਇਕ ਹਦਾਇਤਾਂ ਜੋ AI ਨੂੰ ਉਹ ਕੁਝ ਕਰਨ ਲਈ ਠੱਗਣ ਲਈ ਬਣਾਈਆਂ ਜਾਂਦੀਆਂ ਹਨ ਜੋ ਤੁਸੀਂ ਮਨ ਵਿੱਚ ਨਹੀਂ ਰੱਖਿਆ ਸੀ, ਅਤੇ ਜੋ ਅਕਸਰ ਕਿਸੇ ਵੈੱਬ ਪੇਜ, ਦਸਤਾਵੇਜ਼ ਜਾਂ ਈਮੇਲ ਵਰਗੀ ਆਮ ਸਮੱਗਰੀ ਦੇ ਅੰਦਰ ਲੁਕੀਆਂ ਹੁੰਦੀਆਂ ਹਨ.

ਇਹ ਜੋਖਮ ਵੱਧ ਜਾਂਦੇ ਹਨ ਜਿਵੇਂ AI ਹੋਰ ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟਾ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ ਅਤੇ ਹੋਰ ਪਹਲ ਅਤੇ ਲੰਬੇ ਕੰਮ ਸੰਭਾਲਦੇ ਹਨ.

ਸੰਖੇਪ

ਤੁਸੀਂ AI ਨੂੰ ਕੀ ਕਰਨ ਲਈ ਕਿਹਾ

ਹਮਲਾਵਰ ਕੀ ਕਰਦਾ ਹੈ

ਜੇ ਹਮਲਾ ਸਫਲ ਹੋਵੇ ਤਾਂ ਸੰਭਾਵਿਤ ਨਤੀਜਾ

ਤੁਸੀਂ ਕਿਸੇ AI ਨੂੰ ਅਪਾਰਟਮੈਂਟਾਂ ਬਾਰੇ ਖੋਜ ਕਰਨ ਲਈ ਕਹਿੰਦੇ ਹੋ, ਅਤੇ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਰਾਹੀਂ ਉਸਨੂੰ ਐਸੀ ਲਿਸਟਿੰਗ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਨ ਲਈ ਭੁਲਾਇਆ ਜਾਂਦਾ ਹੈ ਜੋ ਤੁਹਾਡੇ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਿਕਲਪ ਨਹੀਂ ਹੈ.

ਤੁਸੀਂ ਕਿਸੇ AI ਨੂੰ ਦਿੱਤੇ ਗਏ ਕੁਝ ਮਾਪਦੰਡਾਂ ਅਨੁਸਾਰ ਅਪਾਰਟਮੈਂਟਾਂ ਬਾਰੇ ਖੋਜ ਕਰਨ ਲਈ ਕਹਿੰਦੇ ਹੋ.

ਹਮਲਾਵਰ ਨੇ ਅਪਾਰਟਮੈਂਟ ਲਿਸਟਿੰਗ ਵਿੱਚ ਇੱਕ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਹਮਲਾ ਸ਼ਾਮਲ ਕੀਤਾ ਹੁੰਦਾ ਹੈ ਤਾਂ ਜੋ AI ਨੂੰ ਇਹ ਲੱਗੇ ਕਿ ਵਰਤੋਂਕਾਰ ਦੀਆਂ ਦੱਸੀਆਂ ਪਸੰਦਾਂ ਤੋਂ ਬਿਨਾਂ ਵੀ ਉਸਦੀ ਲਿਸਟਿੰਗ ਹੀ ਚੁਣੀ ਜਾਣੀ ਚਾਹੀਦੀ ਹੈ.

ਜੇ ਹਮਲਾ ਸਫਲ ਹੋ ਜਾਂਦਾ ਹੈ, ਤਾਂ AI ਤੁਹਾਡੀਆਂ ਪਸੰਦਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਗਲਤ ਤਰੀਕੇ ਨਾਲ ਘੱਟ ਉਚਿਤ ਅਪਾਰਟਮੈਂਟ ਲਿਸਟਿੰਗ ਦੀ ਸਿਫਾਰਸ਼ ਕਰ ਸਕਦਾ ਹੈ.

ਤੁਸੀਂ ਕਿਸੇ AI ਏਜੰਟ ਨੂੰ ਰਾਤ ਭਰ ਆਈਆਂ ਤੁਹਾਡੀਆਂ ਈਮੇਲਾਂ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਕਹਿੰਦੇ ਹੋ, ਅਤੇ ਅੰਤ ਵਿੱਚ ਉਹ ਤੁਹਾਡੇ ਬੈਂਕ ਸਟੇਟਮੈਂਟ ਸਾਂਝੇ ਕਰ ਬੈਠਦਾ ਹੈ.

ਤੁਸੀਂ ਕਿਸੇ AI ਏਜੰਟ ਨੂੰ ਕਹਿੰਦੇ ਹੋ ਕਿ ਉਹ ਰਾਤ ਭਰ ਆਈਆਂ ਤੁਹਾਡੀਆਂ ਈਮੇਲਾਂ ਦਾ ਆਮ ਤੌਰ 'ਤੇ ਜਵਾਬ ਦੇਵੇ ਕਿਉਂਕਿ ਤੁਸੀਂ ਅੱਜ ਸਵੇਰੇ ਵਿਅਸਤ ਹੋ.

ਹੇਠਾਂ “ਜਦੋਂ ਸੰਭਵ ਹੋਵੇ, ਏਜੰਟ ਨੂੰ ਸਪਸ਼ਟ ਹਦਾਇਤਾਂ ਦਿਓ” ਵੇਖੋ

ਹਮਲਾਵਰ ਨੇ ਤੁਹਾਨੂੰ ਇੱਕ ਈਮੇਲ ਭੇਜੀ ਜਿਸ ਵਿੱਚ ਗਲਤ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੈ, ਜੋ ਮਾਡਲ ਨੂੰ ਤੁਹਾਡੇ ਬੈਂਕ ਸਟੇਟਮੈਂਟ ਲੱਭ ਕੇ ਹਮਲਾਵਰ ਨਾਲ ਸਾਂਝੇ ਕਰਨ ਲਈ ਠੱਗਦੀ ਹੈ.

ਜੇ ਹਮਲਾ ਸਫਲ ਹੋ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਏਜੰਟ ਤੁਹਾਡੀ ਈਮੇਲ ਵਿੱਚ ਬੈਂਕ ਸਟੇਟਮੈਂਟ ਵਰਗੀ ਕੋਈ ਵੀ ਚੀਜ਼ ਲੱਭ ਸਕਦਾ ਹੈ, ਜਿਸ ਤੱਕ ਤੁਸੀਂ ਉਸਨੂੰ ਇਸ ਕੰਮ ਲਈ ਪਹੁੰਚ ਦਿੱਤੀ ਸੀ, ਅਤੇ ਉਹ ਉਹਨਾਂ ਨੂੰ ਹਮਲਾਵਰ ਨਾਲ ਸਾਂਝਾ ਕਰ ਦੇਵੇਗਾ.

ਵਰਤੋਂਕਾਰਾਂ ਦੀ ਸੁਰੱਖਿਆ ਲਈ ਸਾਡਾ ਦ੍ਰਿਸ਼ਟਿਕੋਣ

ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਤੋਂ ਬਚਾਵ ਸਾਰੇ AI ਉਦਯੋਗ ਵਿੱਚ ਇੱਕ ਚੁਣੌਤੀ ਹੈ ਅਤੇ OpenAI ਵਿੱਚ ਇੱਕ ਮੁੱਖ ਕੇਂਦਰਬਿੰਦੂ ਹੈ. ਭਾਵੇਂ ਅਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹਾਂ ਕਿ ਵਿਰੋਧੀ ਅਜੇਹੇ ਹਮਲੇ ਵਿਕਸਿਤ ਕਰਦੇ ਰਹਿਣਗੇ, ਅਸੀਂ ਅਜਿਹੇ ਬਚਾਵ ਤਿਆਰ ਕਰ ਰਹੇ ਹਾਂ ਜੋ ਉਸ ਵੇਲੇ ਵੀ ਵਰਤੋਂਕਾਰ ਦੇ ਮਨਚਾਹੇ ਕੰਮ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਬਣੇ ਹਨ ਜਦੋਂ ਕੋਈ ਉਨ੍ਹਾਂ ਨੂੰ ਸਰਗਰਮੀ ਨਾਲ ਭੁਲਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਹੋਵੇ. ਇਹ ਸਮਰੱਥਾ AGI ਦੇ ਲਾਭਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਹਕੀਕਤ ਬਣਾਉਣ ਲਈ ਅਤਿ ਜ਼ਰੂਰੀ ਹੈ.

ਆਪਣੇ ਵਰਤੋਂਕਾਰਾਂ ਦੀ ਰੱਖਿਆ ਕਰਨ ਅਤੇ ਇਨ੍ਹਾਂ ਹਮਲਿਆਂ ਦੇ ਖ਼ਿਲਾਫ਼ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਸੁਧਾਰਨ ਵਿੱਚ ਮਦਦ ਲਈ, ਅਸੀਂ ਬਹੁ-ਪੱਧਰੀ ਦ੍ਰਿਸ਼ਟਿਕੋਣ ਅਪਣਾਉਂਦੇ ਹਾਂ, ਜਿਸ ਵਿੱਚ ਹੇਠ ਲਿਖੇ ਸ਼ਾਮਲ ਹਨ:

ਸੁਰੱਖਿਆ ਪ੍ਰਸ਼ਿਕਸ਼ਣ

ਅਸੀਂ ਅਜਿਹਾ AI ਚਾਹੁੰਦੇ ਹਾਂ ਜੋ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਨੂੰ ਪਛਾਣੇ ਅਤੇ ਉਨ੍ਹਾਂ ਦਾ ਸ਼ਿਕਾਰ ਨਾ ਬਣੇ. ਹਾਲਾਂਕਿ, ਵਿਰੋਧੀ ਹਮਲਿਆਂ ਦੇ ਪ੍ਰਤੀ ਮਜ਼ਬੂਤੀ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ AI ਲਈ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਚੱਲਦੀ ਆ ਰਹੀ ਚੁਣੌਤੀ ਹੈ, ਇਸ ਕਾਰਨ ਇਹ ਇੱਕ ਮੁਸ਼ਕਲ ਅਤੇ ਖੁੱਲ੍ਹੀ ਸਮੱਸਿਆ ਹੈ. ਅਸੀਂ Instruction Hierarchy⁠ ਨਾਮਕ ਖੋਜ ਵਿਕਸਿਤ ਕੀਤੀ ਹੈ ਤਾਂ ਜੋ ਮਾਡਲ ਭਰੋਸੇਯੋਗ ਅਤੇ ਅਭਰੋਸੇਯੋਗ ਹਦਾਇਤਾਂ ਵਿੱਚ ਫ਼ਰਕ ਕਰ ਸਕਣ. ਅਸੀਂ ਮਾਡਲਾਂ ਨੂੰ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਦੇ ਪੈਟਰਨਾਂ ਨੂੰ ਹੋਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਛਾਣਨ ਲਈ ਪ੍ਰਸ਼ਿਕਸ਼ਿਤ ਕਰਨ ਦੇ ਨਵੇਂ ਤਰੀਕੇ ਵਿਕਸਿਤ ਕਰਦੇ ਰਹਿੰਦੇ ਹਾਂ ਤਾਂ ਜੋ ਉਹ ਉਨ੍ਹਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰ ਸਕਣ ਜਾਂ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਚੇਤਾਵਨੀ ਦੇ ਸਕਣ. ਅਸੀਂ ਜੋ ਤਕਨੀਕਾਂ ਵਰਤਦੇ ਹਾਂ, ਉਨ੍ਹਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ ਆਟੋਮੈਟਿਕ ਰੈਡ-ਟੀਮਿੰਗ, ਇੱਕ ਖੇਤਰ ਜਿਸਦਾ ਅਸੀਂ ਸਾਲਾਂ ਤੋਂ ਅਧਿਐਨ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਕਰ ਰਹੇ ਹਾਂ, ਤਾਂ ਜੋ ਨਵੇਲੇ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਹਮਲੇ ਵਿਕਸਿਤ ਕੀਤੇ ਜਾ ਸਕਣ.

ਨਿਗਰਾਨੀ

ਅਸੀਂ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਹਮਲਿਆਂ ਦੀ ਪਹਿਚਾਣ ਕਰਨ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਰੋਕਣ ਲਈ AI-ਸੰਚਾਲਿਤ ਕਈ ਆਟੋਮੈਟਿਕ ਮਾਨੀਟਰ⁠ ਵਿਕਸਿਤ ਕੀਤੇ ਹਨ. ਇਹ ਸੁਰੱਖਿਆ ਪ੍ਰਸ਼ਿਕਸ਼ਣ ਵਾਲੇ ਤਰੀਕਿਆਂ ਦਾ ਪੂਰਕ ਹਨ ਕਿਉਂਕਿ ਇਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਅਪਡੇਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਤਾਂ ਜੋ ਸਾਡੇ ਦੁਆਰਾ ਲੱਭੇ ਗਏ ਕਿਸੇ ਵੀ ਨਵੇਂ ਹਮਲੇ ਨੂੰ ਜਲਦੀ ਰੋਕਿਆ ਜਾ ਸਕੇ. ਇਹ ਮਾਨੀਟਰ ਨਾ ਕੇਵਲ ਸਾਡੇ ਵਰਤੋਂਕਾਰਾਂ ਖ਼ਿਲਾਫ਼ ਸੰਭਾਵਿਤ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਹਮਲਿਆਂ ਦੀ ਪਹਿਚਾਣ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ, ਬਲਕਿ ਸਾਡੇ ਪਲੇਟਫਾਰਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਤੀ ਜਾ ਰਹੀ ਵਿਰੋਧੀ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਖੋਜ ਅਤੇ ਟੈਸਟਿੰਗ ਨੂੰ ਵੀ, ਉਹ ਹਮਲੇ ਹਕੀਕਤੀ ਵਰਤੋਂ ਵਿੱਚ ਲਾਗੂ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ, ਪਕੜਨ ਵਿੱਚ ਸਾਡੀ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ.

ਸੁਰੱਖਿਆ ਸੁਰੱਖਣ

ਅਸੀਂ ਵਰਤੋਂਕਾਰ ਡਾਟਾ ਦੀ ਰੱਖਿਆ ਵਿੱਚ ਮਦਦ ਲਈ ਆਪਣੇ ਉਤਪਾਦਾਂ ਅਤੇ ਢਾਂਚੇ ਨੂੰ ਵੱਖ ਵੱਖ ਇਕ ਦੂਜੇ ਨੂੰ ਸਹਾਰਾ ਦੇਣ ਵਾਲੇ ਸੁਰੱਖਿਆ ਉਪਾਅ ਨਾਲ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਹੈ. ਇਹ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਜਿਨ੍ਹਾਂ ਬਾਰੇ ਅਸੀਂ ਭਵਿੱਖ ਦੀਆਂ ਪੋਸਟਾਂ ਵਿੱਚ ਹੋਰ ਤਕਨੀਕੀ ਵੇਰਵੇ ਨਾਲ ਗੱਲ ਕਰਾਂਗੇ, ਹਰ ਉਤਪਾਦ ਲਈ ਵੱਖਰੇ ਢੰਗ ਨਾਲ ਤਿਆਰ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ. ਉਦਾਹਰਨ ਲਈ, ਤੁਹਾਨੂੰ ਅਭਰੋਸੇਯੋਗ ਸਾਈਟਾਂ ਤੋਂ ਬਚਾਉਣ ਲਈ, ਅਸੀਂ ਤੁਹਾਨੂੰ ChatGPT ਵਿੱਚ ਕੁਝ ਲਿੰਕਾਂ ਲਈ ਮਨਜ਼ੂਰੀ ਦੇਣ ਲਈ ਕਹਾਂਗੇ, ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਉਹਨਾਂ ਵੈੱਬਸਾਈਟਾਂ 'ਤੇ ਜੋ ਸਾਨੂੰ ਉਨ੍ਹਾਂ ਨੂੰ ਸੂਚੀਬੱਧ ਨਾ ਕਰਨ ਲਈ ਕਹਿੰਦੀਆਂ ਹਨ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ), ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਉਨ੍ਹਾਂ 'ਤੇ ਜਾਇਆ ਜਾ ਸਕੇ. ਜਦੋਂ ਸਾਡਾ AI ਹੋਰ ਪ੍ਰੋਗਰਾਮ ਜਾਂ ਕੋਡ ਚਲਾਉਣ ਲਈ ਟੂਲ ਵਰਤਦਾ ਹੈ (ਜਿਵੇਂ canvas ਵਿੱਚ, ਜਾਂ ਸਾਡੇ ਡਿਵੈਲਪਮੈਂਟ ਟੂਲ Codex ਵਿੱਚ), ਅਸੀਂ ਸੈਂਡਬਾਕਸਿੰਗ ਨਾਮਕ ਤਕਨੀਕ ਵਰਤਦੇ ਹਾਂ ਤਾਂ ਜੋ ਮਾਡਲ ਨੂੰ ਅਜਿਹੀਆਂ ਨੁਕਸਾਨਦਾਇਕ ਤਬਦੀਲੀਆਂ ਕਰਨ ਤੋਂ ਰੋਕਿਆ ਜਾ ਸਕੇ ਜੋ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਦਾ ਨਤੀਜਾ ਹੋ ਸਕਦੀਆਂ ਹਨ.

ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਕੰਟਰੋਲ ਦਿਓ

ਅਸੀਂ ਆਪਣੇ ਉਤਪਾਦਾਂ ਵਿੱਚ ਅੰਦਰੂਨੀ ਕੰਟਰੋਲ ਸ਼ਾਮਲ ਕਰਦੇ ਹਾਂ ਤਾਂ ਜੋ ਵਰਤੋਂਕਾਰ ਆਪਣੀ ਰੱਖਿਆ ਕਰ ਸਕਣ. ਉਦਾਹਰਨ ਲਈ, ChatGPT Atlas ਵਿੱਚ, ਤੁਸੀਂ logged-out mode ਚੁਣ ਸਕਦੇ ਹੋ, ਜੋ ChatGPT ਏਜੰਟ ਨੂੰ ਸਾਈਟਾਂ ਵਿੱਚ ਲੌਗਇਨ ਹੋਏ ਬਿਨਾਂ ਕੰਮ ਸ਼ੁਰੂ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ. ChatGPT ਏਜੰਟ ਖਰੀਦ ਪੂਰੀ ਕਰਨ ਵਰਗੇ ਸੰਵੇਦਨਸ਼ੀਲ ਕਦਮ ਚੁੱਕਣ ਤੋਂ ਪਹਿਲਾਂ ਰੁਕਦਾ ਹੈ ਅਤੇ ਪੁਸ਼ਟੀ ਮੰਗਦਾ ਹੈ. ਜਦੋਂ ਏਜੰਟ ਸੰਵੇਦਨਸ਼ੀਲ ਸਾਈਟਾਂ 'ਤੇ ਕੰਮ ਕਰ ਰਿਹਾ ਹੁੰਦਾ ਹੈ, ਅਸੀਂ “Watch Mode” ਵੀ ਲਾਗੂ ਕੀਤਾ ਹੈ, ਜੋ ਤੁਹਾਨੂੰ ਸਾਈਟ ਦੀ ਸੰਵੇਦਨਸ਼ੀਲ ਪ੍ਰਕਿਰਤੀ ਬਾਰੇ ਸਚੇਤ ਕਰਦਾ ਹੈ ਅਤੇ ਏਜੰਟ ਨੂੰ ਕੰਮ ਕਰਦਾ ਦੇਖਣ ਲਈ ਟੈਬ ਸਰਗਰਮ ਰੱਖਣ ਦੀ ਲੋੜ ਪਾਂਦਾ ਹੈ. ਜੇ ਤੁਸੀਂ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਵਾਲੀ ਟੈਬ ਤੋਂ ਦੂਰ ਹੋ ਜਾਂਦੇ ਹੋ ਤਾਂ ਏਜੰਟ ਰੁਕ ਜਾਵੇਗਾ. ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਏਜੰਟ ਦੁਆਰਾ ਕੀਤੀਆਂ ਜਾ ਰਹੀਆਂ ਕਾਰਵਾਈਆਂ ਤੋਂ ਸਚੇਤ ਰਹੋ—ਅਤੇ ਕੰਟਰੋਲ ਵਿੱਚ ਰਹੋ.

ਰੈਡ-ਟੀਮਿੰਗ

ਅਸੀਂ ਆਪਣੇ ਬਚਾਵਾਂ ਦੀ ਜਾਂਚ ਅਤੇ ਸੁਧਾਰ ਕਰਨ, ਹਮਲਾਵਰ ਦੇ ਵਿਵਹਾਰ ਦਾ ਅਨੁਕਰਣ ਕਰਨ, ਅਤੇ ਆਪਣੀ ਸੁਰੱਖਿਆ ਸੁਧਾਰਨ ਦੇ ਨਵੇਂ ਤਰੀਕੇ ਲੱਭਣ ਲਈ ਅੰਦਰੂਨੀ ਅਤੇ ਬਾਹਰੀ ਟੀਮਾਂ ਨਾਲ ਵਿਸਤ੍ਰਿਤ ਰੈਡ-ਟੀਮਿੰਗ ਕਰਦੇ ਹਾਂ. ਇਸ ਵਿੱਚ ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ 'ਤੇ ਕੇਂਦਰਿਤ ਹਜ਼ਾਰਾਂ ਘੰਟਿਆਂ ਦਾ ਕੰਮ ਸ਼ਾਮਲ ਹੈ. ਜਿਵੇਂ ਜਿਵੇਂ ਅਸੀਂ ਨਵੀਆਂ ਤਕਨੀਕਾਂ ਅਤੇ ਹਮਲੇ ਲੱਭੇ ਹਨ, ਸਾਡੀਆਂ ਟੀਮਾਂ ਨੇ ਸੁਰੱਖਿਆ ਕਮਜ਼ੋਰੀਆਂ ਦਾ ਪਹਿਲਾਂ ਹੀ ਹੱਲ ਕੀਤਾ ਹੈ ਅਤੇ ਸਾਡੇ ਮਾਡਲ ਦੇ ਉਪਸ਼ਮਣਾਂ ਨੂੰ ਸੁਧਾਰਿਆ ਹੈ.

ਬੱਗ ਬਾਊਂਟੀ

ਸੱਚੀ ਨੀਅਤ ਵਾਲੇ ਸੁਤੰਤਰ ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਨਵੀਆਂ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਤਕਨੀਕਾਂ ਅਤੇ ਹਮਲੇ ਲੱਭਣ ਵਿੱਚ ਸਾਡੀ ਮਦਦ ਕਰਨ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ, ਅਸੀਂ ਆਪਣੇ ਬੱਗ ਬਾਊਂਟੀ ਪ੍ਰੋਗਰਾਮ⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਤਹਿਤ ਵਿੱਤੀ ਇਨਾਮ ਦਿੰਦੇ ਹਾਂ ਜਦੋਂ ਉਹ ਹਕੀਕਤੀ ਹਮਲਾ ਮਾਰਗ ਦਿਖਾਉਂਦੇ ਹਨ ਜਿਸ ਨਾਲ ਅਣਚਾਹੀ ਵਰਤੋਂਕਾਰ ਡਾਟਾ ਉਘਾੜ ਹੋ ਸਕਦਾ ਹੈ. ਅਸੀਂ ਬਾਹਰੀ ਯੋਗਦਾਨਕਰਤਾਵਾਂ ਨੂੰ ਇਹ ਮਸਲੇ ਜਲਦੀ ਸਾਹਮਣੇ ਲਿਆਉਣ ਲਈ ਪ੍ਰੋਤਸਾਹਿਤ ਕਰਦੇ ਹਾਂ ਤਾਂ ਜੋ ਅਸੀਂ ਉਨ੍ਹਾਂ ਦਾ ਹੱਲ ਕਰ ਸਕੀਏ ਅਤੇ ਆਪਣੇ ਬਚਾਵ ਹੋਰ ਮਜ਼ਬੂਤ ਕਰ ਸਕੀਏ.

ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਫੈਸਲਾ ਕਰਨ ਦਿਓ

ਅਸੀਂ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਉਤਪਾਦ ਵਿੱਚ ਕੁਝ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਰਤਣ ਦੇ ਜੋਖਮਾਂ ਬਾਰੇ ਸਿੱਖਿਆ ਦਿੰਦੇ ਹਾਂ ਤਾਂ ਜੋ ਉਹ ਜਾਣਕਾਰੀ ਦੇ ਆਧਾਰ 'ਤੇ ਫੈਸਲੇ ਕਰ ਸਕਣ. ਉਦਾਹਰਨ ਲਈ, ਜਦੋਂ ChatGPT ਨੂੰ ਹੋਰ ਐਪਾਂ ਨਾਲ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ, ਅਸੀਂ ਸਮਝਾਉਂਦੇ ਹਾਂ ਕਿ ਕਿਹੜਾ ਡਾਟਾ ਐਕਸੈਸ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਉਹ ਕਿਵੇਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਅਤੇ ਕਿਹੜੇ ਜੋਖਮ ਪੈਦਾ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਵੇਂ ਕੋਈ ਸਾਈਟ ਤੁਹਾਡਾ ਡਾਟਾ ਚੋਰੀ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੇ, ਨਾਲ ਹੀ ਇਹ ਵੀ ਸਿੱਖਣ ਲਈ ਇੱਕ ਲਿੰਕ ਦਿੰਦੇ ਹਾਂ ਕਿ ਹੋਰ ਸੁਰੱਖਿਅਤ ਕਿਵੇਂ ਰਹਿਣਾ ਹੈ. ਅਸੀਂ ਸੰਸਥਾਵਾਂ ਨੂੰ ਇਹ ਵੀ ਕੰਟਰੋਲ ਦਿੰਦੇ ਹਾਂ ਕਿ ਉਨ੍ਹਾਂ ਦੇ ਵਰਕਸਪੇਸ ਵਿੱਚ ਵਰਤੋਂਕਾਰਾਂ ਦੁਆਰਾ ਕਿਹੜੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸਮਰੱਥ ਜਾਂ ਵਰਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ.

ਹੋਰ ਸੁਰੱਖਿਅਤ ਰਹਿਣ ਲਈ ਤੁਸੀਂ ਕੀ ਕਰ ਸਕਦੇ ਹੋ

ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਇੱਕ ਅਤਿ-ਆਧੁਨਿਕ ਸੁਰੱਖਿਆ ਚੁਣੌਤੀ ਹੈ ਜਿਸਦੇ ਸਮੇਂ ਦੇ ਨਾਲ ਵਿਕਸਿਤ ਹੋਣ ਦੀ ਅਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹਾਂ. ਬੁੱਧੀਮੱਤਾ ਅਤੇ ਸਮਰੱਥਾ ਦੇ ਨਵੇਂ ਪੱਧਰ ਇਹ ਮੰਗ ਕਰਦੇ ਹਨ ਕਿ ਤਕਨਾਲੋਜੀ, ਸਮਾਜ ਅਤੇ ਜੋਖਮ ਘਟਾਉਣ ਦੀ ਰਣਨੀਤੀ ਇਕੱਠੇ ਵਿਕਸਿਤ ਹੋਣ. ਅਤੇ ਜਿਵੇਂ 2000 ਦੇ ਸ਼ੁਰੂਆਤੀ ਦਹਾਕੇ ਵਿੱਚ ਕੰਪਿਊਟਰ ਵਾਇਰਸਾਂ ਨਾਲ ਸੀ, ਅਸੀਂ ਸੋਚਦੇ ਹਾਂ ਕਿ ਹਰ ਕਿਸੇ ਲਈ ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਦੇ ਖ਼ਤਰੇ ਅਤੇ ਇਸ ਜੋਖਮ ਨਾਲ ਕਿਵੇਂ ਨਿਪਟਣਾ ਹੈ, ਇਹ ਸਮਝਣਾ ਮਹੱਤਵਪੂਰਣ ਹੈ, ਤਾਂ ਜੋ ਅਸੀਂ ਸਭ ਇਸ ਤਕਨਾਲੋਜੀ ਤੋਂ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਲਾਭ ਲੈਣਾ ਸਿੱਖ ਸਕੀਏ. ਸਚੇਤ ਰਹਿਣਾ ਅਤੇ ਸਾਵਧਾਨੀ ਵਰਤਣਾ ਤੁਹਾਡੇ ਡਾਟਾ ਨੂੰ ਹੋਰ ਸੁਰੱਖਿਅਤ ਰੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਜਦੋਂ ਤੁਸੀਂ AI ਅਤੇ ਏਜੰਟਿਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਰਤਦੇ ਹੋ ਜੋ ਤੁਹਾਡੇ behalf 'ਤੇ ਕੰਮ ਕਰ ਸਕਦੀਆਂ ਹਨ.

ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟਾ ਤੱਕ ਪਹੁੰਚ ਸੀਮਿਤ ਕਰਨ ਲਈ ਅੰਦਰੂਨੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਰਤੋ

ਜਿੱਥੇ ਸੰਭਵ ਹੋਵੇ, ਏਜੰਟ ਦੀ ਪਹੁੰਚ ਨੂੰ ਕੇਵਲ ਉਸੇ ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟਾ ਜਾਂ ਪ੍ਰਮਾਣਿਕ ਜਾਣਕਾਰੀ ਤੱਕ ਸੀਮਿਤ ਰੱਖੋ ਜੋ ਉਸਨੂੰ ਕੰਮ ਪੂਰਾ ਕਰਨ ਲਈ ਲੋੜੀਂਦੀ ਹੈ. ਉਦਾਹਰਨ ਲਈ, ਜਦੋਂ ChatGPT Atlas ਵਿੱਚ ਛੁੱਟੀਆਂ ਬਾਰੇ ਖੋਜ ਲਈ agent mode ਵਰਤਿਆ ਜਾ ਰਿਹਾ ਹੋਵੇ, ਜੇ ਏਜੰਟ ਸਿਰਫ਼ ਖੋਜ ਕਰ ਰਿਹਾ ਹੈ ਅਤੇ ਉਸਨੂੰ ਲੌਗਇਨ ਪਹੁੰਚ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਤਾਂ “logged out” mode ਵਰਤੋ.

ਜਦੋਂ ਕੋਈ ਏਜੰਟ ਪੁਸ਼ਟੀ ਮੰਗੇ, ਧਿਆਨ ਨਾਲ ਵੇਖੋ ਕਿ ਉਹ ਸਹੀ ਕੰਮ ਹੀ ਕਰਨ ਵਾਲਾ ਹੈ

ਅਸੀਂ ਅਕਸਰ ਏਜੰਟਾਂ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਡਿਜ਼ਾਇਨ ਕਰਦੇ ਹਾਂ ਕਿ ਉਹ ਖਰੀਦ ਪੂਰੀ ਕਰਨ ਜਾਂ ਈਮੇਲ ਭੇਜਣ ਵਰਗੀਆਂ ਕੁਝ ਮਹੱਤਵਪੂਰਣ ਕਾਰਵਾਈਆਂ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਤੋਂ ਆਖ਼ਰੀ ਪੁਸ਼ਟੀ ਲੈਣ. ਜਦੋਂ ਕੋਈ ਏਜੰਟ ਤੁਹਾਨੂੰ ਕਿਸੇ ਕਾਰਵਾਈ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕਹੇ, ਧਿਆਨ ਨਾਲ ਜਾਂਚੋ ਕਿ ਕਾਰਵਾਈ ਸਹੀ ਲੱਗਦੀ ਹੈ ਅਤੇ ਜੋ ਵੀ ਜਾਣਕਾਰੀ ਸਾਂਝੀ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ, ਉਹ ਉਸ ਸੰਦਰਭ ਵਿੱਚ ਸਾਂਝੀ ਕਰਨ ਯੋਗ ਹੈ.

ਜਦੋਂ ਕੋਈ ਏਜੰਟ ਕਿਸੇ ਸੰਵੇਦਨਸ਼ੀਲ ਸਾਈਟ, ਜਿਵੇਂ ਤੁਹਾਡਾ ਬੈਂਕ, 'ਤੇ ਕੰਮ ਕਰ ਰਿਹਾ ਹੋਵੇ, ਤਾਂ ਏਜੰਟ ਨੂੰ ਕੰਮ ਕਰਦਾ ਦੇਖੋ. ਇਹ ਕੁਝ ਹੱਦ ਤੱਕ ਸਵੈ-ਚਾਲਿਤ ਕਾਰ ਨੂੰ ਚਲਦੇ ਵੇਲੇ ਸਟੀਅਰਿੰਗ 'ਤੇ ਹੱਥ ਰੱਖ ਕੇ ਨਿਗਰਾਨੀ ਕਰਨ ਵਰਗਾ ਹੈ.

ਜਦੋਂ ਸੰਭਵ ਹੋਵੇ, ਏਜੰਟ ਨੂੰ ਸਪਸ਼ਟ ਹਦਾਇਤਾਂ ਦਿਓ

ਏਜੰਟ ਨੂੰ ਬਹੁਤ ਵਿਆਪਕ ਹਦਾਇਤ ਦੇਣਾ, ਜਿਵੇਂ "ਮੇਰੀਆਂ ਈਮੇਲਾਂ ਦੀ ਸਮੀਖਿਆ ਕਰੋ ਅਤੇ ਜੋ ਵੀ ਕਾਰਵਾਈ ਲੋੜੀਂਦੀ ਹੋਵੇ ਉਹ ਕਰੋ", ਮਾਡਲ ਨੂੰ ਲੁਕੀਆਂ ਹੋਈਆਂ ਦੁਰਾਭਾਵਨਾਪੂਰਣ ਸਮੱਗਰੀ ਦੁਆਰਾ ਭੁਲਾਉਣਾ ਆਸਾਨ ਬਣਾ ਸਕਦਾ ਹੈ, ਭਾਵੇਂ ਉਹ ਸੰਵੇਦਨਸ਼ੀਲ ਕਾਰਵਾਈ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਨਾਲ ਜਾਂਚ ਕਰਨ ਲਈ ਹੀ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਗਿਆ ਹੋਵੇ.

ਆਪਣੇ ਏਜੰਟ ਨੂੰ ਖ਼ਾਸ ਕੰਮ ਕਰਨ ਲਈ ਕਹਿਣਾ ਜ਼ਿਆਦਾ ਸੁਰੱਖਿਅਤ ਹੈ, ਅਤੇ ਉਸਨੂੰ ਇਹਨੀ ਵੱਡੀ ਛੂਟ ਨਾ ਦੇਣਾ ਚੰਗਾ ਹੈ ਕਿ ਉਹ ਈਮੇਲਾਂ ਵਰਗੇ ਹੋਰ ਸਰੋਤਾਂ ਤੋਂ ਆਉਣ ਵਾਲੀਆਂ ਨੁਕਸਾਨਦਾਇਕ ਹਦਾਇਤਾਂ ਦਾ ਪਾਲਣ ਕਰ ਸਕੇ. ਹਾਲਾਂਕਿ ਇਸ ਨਾਲ ਇਹ ਗਾਰੰਟੀ ਨਹੀਂ ਮਿਲਦੀ ਕਿ ਹਮਲੇ ਨਹੀਂ ਹੋਣਗੇ, ਪਰ ਇਸ ਨਾਲ ਹਮਲਾਵਰਾਂ ਲਈ ਸਫਲ ਹੋਣਾ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ.

ਜਾਣਕਾਰੀਵਾਨ ਰਹੋ ਅਤੇ ਸੁਰੱਖਿਆ ਦੀਆਂ ਵਧੀਆ ਪ੍ਰਥਾਵਾਂ ਦੀ ਪਾਲਣਾ ਕਰੋ

ਜਿਵੇਂ AI ਤਕਨਾਲੋਜੀ ਵਿਕਸਿਤ ਹੁੰਦੀ ਹੈ, ਨਵੇਂ ਜੋਖਮ ਅਤੇ ਸੁਰੱਖਿਆ ਉਪਾਅ ਸਾਹਮਣੇ ਆਉਣਗੇ. ਵਧੀਆ ਪ੍ਰਥਾਵਾਂ ਬਾਰੇ ਸਿੱਖਣ ਲਈ OpenAI ਅਤੇ ਹੋਰ ਭਰੋਸੇਯੋਗ ਸਰੋਤਾਂ ਤੋਂ ਅਪਡੇਟਾਂ ਦਾ ਪਾਲਣ ਕਰੋ.

ਅੱਗੇ ਦੀ ਦਿਸ਼ਾ

ਪ੍ਰੌੰਪਟ ਇੰਜੈਕਸ਼ਨ ਅਜੇ ਵੀ ਇੱਕ ਅਤਿ-ਆਧੁਨਿਕ, ਚੁਣੌਤੀਪੂਰਨ ਖੋਜ ਸਮੱਸਿਆ ਹੈ, ਅਤੇ ਵੈੱਬ 'ਤੇ ਰਵਾਇਤੀ ਧੋਖਾਧੜੀਆਂ ਦੀ ਤਰ੍ਹਾਂ, ਅਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹਾਂ ਕਿ ਇਸ 'ਤੇ ਸਾਡਾ ਕੰਮ ਲਗਾਤਾਰ ਜਾਰੀ ਰਹੇਗਾ. ਭਾਵੇਂ ਅਸੀਂ ਹਾਲੇ ਤੱਕ ਹਮਲਾਵਰਾਂ ਦੁਆਰਾ ਇਸ ਤਕਨੀਕ ਦੀ ਵਿਆਪਕ ਅਪਣਾਉਣ ਨਹੀਂ ਵੇਖੀ, ਅਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹਾਂ ਕਿ ਵਿਰੋਧੀ AI ਨੂੰ ਇਨ੍ਹਾਂ ਹਮਲਿਆਂ ਦਾ ਸ਼ਿਕਾਰ ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ ਲੱਭਣ ਲਈ ਕਾਫ਼ੀ ਸਮਾਂ ਅਤੇ ਸਰੋਤ ਖਰਚਣਗੇ. ਅਸੀਂ ਆਪਣੇ ਉਤਪਾਦਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਬਣਾਉਣ ਅਤੇ ਇਸ ਜੋਖਮ ਦੇ ਖ਼ਿਲਾਫ਼ AI ਦੀ ਮਜ਼ਬੂਤੀ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਲਈ ਖੋਜ ਵਿੱਚ ਲਗਾਤਾਰ ਭਾਰੀ ਨਿਵੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ. ਜਿਵੇਂ ਜਿਵੇਂ ਅਸੀਂ ਹੋਰ ਸਿੱਖਦੇ ਹਾਂ, ਅਸੀਂ ਅਪਡੇਟਾਂ ਸਾਂਝੀਆਂ ਕਰਾਂਗੇ, ਜਿਸ ਵਿੱਚ ਇਸ ਖੇਤਰ ਵਿੱਚ ਸਾਡੇ ਸੁਰੱਖਿਆ ਕੰਮ ਦੀ ਜਾਰੀ ਪ੍ਰਗਤੀ ਵੀ ਸ਼ਾਮਲ ਹੋਵੇਗੀ. ਉਦਾਹਰਨ ਲਈ, ਅਸੀਂ ਇੱਕ ਰਿਪੋਰਟ ਤਿਆਰ ਕਰ ਰਹੇ ਹਾਂ ਜਿਸਨੂੰ ਅਸੀਂ ਜਲਦੀ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਾਂਗੇ ਅਤੇ ਜਿਸ ਵਿੱਚ ਹੋਰ ਵੇਰਵਾ ਹੋਵੇਗਾ ਕਿ ਅਸੀਂ ਕਿਵੇਂ ਪਤਾ ਲਗਾਉਂਦੇ ਹਾਂ ਕਿ ਤੁਹਾਡੇ AI ਦਾ ਇੰਟਰਨੈੱਟ ਨਾਲ ਸੰਚਾਰ ਤੁਹਾਡੀ ਗੱਲਬਾਤ ਵਿੱਚੋਂ ਜਾਣਕਾਰੀ ਭੇਜੇਗਾ ਜਾਂ ਨਹੀਂ.

ਸਾਡਾ ਲਕਸ਼ ਇਹ ਹੈ ਕਿ ਇਨ੍ਹਾਂ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਤੁਹਾਡੇ ਸਭ ਤੋਂ ਭਰੋਸੇਯੋਗ ਅਤੇ ਸੁਰੱਖਿਆ-ਸਚੇਤ ਸਹਿਕਰਮੀ ਜਾਂ ਦੋਸਤ ਨਾਲ ਕੰਮ ਕਰਨ ਜਿੰਨਾ ਭਰੋਸੇਮੰਦ ਅਤੇ ਸੁਰੱਖਿਅਤ ਬਣਾਇਆ ਜਾਵੇ. ਅਸੀਂ ਹਕੀਕਤੀ ਵਰਤੋਂ ਤੋਂ ਸਿੱਖਦੇ ਰਹਾਂਗੇ, ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਦੁਹਰਾਈ ਕਰਦੇ ਰਹਾਂਗੇ, ਅਤੇ ਜਿਵੇਂ ਜਿਵੇਂ ਤਕਨਾਲੋਜੀ ਅੱਗੇ ਵਧੇਗੀ, ਅਸੀਂ ਜੋ ਸਿੱਖਾਂਗੇ ਉਹ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਦੇ ਰਹਾਂਗੇ.

ਪੜ੍ਹਦੇ ਰਹੋ

ਸਭ ਵੇਖੋ

Daybreak: ਦੁਨੀਆ ਦੇ ਹਰ ਸੰਗਠਨ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਲਈ ਟੂਲ

ਸੁਰੱਖਿਆ22 ਜੂਨ 2026

Patch the Planet: a Daybreak initiative to support open source maintainers

ਸੁਰੱਖਿਆ22 ਜੂਨ 2026

Windows 'ਤੇ Codex ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸੁਰੱਖਿਅਤ ਅਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸੈਂਡਬਾਕਸ ਬਣਾਉਣਾ

ਇੰਜੀਨੀਅਰਿੰਗ13 ਮਈ 2026