7 ਜੂਨ 2024

Voice Engine ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ ਅਤੇ ਸਾਡੀ ਸੁਰੱਖਿਆ ਖੋਜ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ

ਸਾਡੇ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਮਾਡਲ ਦੇ ਪਿੱਛੇ ਦੀ ਤਕਨਾਲੋਜੀ ਦੀ ਖੋਜ.

ਪੇਸਟਲ ਰੰਗਾਂ ਦੇ ਮਿਲਾਪ ਨਾਲ ਇਕ ਅਮੂਰਤ ਚਿੱਤਰਕਾਰੀ, ਜਿਸ ਵਿੱਚ ਗੁਲਾਬੀ, ਸੰਤਰੀ, ਜਾਮਨੀ ਅਤੇ ਹਰਾ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਇਕ ਜੀਵੰਤ ਦ੍ਰਿਸ਼ ਦੀ ਯਾਦ ਦਿਵਾਉਂਦੀ ਹੈ.

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਅਸੀਂ Voice Engine ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ ਅਤੇ ਸਾਡੀ ਸੁਰੱਖਿਆ ਖੋਜ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਦੇ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਸਭ ਨੂੰ ਸਾਡੀ ਤਰੱਕੀ ਬਾਰੇ ਅੱਪਡੇਟ ਰੱਖਿਆ ਜਾ ਸਕੇ. Voice Engine ਇੱਕ ਅਜਿਹਾ ਮਾਡਲ ਹੈ ਜੋ ਕਸਟਮ ਆਵਾਜ਼ਾਂ ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੈ.

ਇਹ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ ਦੁਨੀਆ ਭਰ ਦੇ ਲੋਕ ਸਮਝਣ ਕਿ ਇਹ ਤਕਨਾਲੋਜੀ ਕਿੱਥੇ ਵੱਲ ਵੱਧ ਰਹੀ ਹੈ, ਭਾਵੇਂ ਅਸੀਂ ਅੰਤ ਵਿੱਚ ਇਸਨੂੰ ਖੁਦ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਤੈਨਾਤ ਕਰੀਏ ਜਾਂ ਨਾ ਕਰੀਏ. ਇਸੇ ਲਈ ਅਸੀਂ ਸਮਝਾਉਣਾ ਚਾਹੁੰਦੇ ਹਾਂ ਕਿ ਮਾਡਲ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਅਸੀਂ ਇਸਨੂੰ ਖੋਜ ਅਤੇ ਸਿੱਖਿਆ ਲਈ ਕਿਵੇਂ ਵਰਤਦੇ ਹਾਂ, ਅਤੇ ਅਸੀਂ ਇਸ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਆਪਣੇ ਸੁਰੱਖਿਆ ਉਪਾਅ ਕਿਵੇਂ ਲਾਗੂ ਕਰ ਰਹੇ ਹਾਂ. Voice Engine ਹਾਲੇ ਤੱਕ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਨਹੀਂ ਹੈ.

Voice Engine ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ

ਆਵਾਜ਼ ਸਮਰੱਥਾ ਨੂੰ ਇਕ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ (TTS) ਮਾਡਲ ਦੁਆਰਾ ਸਮਰੱਥ ਬਣਾਇਆ ਗਿਆ ਹੈ, ਜੋ ਸਿਰਫ਼ ਪਾਠ ਅਤੇ 15 ਸੈਕਿੰਡ ਦੇ ਨਮੂਨਾ ਬੋਲ ਤੋਂ ਮਨੁੱਖੀ ਜਿਹੀ ਆਡੀਓ ਤਿਆਰ ਕਰਨ ਦੇ ਯੋਗ ਹੈ.

TTS ਸਿਸਟਮ ਨੂੰ ਜੋੜੀ ਬਣੇ ਆਡੀਓ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨਾਂ ਤੋਂ ਬੋਲਣ ਦੀਆਂ ਬਾਰੀਕੀਆਂ ਸਮਝਣ ਵਿੱਚ ਮਾਡਲ ਦੀ ਮਦਦ ਕਰਕੇ ਵਿਕਸਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ. ਮਾਡਲ ਕਿਸੇ ਦਿੱਤੇ ਪਾਠ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟ ਲਈ ਇਹ ਅਨੁਮਾਨ ਲਗਾਉਣਾ ਸਿੱਖਦਾ ਹੈ ਕਿ ਬੋਲਣ ਵਾਲਾ ਸਭ ਤੋਂ ਸੰਭਾਵੀ ਕਿਹੜੀਆਂ ਧੁਨੀਆਂ ਪੈਦਾ ਕਰੇਗਾ, ਅਤੇ ਇਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਆਵਾਜ਼ਾਂ, ਲਹਿਜ਼ਿਆਂ ਅਤੇ ਬੋਲਣ ਦੇ ਢੰਗਾਂ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਿਆ ਜਾਂਦਾ ਹੈ. ਇਸ ਤੋਂ ਬਾਅਦ, ਮਾਡਲ ਸਿਰਫ਼ ਪਾਠ ਦੇ ਬੋਲੇ ਹੋਏ ਰੂਪ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਅਜਿਹੇ ਬੋਲੇ ਉਚਾਰਣ ਵੀ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਦਰਸਾਉਣ ਕਿ ਵੱਖ-ਵੱਖ ਕਿਸਮ ਦੇ ਬੋਲਣ ਵਾਲੇ ਉਨ੍ਹਾਂ ਨੂੰ ਕਿਵੇਂ ਕਹਿੰਦੇ.

ਇਸ ਤੋਂ ਅੱਗੇ, TTS ਮਾਡਲ ਨਾਲ ਆਡੀਓ ਬਣਾਉਣ ਲਈ ਬੋਲਣ ਵਾਲੇ ਤੋਂ ਕੇਵਲ 15 ਸੈਕਿੰਡ ਦਾ ਨਮੂਨਾ ਅਤੇ ਉਸ ਨਾਲ ਸੰਬੰਧਿਤ ਪਾਠ ਲੋੜੀਂਦਾ ਹੈ. ਮਾਡਲ ਨੂੰ ਕਿਸੇ ਖਾਸ ਬੋਲਣ ਵਾਲੇ ਲਈ ਫਾਈਨ-ਟਿਊਨ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ, ਇਸ ਵਿੱਚ ਕੋਈ ਮਾਡਲ ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ ਸ਼ਾਮਲ ਨਹੀਂ ਹੁੰਦੀ. ਇਸ ਦੀ ਥਾਂ, ਇਹ ਇਕ ਡਿਫਿਊਜ਼ਨ ਪ੍ਰਕਿਰਿਆ ਵਰਤਦਾ ਹੈ, ਜੋ ਰੈਂਡਮ ਸ਼ੋਰ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦੀ ਹੈ ਅਤੇ ਹੌਲੀ-ਹੌਲੀ ਉਸ ਦਾ ਸ਼ੋਰ ਘਟਾਉਂਦੀ ਹੈ ਤਾਂ ਜੋ ਇਹ ਬਹੁਤ ਨੇੜੇ ਤੱਕ ਮੇਲ ਖਾਵੇ ਕਿ 15 ਸੈਕਿੰਡ ਦੇ ਆਡੀਓ ਨਮੂਨੇ ਵਾਲਾ ਬੋਲਣ ਵਾਲਾ ਪਾਠ ਨੂੰ ਕਿਵੇਂ ਉਚਾਰੇਗਾ.

ਅਸੀਂ ਇਸ ਮਾਡਲ ਨੂੰ ਇੱਕ ਸਾਲ ਤੋਂ ਵੱਧ ਸਮੇਂ ਤੋਂ ਵਿਕਸਿਤ ਕਰ ਰਹੇ ਹਾਂ

ਅਸੀਂ ਪਹਿਲਾਂ Voice Engine ਨੂੰ 2022 ਦੇ ਅੰਤ ਵਿੱਚ ਵਿਕਸਿਤ ਕੀਤਾ. ਸ਼ੁਰੂਆਤੀ ਦੌਰ ਵਿੱਚ, ਆਪਣੇ Voice Engine ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਦਾ ਅੰਕਲਨ ਕਰਨ ਲਈ, ਅਸੀਂ ਇਸਦੀ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਸਰਕਾਰੀ ਅਤੇ ਨਿੱਜੀ ਆਵਾਜ਼ ਨਮੂਨਿਆਂ ਦੇ ਮਿਲਾਪ ਨਾਲ ਜਾਂਚ ਕੀਤੀ. ਇਹ ਅੰਦਰੂਨੀ ਪ੍ਰੋਟੋਟਾਈਪ ਸਾਡੀ ਅਲਾਈਨਮੈਂਟ ਅਤੇ ਸੁਰੱਖਿਆ ਖੋਜ ਲਈ ਜ਼ਰੂਰੀ ਸੀ, ਜਿਸ ਨੇ ਸੁਰੱਖਿਆ ਉਪਾਅ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਸਾਡੀ ਮਦਦ ਕੀਤੀ, ਅਤੇ ਇਹ ਤਕਨੀਕੀ ਅਤਿ-ਆਧੁਨਿਕ ਖੇਤਰ ਨੂੰ ਸਮਝਣ ਦੀ ਸਾਡੀ ਵਚਨਬੱਧਤਾ ਦਾ ਹੀ ਹਿੱਸਾ ਹੈ.

ਮਹੱਤਵਪੂਰਨ ਤੌਰ 'ਤੇ, ਇਹ ਆਉਟਪੁੱਟ ਸਿਰਫ਼ ਅੰਦਰੂਨੀ ਟੈਸਟਿੰਗ ਲਈ ਰੱਖੇ ਗਏ ਸਨ, ਉਨ੍ਹਾਂ ਮਾਡਲਾਂ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਨਹੀਂ ਜੋ ਸਾਡੇ ਉਤਪਾਦਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ.

ਸਾਡੇ ਆਵਰਤੀ ਤੈਨਾਤੀ ਫ੍ਰੇਮਵਰਕ ਦੇ ਹਿੱਸੇ ਵਜੋਂ, ਇਸ ਸ਼ੁਰੂਆਤੀ ਪ੍ਰੋਟੋਟਾਈਪ ਨੇ ਨੀਤੀ-ਨਿਰਧਾਰਕਾਂ ਨੂੰ ਸਿੰਥੇਟਿਕ ਵੌਇਸ ਮਾਡਲਾਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਸਮਝਾਉਣ ਵਿੱਚ ਵੀ ਕੀਮਤੀ ਭੂਮਿਕਾ ਨਿਭਾਈ. ਉਦਾਹਰਨ ਵਜੋਂ, ਪਿਛਲੀ ਗਰਮੀਆਂ ਤੋਂ ਅਸੀਂ ਵਿਸ਼ਵ ਪੱਧਰੀ ਨੀਤੀ-ਨਿਰਧਾਰਕਾਂ ਨੂੰ ਸਭ ਤੋਂ ਉੱਚੇ ਪੱਧਰਾਂ 'ਤੇ ਇਸ ਤਕਨਾਲੋਜੀ ਦੀ ਸੰਭਾਵਨਾ ਦਿਖਾਈ ਅਤੇ ਉਨ੍ਹਾਂ ਨਾਲ ਸੰਬੰਧਿਤ ਜੋਖਮਾਂ 'ਤੇ ਗੱਲ ਕੀਤੀ.

ਸਤੰਬਰ 2023 ਵਿੱਚ⁠, ਅਸੀਂ ChatGPT ਦੀ ਵੌਇਸ ਮੋਡ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ Voice Engine ਵਰਤਿਆ. ਕਿਉਂਕਿ ਇਹ ਸਮਰੱਥਾਵਾਂ ਨਵੇਂ ਜੋਖਮ ਵੀ ਲਿਆਉਂਦੀਆਂ ਸਨ, ਅਸੀਂ ਇਸਨੂੰ ਕੇਵਲ ਇਸ ਖਾਸ ਵਰਤੋਂ ਮਾਮਲੇ ਲਈ ਹੀ ਲਾਂਚ ਕੀਤਾ. ਵੌਇਸ ਮੋਡ ਸਿਰਫ਼ ਅਸਲੀ ਆਵਾਜ਼ਾਂ ਤੋਂ ਬਣਾਇਆ ਗਿਆ ਸੀ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਧਿਆਨ ਨਾਲ ਚੁਣਿਆ ਗਿਆ⁠ ਸੀ, ਇਕ ਵਿਸਤ੍ਰਿਤ ਪ੍ਰਕਿਰਿਆ ਰਾਹੀਂ ਜੋ ਮਈ 2023 ਵਿੱਚ ਸ਼ੁਰੂ ਹੋਈ ਸੀ ਅਤੇ ਜਿਸ ਵਿੱਚ ਪੇਸ਼ੇਵਰ ਵੌਇਸ ਅਦਾਕਾਰ, ਟੈਲੈਂਟ ਏਜੰਸੀਆਂ, ਕਾਸਟਿੰਗ ਡਾਇਰੈਕਟਰ ਅਤੇ ਉਦਯੋਗ ਸਲਾਹਕਾਰ ਸ਼ਾਮਲ ਸਨ.

ਨਵੰਬਰ 2023 ਵਿੱਚ⁠, ਅਸੀਂ Voice Engine ਦੁਆਰਾ ਸਮਰੱਥ ਇਕ ਸਧਾਰਣ TTS API⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵੀ ਜਾਰੀ ਕੀਤਾ. ਅਸੀਂ ਇਕ ਹੋਰ ਸੀਮਿਤ ਜਾਰੀਕਰਨ ਚੁਣਿਆ ਜਿਸ ਵਿੱਚ ਅਸੀਂ ਪੇਸ਼ੇਵਰ ਵੌਇਸ ਅਦਾਕਾਰਾਂ ਨਾਲ ਮਿਲ ਕੇ API ਵਿੱਚ ਪਹਿਲਾਂ ਤੋਂ ਨਿਰਧਾਰਤ ਛੇ ਆਵਾਜ਼ਾਂ ਵਿੱਚੋਂ ਹਰ ਇੱਕ ਲਈ 15 ਸੈਕਿੰਡ ਦੇ ਆਡੀਓ ਨਮੂਨੇ ਬਣਾਏ. ਉਦਾਹਰਨ ਲਈ, ਡਿਵੈਲਪਰ ਇਨ੍ਹਾਂ ਨੂੰ ਆਪਣੀਆਂ ਵੈਬਸਾਈਟਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਕੇ ਬਲੌਗ ਪੋਸਟਾਂ ਨੂੰ ਉੱਚੀ ਆਵਾਜ਼ ਵਿੱਚ ਪੜ੍ਹਵਾ ਸਕਦੇ ਹਨ.

ਇਸ ਸਾਲ ਮਾਰਚ ਵਿੱਚ⁠, ਅਸੀਂ ਭਰੋਸੇਯੋਗ ਭਾਗੀਦਾਰਾਂ ਦੇ ਇਕ ਛੋਟੇ ਸਮੂਹ ਨਾਲ ਕਸਟਮ ਆਵਾਜ਼ਾਂ ਬਣਾਉਣ ਦੀ Voice Engine ਦੀ ਸਮਰੱਥਾ ਦਾ ਪ੍ਰੀਵਿਊ ਦਿੱਤਾ. ਇਸ ਪਹਿਲ ਦਾ ਉਦੇਸ਼ ਸਿੰਥੇਟਿਕ ਆਵਾਜ਼ਾਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਬਾਰੇ ਜਾਗਰੂਕਤਾ ਵਧਾਉਣਾ ਅਤੇ ਹੇਠ ਲਿਖੇ ਲਕਸ਼ਾਂ ਦਾ ਸਮਰਥਨ ਕਰਨਾ ਸੀ:

ਬੈਂਕ ਖਾਤਿਆਂ ਅਤੇ ਹੋਰ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਤੱਕ ਪਹੁੰਚ ਲਈ ਸੁਰੱਖਿਆ ਉਪਾਅ ਵਜੋਂ ਆਵਾਜ਼-ਆਧਾਰਿਤ ਪ੍ਰਮਾਣਿਕਤਾ ਨੂੰ ਧੀਰੇ-ਧੀਰੇ ਖਤਮ ਕਰਨਾ
AI ਵਿੱਚ ਵਿਅਕਤੀਆਂ ਦੀਆਂ ਆਵਾਜ਼ਾਂ ਦੀ ਵਰਤੋਂ ਦੀ ਰੱਖਿਆ ਲਈ ਨੀਤੀਆਂ ਦੀ ਖੋਜ ਕਰਨਾ
ਜਨਤਾ ਨੂੰ AI ਤਕਨਾਲੋਜੀਆਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਸਮਝਣ ਲਈ ਸਿੱਖਿਆ ਦੇਣਾ, ਜਿਸ ਵਿੱਚ ਭ੍ਰਮਿਤ ਕਰਨ ਵਾਲੀ AI ਸਮੱਗਰੀ ਦੀ ਸੰਭਾਵਨਾ ਵੀ ਸ਼ਾਮਲ ਹੈ
ਆਡੀਓ-ਵਿਜੁਅਲ ਸਮੱਗਰੀ ਦੇ ਮੂਲ ਨੂੰ ਟ੍ਰੈਕ ਕਰਨ ਲਈ ਤਕਨੀਕਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਅਪਨਾਉਣ ਨੂੰ ਤੇਜ਼ ਕਰਨਾ, ਤਾਂ ਜੋ ਹਮੇਸ਼ਾਂ ਇਹ ਸਪਸ਼ਟ ਰਹੇ ਕਿ ਤੁਸੀਂ ਕਿਸੇ ਅਸਲੀ ਵਿਅਕਤੀ ਨਾਲ ਸੰਪਰਕ ਕਰ ਰਹੇ ਹੋ ਜਾਂ ਕਿਸੇ AI ਨਾਲ

ਇਹ ਛੋਟੇ ਪੱਧਰ ਦੀਆਂ ਤੈਨਾਤੀਆਂ ਸਾਨੂੰ ਆਪਣੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ, ਸੁਰੱਖਿਆ ਉਪਾਅ ਅਤੇ ਇਸ ਸੋਚ ਨੂੰ ਵੀ ਹੋਰ ਮਜ਼ਬੂਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਰਹੀਆਂ ਹਨ ਕਿ Voice Engine ਵੱਖ-ਵੱਖ ਉਦਯੋਗਾਂ ਵਿੱਚ ਚੰਗੇ ਲਈ ਕਿਵੇਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ.

Voice Engine ਨੂੰ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਬਣਾਉਣਾ ਸਭ ਤੋਂ ਵੱਡੀ ਤਰਜੀਹ ਹੈ

ਅਸੀਂ ਅਮਰੀਕਾ ਅਤੇ ਅੰਤਰਰਾਸ਼ਟਰੀ ਭਾਗੀਦਾਰਾਂ ਨਾਲ, ਸਰਕਾਰ, ਮੀਡੀਆ, ਮਨੋਰੰਜਨ, ਸਿੱਖਿਆ, ਸਿਵਲ ਸਮਾਜ ਅਤੇ ਹੋਰ ਖੇਤਰਾਂ ਵਿੱਚ, ਲਗਾਤਾਰ ਸੰਪਰਕ ਵਿੱਚ ਹਾਂ ਤਾਂ ਜੋ ਬਣਾਉਂਦੇ ਸਮੇਂ ਅਸੀਂ ਉਨ੍ਹਾਂ ਦੀ ਪ੍ਰਤੀਕਿਰਿਆ ਨੂੰ ਸ਼ਾਮਲ ਕਰ ਰਹੇ ਹੋਈਏ.

Voice Engine ਦੀ ਜਾਂਚ ਕਰ ਰਹੇ ਭਾਗੀਦਾਰ ਵਰਤੋਂ ਨੀਤੀਆਂ ਨਾਲ ਸਹਿਮਤ ਹੋਏ ਹਨ ਜੋ ਬਿਨਾਂ ਸਹਿਮਤੀ ਦੇ ਨਕਲ ਕਰਨ 'ਤੇ ਪਾਬੰਦੀ ਲਗਾਉਂਦੀਆਂ ਹਨ ਅਤੇ ਮੂਲ ਬੋਲਣ ਵਾਲੇ ਤੋਂ ਸਪਸ਼ਟ ਮਨਜ਼ੂਰੀ ਲਾਜ਼ਮੀ ਕਰਦੀਆਂ ਹਨ, ਅਤੇ ਇਹ ਵੀ ਲਾਜ਼ਮੀ ਕਰਦੀਆਂ ਹਨ ਕਿ AI-ਜਨਰੇਟ ਕੀਤੀਆਂ ਆਵਾਜ਼ਾਂ ਬਾਰੇ ਸੁਣਨ ਵਾਲਿਆਂ ਨੂੰ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਦੱਸਿਆ ਜਾਵੇ. ਇਸ ਤੋਂ ਇਲਾਵਾ, ਵਾਟਰਮਾਰਕਿੰਗ ਅਤੇ ਸਰਗਰਮ ਨਿਗਰਾਨੀ ਵਰਗੇ ਸੁਰੱਖਿਆ ਉਪਾਅ⁠ ਤਕਨਾਲੋਜੀ ਦੀ ਵਰਤੋਂ ਦਾ ਪਤਾ ਲਗਾਉਣ ਅਤੇ ਉਸ ਦੀ ਦੇਖਰੇਖ ਕਰਨ ਲਈ ਲਾਗੂ ਹਨ.

ਭਵਿੱਖ ਦੀ ਸਿੰਥੇਟਿਕ ਆਵਾਜ਼ ਸੁਰੱਖਿਆ

GPT‑4o ਵਰਗੇ ਓਮਨੀਮਾਡਲ, ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਮੂਲ ਆਡੀਓ ਸਮਰੱਥਾਵਾਂ ਹਨ, ਨਵੀਆਂ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਸੰਭਵ ਬਣਾਉਂਦੇ ਹਨ ਜੋ Voice Engine ਵਰਗੇ ਪਿਛਲੇ ਮਾਡਲ ਨਹੀਂ ਕਰ ਸਕਦੇ ਸਨ. ਅਸੀਂ ਇਹ ਵੀ ਮੰਨਦੇ ਹਾਂ ਕਿ GPT‑4o ਦੀ ਆਡੀਓ ਮੋਡੈਲਿਟੀ ਕਈ ਨਵੇਂ ਜੋਖਮ ਲਿਆਉਂਦੀ ਹੈ, ਖਾਸ ਕਰਕੇ ਆਵਾਜ਼ ਬਣਾਉਣ ਵਿੱਚ. ਅਸੀਂ GPT‑4o ਦੀ ਸਰਗਰਮੀ ਨਾਲ ਰੈਡ-ਟੀਮਿੰਗ ਕਰ ਰਹੇ ਹਾਂ ਤਾਂ ਜੋ ਸਮਾਜਿਕ ਮਨੋਵਿਗਿਆਨ, ਪੱਖਪਾਤ ਅਤੇ ਨਿਆਂ, ਅਤੇ ਗਲਤ ਜਾਣਕਾਰੀ ਵਰਗੇ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ ਵਿੱਚ ਜਾਣੇ-ਪਛਾਣੇ ਅਤੇ ਅਣਅਨੁਮਾਨੇ ਦੋਹਾਂ ਜੋਖਮਾਂ ਦੀ ਪਛਾਣ ਕਰਕੇ ਉਨ੍ਹਾਂ ਦਾ ਹੱਲ ਕੀਤਾ ਜਾ ਸਕੇ. ਅਸੀਂ ਰੋਕਥਾਮ ਦੀਆਂ ਕਈ ਪਰਤਾਂ ਤਿਆਰ ਕਰ ਰਹੇ ਹਾਂ, ਜਿਵੇਂ ਮਾਡਲ ਦੇ ਵਿਹਾਰਾਂ ਨੂੰ ਸੁਧਾਰਨਾ, GPT‑4o ਦੀ ਆਰਕੀਟੈਕਚਰ ਲਈ ਮੌਜੂਦਾ ਪਾਠ-ਆਧਾਰਿਤ ਸਿਸਟਮਾਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ, ਅਤੇ ਨਵੇਂ ਕਲਾਸੀਫਾਇਰ ਵਿਕਸਿਤ ਕਰਨਾ.

Voice Engine ਨੂੰ ਜਾਰੀ ਕਰਨ ਬਾਰੇ ਸਾਡੇ ਸਾਵਧਾਨੀਪੂਰਣ ਰੁਖ ਦੇ ਅਨੁਰੂਪ, ਅਸੀਂ ਆਮ ਜਾਰੀਕਰਨ ਲਈ GPT‑4o ਦੇ ਆਡੀਓ ਆਉਟਪੁੱਟ ਨੂੰ ਪਹਿਲਾਂ ਤੋਂ ਨਿਰਧਾਰਤ ਆਵਾਜ਼ਾਂ ਦੀ ਇਕ ਚੋਣ ਤੱਕ ਸੀਮਿਤ ਕਰਾਂਗੇ. ਇਹ ਆਵਾਜ਼ਾਂ ਪੇਸ਼ੇਵਰ ਵੌਇਸ ਅਦਾਕਾਰਾਂ ਤੋਂ ਲਈਆਂ ਗਈਆਂ ਸਨ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਧਿਆਨ ਨਾਲ ਸੋਚੀ-ਸਮਝੀ ਕਾਸਟਿੰਗ ਪ੍ਰਕਿਰਿਆ ਰਾਹੀਂ ਚੁਣਿਆ ਗਿਆ ਸੀ. ਆਉਣ ਵਾਲੇ GPT‑4o ਸਿਸਟਮ ਕਾਰਡ ਵਿੱਚ ਅਸੀਂ ਆਡੀਓ-ਸਬੰਧੀ ਜੋਖਮਾਂ ਅਤੇ ਰੋਕਥਾਮ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਸਾਂਝੀ ਕਰਾਂਗੇ.

ਲੇਖਕ

OpenAI