Tolan GPT‑5.1 ਨਾਲ ਵੌਇਸ-ਪਹਿਲਾਂ AI ਕਿਵੇਂ ਬਣਾਉਂਦਾ ਹੈ.
GPT‑5.1 ਨਾਲ Tolan ਨੇ ਘੱਟ ਲੇਟੈਂਸੀ, ਸਹੀ ਸੰਦਰਭ ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਬਦਲਣ ਨਾਲ ਸਥਿਰ ਪਰਸਨਾਲਿਟੀ ਲਈ ਅਨੁਕੂਲਿਤ ਵੌਇਸ ਐਪ ਬਣਾਈ.

Tolan(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਇੱਕ ਵੌਇਸ-ਪਹਿਲਾਂ AI ਸਾਥੀ ਹੈ ਜਿੱਥੇ ਲੋਕ ਇੱਕ ਨਿੱਜੀਕ੍ਰਿਤ, ਐਨੀਮੇਟਡ ਕਿਰਦਾਰ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹਨ ਜੋ ਸਮੇਂ ਦੇ ਨਾਲ ਗੱਲਬਾਤਾਂ ਤੋਂ ਸਿੱਖਦਾ ਹੈ।
Portola ਵੱਲੋਂ ਬਣਾਇਆ ਗਿਆ, ਜੋ ਪਹਿਲਾਂ ਸਫਲ ਐਗਜ਼ਿਟ ਕਰ ਚੁੱਕੀ ਤਜਰਬੇਕਾਰ ਟੀਮ ਹੈ, ਇਹ ਐਪ ਛੋਟੇ ਪ੍ਰੌੰਪਟ ਅਤੇ ਜਵਾਬਾਂ ਦੀ ਬਜਾਏ ਲੰਬੀ, ਖੁੱਲ੍ਹੀ ਗੱਲਬਾਤ ਲਈ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਗਿਆ ਹੈ। Portola ਦੇ ਸਹਿ-ਸੰਸਥਾਪਕ ਅਤੇ CEO Quinten Farmer ਕਹਿੰਦੇ ਹਨ, “ਅਸੀਂ ChatGPT ਦੇ ਉਭਾਰ ਨੂੰ ਦੇਖਿਆ ਅਤੇ ਜਾਣ ਲਿਆ ਕਿ ਵੌਇਸ ਅਗਲਾ ਅਤਿ-ਆਧੁਨਿਕ ਖੇਤਰ ਹੈ। ਪਰ ਵੌਇਸ ਹੋਰ ਮੁਸ਼ਕਲ ਹੈ। ਤੁਸੀਂ ਸਿਰਫ਼ ਟਾਈਪ ਕੀਤੇ ਪ੍ਰੌੰਪਟਾਂ ਦਾ ਜਵਾਬ ਨਹੀਂ ਦੇ ਰਹੇ; ਤੁਸੀਂ ਇੱਕ ਜੀਵੰਤ, ਭਟਕਦੀ ਗੱਲਬਾਤ ਨਿਭਾ ਰਹੇ ਹੋ।”
ਵੌਇਸ AI ਲੇਟੈਂਸੀ ਅਤੇ ਸੰਦਰਭ ਪ੍ਰਬੰਧਨ ਲਈ ਮਿਆਰ ਉੱਚਾ ਕਰਦਾ ਹੈ, ਪਰ ਇਹ ਟੈਕਸਟ ਨਾਲੋਂ ਹੋਰ ਖੁੱਲ੍ਹੀਆਂ ਅਤੇ ਖੋਜਪੂਰਣ ਇੰਟਰੈਕਸ਼ਨਾਂ ਨੂੰ ਵੀ ਸੰਭਵ ਬਣਾਉਂਦਾ ਹੈ।
ਜਿਵੇਂ-ਜਿਵੇਂ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਹੋਰ ਤੇਜ਼, ਸਸਤੇ ਅਤੇ ਸਮਰੱਥ ਬਣੇ, ਟੀਮ ਨੇ ਆਪਣੀ ਕੋਸ਼ਿਸ਼ ਦੋ ਮੁੱਖ ਪੱਖਾਂ ‘ਤੇ ਕੇਂਦਰਿਤ ਕੀਤੀ: ਮੈਮਰੀ ਅਤੇ ਕਿਰਦਾਰ ਡਿਜ਼ਾਇਨ। Portola ਨੇ ਇਨਾਮ-ਜੇਤੂ ਐਨੀਮੇਟਰਾਂ ਅਤੇ ਇੱਕ ਵਿਗਿਆਨ-ਕਲਪਨਾ ਲੇਖਕ ਦੁਆਰਾ ਆਕਾਰ ਦਿੱਤੀ ਕਿਰਦਾਰ-ਆਧਾਰਿਤ ਦੁਨੀਆ ਬਣਾਈ, ਜਿਸ ਵਿੱਚ ਗੱਲਬਾਤ ਦੇ ਅੱਗੇ ਵੱਧਣ ਨਾਲ ਪਰਸਨਾਲਿਟੀ ਅਤੇ ਮੈਮਰੀ ਨੂੰ ਸਥਿਰ ਰੱਖਣ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਸੰਦਰਭ ਪ੍ਰਬੰਧਨ ਸਿਸਟਮ ਵਰਤਿਆ ਗਿਆ।
GPT‑5.1 ਮਾਡਲਾਂ ਦੇ ਜਾਰੀ ਹੋਣ ਨਾਲ ਇੱਕ ਟਰਨਿੰਗ ਪੌਇੰਟ ਆਇਆ, ਜਿਸ ਨੇ steerability ਅਤੇ ਲੇਟੈਂਸੀ ਵਿੱਚ ਵੱਡੇ ਸੁਧਾਰ ਦਿੱਤੇ ਅਤੇ ਇਹ ਹਿੱਸੇ ਇਕੱਠੇ ਕਰਕੇ ਹੋਰ ਜ਼ਿਆਦਾ ਜਵਾਬਦੇਹ ਅਤੇ ਦਿਲਚਸਪ ਵੌਇਸ ਅਨੁਭਵ ਖੋਲ੍ਹਿਆ।
“GPT-5.1 ਨੇ ਸਾਨੂੰ ਉਹ steerability ਦਿੱਤੀ ਜਿਸ ਨਾਲ ਅਸੀਂ ਆਖ਼ਿਰਕਾਰ ਉਹ ਕਿਰਦਾਰ ਪ੍ਰਗਟ ਕਰ ਸਕੇ ਜੋ ਅਸੀਂ ਸੋਚੇ ਹੋਏ ਸਨ। ਇਹ ਸਿਰਫ਼ ਹੋਰ ਸਮਝਦਾਰ ਨਹੀਂ ਸੀ—ਇਹ ਉਸ ਟੋਨ ਅਤੇ ਪਰਸਨਾਲਿਟੀ ਲਈ ਹੋਰ ਵਫ਼ਾਦਾਰ ਸੀ ਜੋ ਅਸੀਂ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਸੀ।”
Tolan ਦੀ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਵੌਇਸ ਦੀਆਂ ਮੰਗਾਂ ਨੇ ਆਕਾਰ ਦਿੱਤਾ ਹੈ। ਵੌਇਸ ਯੂਜ਼ਰ ਤੁਰੰਤ ਅਤੇ ਕੁਦਰਤੀ ਜਵਾਬ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹਨ, ਭਾਵੇਂ ਗੱਲਬਾਤ ਵਿਚਕਾਰ ਹੀ ਦਿਸ਼ਾ ਬਦਲ ਲਏ। Tolan ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਜਵਾਬ ਦੇਣਾ, ਬਦਲਦੇ ਵਿਸ਼ਿਆਂ ਦਾ ਪਤਾ ਰੱਖਣਾ, ਅਤੇ ਦੇਰੀ ਜਾਂ ਟੋਨ ਡ੍ਰਿਫਟ ਤੋਂ ਬਿਨਾਂ ਇਕਸਾਰ ਪਰਸਨਾਲਿਟੀ ਕਾਇਮ ਰੱਖਣੀ ਪੈਂਦੀ ਸੀ।
ਕੁਦਰਤੀ ਮਹਿਸੂਸ ਹੋਣ ਲਈ, ਗੱਲਬਾਤਾਂ ਨੂੰ ਲਗਭਗ ਤੁਰੰਤ ਲੇਟੈਂਸੀ ਦੀ ਲੋੜ ਸੀ। OpenAI GPT‑5.1 ਅਤੇ Responses API ਦੇ ਆਉਣ ਨਾਲ ਬੋਲਣਾ ਸ਼ੁਰੂ ਕਰਨ ਦਾ ਸਮਾਂ 0.7 ਸਕਿੰਟ ਤੋਂ ਵੱਧ ਘੱਟ ਹੋ ਗਿਆ, ਜੋ ਗੱਲਬਾਤ ਦੇ ਪ੍ਰਵਾਹ ਵਿੱਚ ਸਪਸ਼ਟ ਸੁਧਾਰ ਲਈ ਕਾਫ਼ੀ ਸੀ।
ਇਸੇ ਤਰ੍ਹਾਂ ਮਹੱਤਵਪੂਰਨ ਸੀ ਕਿ ਸਿਸਟਮ ਸੰਦਰਭ ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਦਾ ਸੀ। ਕਈ ਏਜੰਟਾਂ ਤੋਂ ਵੱਖਰੇ, ਜੋ ਕਈ ਟਰਨਾਂ ਵਿੱਚ ਪ੍ਰੌੰਪਟ ਕੈਸ਼ ਕਰਦੇ ਹਨ, Tolan ਹਰ ਟਰਨ ‘ਤੇ ਆਪਣੀ ਸੰਦਰਭ ਵਿੰਡੋ ਸ਼ੁਰੂ ਤੋਂ ਦੁਬਾਰਾ ਬਣਾਉਂਦਾ ਹੈ। ਹਰ ਸੰਦਰਭ ਮੁੜ-ਨਿਰਮਾਣ ਵਿੱਚ ਹਾਲੀਆ ਸੁਨੇਹਿਆਂ ਦਾ ਸਾਰ, ਇੱਕ ਪਰਸੋਨਾ ਕਾਰਡ, ਵੈਕਟਰ-ਰੀਟਰੀਵ ਕੀਤੀਆਂ ਮੈਮਰੀਆਂ, ਟੋਨ ਮਾਰਗਦਰਸ਼ਨ ਅਤੇ ਰੀਅਲ-ਟਾਈਮ ਐਪ ਸਿਗਨਲ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ। ਇਹ ਆਰਕੀਟੈਕਚਰ Tolan ਨੂੰ ਵਿਸ਼ੇ ਵਿੱਚ ਅਚਾਨਕ ਬਦਲਾਅ ਅਨੁਸਾਰ ਰੀਅਲ ਟਾਈਮ ਵਿੱਚ ਅਨੁਕੂਲ ਹੋਣ ਦਿੰਦੀ ਹੈ, ਜੋ ਕੁਦਰਤੀ ਵੌਇਸ-ਆਧਾਰਿਤ ਇੰਟਰੈਕਸ਼ਨ ਲਈ ਲਾਜ਼ਮੀ ਹੈ।
Quinten ਕਹਿੰਦੇ ਹਨ, “ਸਾਨੂੰ ਜਲਦੀ ਸਮਝ ਆ ਗਿਆ ਕਿ ਕੈਸ਼ ਕੀਤੇ ਪ੍ਰੌੰਪਟ ਕਾਫ਼ੀ ਨਹੀਂ ਸਨ। ਯੂਜ਼ਰ ਹਮੇਸ਼ਾਂ ਵਿਸ਼ੇ ਬਦਲਦੇ ਰਹਿੰਦੇ ਹਨ। ਬਿਲਕੁਲ ਸਹਿਜ ਲੱਗਣ ਲਈ, ਸਿਸਟਮ ਨੂੰ ਵਿਚਕਾਰ ਹੀ ਅਨੁਕੂਲ ਹੋਣਾ ਪੈਂਦਾ ਸੀ।”
ਇਹ ਰੀਅਲ-ਟਾਈਮ ਮੁੜ-ਨਿਰਮਾਣ ਪਹੁੰਚ ਤਕਨੀਕੀ ਤੌਰ ‘ਤੇ ਗਹਿਰੀ ਹੈ ਅਤੇ Tolan ਦੀ ਸਫਲਤਾ ਦੀ ਬੁਨਿਆਦ ਵੀ ਹੈ।

ਸੰਦਰਭ ਸੰਭਾਲਣਾ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਪਰ ਸਮੇਂ ਦੇ ਨਾਲ ਗੱਲਬਾਤ ਨੂੰ ਇਕਸਾਰ ਮਹਿਸੂਸ ਕਰਵਾਉਣ ਲਈ ਇਹ ਕਾਫ਼ੀ ਨਹੀਂ ਸੀ। ਲੰਬੀਆਂ, ਗੈਰ-ਰੇਖੀ ਗੱਲਬਾਤਾਂ ਦਾ ਸਹਾਰਾ ਦੇਣ ਲਈ, Tolan ਨੇ ਐਸੀ ਮੈਮਰੀ ਸਿਸਟਮ ਬਣਾਈ ਜੋ ਸਿਰਫ਼ ਤੱਥ ਅਤੇ ਪਸੰਦਾਂ ਨਹੀਂ, ਸਗੋਂ ਭਾਵਨਾਤਮਕ “ਵਾਈਬ” ਸਿਗਨਲ ਵੀ ਸੰਭਾਲਦੀ ਹੈ—ਅਜੇਹੇ ਇਸ਼ਾਰੇ ਜੋ ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਕਿ Tolan ਨੂੰ ਕਿਵੇਂ ਜਵਾਬ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ।
ਮੈਮਰੀਆਂ ਨੂੰ OpenAI text-embedding-3-large ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਨਾਲ embed ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ Turbopuffer ਵਿੱਚ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਇੱਕ ਉੱਚ-ਗਤੀ ਵੈਕਟਰ ਡਾਟਾਬੇਸ ਹੈ ਅਤੇ 50ms ਤੋਂ ਘੱਟ ਲੁੱਕਅੱਪ ਸਮਾਂ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਇਹ ਗਤੀ ਰੀਅਲ-ਟਾਈਮ ਵੌਇਸ ਇੰਟਰੈਕਸ਼ਨਾਂ ਲਈ ਲਾਜ਼ਮੀ ਹੈ। ਹਰ ਟਰਨ ‘ਤੇ, Tolan ਯੂਜ਼ਰ ਦੇ ਸਭ ਤੋਂ ਤਾਜ਼ਾ ਸੁਨੇਹੇ ਅਤੇ ਸਿਸਟਮ-ਤਿਆਰ ਕੀਤੇ ਸਵਾਲਾਂ (ਜਿਵੇਂ, “ਯੂਜ਼ਰ ਦਾ ਵਿਆਹ ਕਿਸ ਨਾਲ ਹੋਇਆ ਹੈ?”) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮੈਮਰੀ ਰੀਕਾਲ ਟ੍ਰਿਗਰ ਕਰਦਾ ਹੈ। ਮੈਮਰੀ ਦੀ ਗੁਣਵੱਤਾ ਉੱਚੀ ਰੱਖਣ ਲਈ, Tolan ਰਾਤ ਦੀ ਕੰਪ੍ਰੈਸ਼ਨ ਜੌਬ ਚਲਾਉਂਦਾ ਹੈ ਜੋ ਘੱਟ ਮੁੱਲ ਵਾਲੀਆਂ ਜਾਂ ਦੁਹਰਾਈਆਂ ਐਂਟਰੀਆਂ (ਜਿਵੇਂ “ਯੂਜ਼ਰ ਨੇ ਅੱਜ ਕਾਫੀ ਪੀਤੀ”) ਹਟਾਉਂਦੀ ਹੈ ਅਤੇ ਵਿਰੋਧਾਂ ਨੂੰ ਸੁਲਝਾਉਂਦੀ ਹੈ।
ਪਰਸਨਾਲਿਟੀ ਨੂੰ ਵੀ ਇੰਨੀ ਹੀ ਸਾਵਧਾਨੀ ਨਾਲ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ। ਹਰ Tolan ਨੂੰ ਵੱਖਰਾ ਕਿਰਦਾਰ ਢਾਂਚਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਟੀਮ ਦੇ ਇਨ-ਹਾਊਸ ਵਿਗਿਆਨ-ਕਲਪਨਾ ਲੇਖਕ ਨੇ ਲਿਖਿਆ ਅਤੇ ਇੱਕ ਵਿਹਾਰਕ ਖੋਜਕਾਰ ਨੇ ਸੰਵਾਰਿਆ। ਇਹ ਬੀਜ Tolans ਨੂੰ ਇਕਸਾਰਤਾ ਦਿੰਦੇ ਹਨ, ਪਰ ਨਾਲ ਹੀ ਸਮੇਂ ਦੇ ਨਾਲ ਅਨੁਕੂਲ ਹੋਣ ਦੀ ਲਚਕ ਵੀ ਦਿੰਦੇ ਹਨ, ਤਾਂ ਜੋ ਉਹ ਯੂਜ਼ਰ ਦੇ ਨਾਲ-ਨਾਲ ਵਿਕਸਿਤ ਹੋ ਸਕਣ।
ਇੱਕ ਸਮਾਂਤਰ ਸਿਸਟਮ ਗੱਲਬਾਤ ਦੇ ਭਾਵਨਾਤਮਕ ਰੰਗ ‘ਤੇ ਨਜ਼ਰ ਰੱਖਦਾ ਹੈ ਅਤੇ Tolan ਦੀ ਪੇਸ਼ਕਾਰੀ ਨੂੰ ਗਤੀਸ਼ੀਲ ਤੌਰ ‘ਤੇ ਠੀਕ ਕਰਦਾ ਹੈ। ਇਸ ਨਾਲ Tolan ਯੂਜ਼ਰ ਦੇ ਸੰਕੇਤਾਂ ਦੇ ਅਧਾਰ ‘ਤੇ ਖੇਡਾਂ-ਮਜ਼ਾਕੀਆ ਤੋਂ ਗੰਭੀਰ ਮੋਡ ਵਿੱਚ ਬਿਨਾਂ ਆਪਣੀ ਮੁੱਖ ਪਰਸਨਾਲਿਟੀ ਗੁਆਏ ਸੁਗਮ ਤਰੀਕੇ ਨਾਲ ਬਦਲ ਸਕਦਾ ਹੈ।
GPT‑5.1 ਵੱਲ ਬਦਲਾਅ ਇੱਕ ਟਰਨਿੰਗ ਪੌਇੰਟ ਸੀ। ਅਚਾਨਕ, ਪਰਤਦਾਰ ਪ੍ਰੌੰਪਟ ਨਿਰਦੇਸ਼—ਟੋਨ ਸਕੈਫੋਲਡ, ਮੈਮਰੀ ਇੰਜੈਕਸ਼ਨ, ਕਿਰਦਾਰ ਗੁਣ—ਹੋਰ ਵਿਸ਼ਵਾਸਯੋਗ ਤਰੀਕੇ ਨਾਲ ਮੰਨੇ ਜਾਣ ਲੱਗੇ। ਜਿਨ੍ਹਾਂ ਪ੍ਰੌੰਪਟਾਂ ਲਈ ਪਹਿਲਾਂ ਵਰਕਅਰਾਊਂਡ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ, ਉਹ ਮਨਚਾਹੇ ਢੰਗ ਨਾਲ ਵਰਤਣ ਲੱਗੇ।
Quinten ਕਹਿੰਦੇ ਹਨ, “ਪਹਿਲੀ ਵਾਰ, ਸਾਡੇ ਅੰਦਰੂਨੀ ਮਾਹਿਰਾਂ ਨੂੰ ਲੱਗਿਆ ਕਿ ਮਾਡਲ ਸੱਚਮੁੱਚ ਸੁਣ ਰਿਹਾ ਸੀ। ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਦੌਰਾਨ ਨਿਰਦੇਸ਼ ਸਹੀ ਰਹੇ, ਪਰਸੋਨਾ ਗੁਣਾਂ ਦਾ ਆਦਰ ਕੀਤਾ ਗਿਆ, ਅਤੇ ਅਸੀਂ ਕਾਫ਼ੀ ਘੱਟ ਡ੍ਰਿਫਟ ਵੇਖੀ।”
ਇਹ ਬਦਲਾਅ ਮਿਲ ਕੇ ਹੋਰ ਇਕਸਾਰ ਅਤੇ ਵਿਸ਼ਵਾਸਯੋਗ ਪਰਸਨਾਲਿਟੀ ਵੱਲ ਲੈ ਗਏ, ਜਿਸ ਨਾਲ ਹੋਰ ਦਿਲਚਸਪ ਯੂਜ਼ਰ ਅਨੁਭਵ ਬਣਿਆ। Tolan ਟੀਮ ਨੇ ਸਪਸ਼ਟ ਅਤੇ ਮਾਪਯੋਗ ਸੁਧਾਰ ਵੇਖੇ: ਮੈਮਰੀ ਰੀਕਾਲ ਦੀਆਂ ਗਲਤੀਆਂ 30% ਘੱਟ ਹੋਈਆਂ (ਪ੍ਰੋਡਕਟ ਅੰਦਰ ਫਰਸਟ੍ਰੇਸ਼ਨ ਸਿਗਨਲਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ), ਅਤੇ GPT‑5.1‑ਚਲਿਤ ਪਰਸੋਨਾਜ਼ ਲਾਈਵ ਹੋਣ ਤੋਂ ਬਾਅਦ ਅਗਲੇ ਦਿਨ ਯੂਜ਼ਰ ਰਿਟੇਂਸ਼ਨ 20% ਤੋਂ ਵੱਧ ਵਧੀ।

ਜਿਵੇਂ-ਜਿਵੇਂ Tolan ਵਿਕਸਿਤ ਹੋਇਆ, ਕੁਝ ਸਿਧਾਂਤ ਸਾਹਮਣੇ ਆਏ ਜੋ ਹੁਣ ਟੀਮ ਦੀ ਵੌਇਸ ਆਰਕੀਟੈਕਚਰ ਬਣਾਉਣ ਅਤੇ ਵਿਕਸਿਤ ਕਰਨ ਦੀ ਦਿਸ਼ਾ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਨ:
- ਗੱਲਬਾਤੀ ਅਸਥਿਰਤਾ ਲਈ ਡਿਜ਼ਾਇਨ ਕਰੋ: ਵੌਇਸ ਗੱਲਬਾਤਾਂ ਵਾਕ ਦੇ ਵਿਚਕਾਰ ਹੀ ਦਿਸ਼ਾ ਬਦਲ ਲੈਂਦੀਆਂ ਹਨ। ਕੁਦਰਤੀ ਲੱਗਣ ਲਈ ਸਿਸਟਮਾਂ ਨੂੰ ਵੀ ਉੱਨੇ ਹੀ ਤੇਜ਼ੀ ਨਾਲ ਰੁਖ ਬਦਲਣਾ ਪੈਂਦਾ ਹੈ।
- ਲੇਟੈਂਸੀ ਨੂੰ ਪ੍ਰੋਡਕਟ ਅਨੁਭਵ ਦਾ ਹਿੱਸਾ ਮੰਨੋ: ਇੱਕ ਸਕਿੰਟ ਤੋਂ ਘੱਟ ਜਵਾਬਦੇਹੀ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ ਕਿ ਕੋਈ ਵੌਇਸ ਏਜੰਟ ਗੱਲਬਾਤੀ ਲੱਗਦਾ ਹੈ ਜਾਂ ਮਕੈਨੀਕੀ।
- ਮੈਮਰੀ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟ ਨਹੀਂ, ਰੀਟਰੀਵਲ ਸਿਸਟਮ ਵਜੋਂ ਬਣਾਓ: ਉੱਚ-ਗੁਣਵੱਤਾ ਕੰਪ੍ਰੈਸ਼ਨ ਅਤੇ ਤੇਜ਼ ਵੈਕਟਰ ਖੋਜ ਵੱਡੀਆਂ ਸੰਦਰਭ ਵਿੰਡੋਆਂ ਨਾਲੋਂ ਹੋਰ ਇਕਸਾਰ ਪਰਸਨਾਲਿਟੀ ਦਿੰਦੇ ਹਨ।
- ਹਰ ਟਰਨ ‘ਤੇ ਸੰਦਰਭ ਮੁੜ ਬਣਾਓ: ਵੱਡੇ ਪ੍ਰੌੰਪਟਾਂ ਨਾਲ ਡ੍ਰਿਫਟ ਨਾਲ ਲੜੋ ਨਾ। ਹਰ ਟਰਨ ‘ਤੇ ਸੰਦਰਭ ਦੁਬਾਰਾ ਬਣਾਉਣਾ ਏਜੰਟਾਂ ਨੂੰ ਗੱਲਬਾਤ ਦੇ ਭਟਕਣ ਦੌਰਾਨ ਜ਼ਮੀਨ ਨਾਲ ਜੋੜਿਆ ਰੱਖਦਾ ਹੈ।
ਇਕੱਠੇ ਮਿਲ ਕੇ, ਇਹ ਸਬਕ Tolan ਦੀ ਨਵੀਨਤਾ ਦੇ ਅਗਲੇ ਪੜਾਅ ਦੀ ਬੁਨਿਆਦ ਬਣਾਉਂਦੇ ਹਨ ਅਤੇ ਵੌਇਸ AI ਕਿੱਥੇ ਵੱਲ ਵੱਧ ਰਿਹਾ ਹੈ, ਉਸ ਦੀ ਦਿਸ਼ਾ ਤੈਅ ਕਰਦੇ ਹਨ।
ਫ਼ਰਵਰੀ 2025 ਵਿੱਚ ਲਾਂਚ ਤੋਂ ਬਾਅਦ, Tolan ਦੇ ਮਹੀਨਾਵਾਰ ਸਰਗਰਮ ਯੂਜ਼ਰ 200,000 ਤੋਂ ਵੱਧ ਹੋ ਗਏ ਹਨ। ਇਸਦੀ 4.8-ਸਟਾਰ ਰੇਟਿੰਗ ਅਤੇ App Store ‘ਤੇ 100,000 ਤੋਂ ਵੱਧ ਸਮੀਖਿਆਵਾਂ ਦਰਸਾਉਂਦੀਆਂ ਹਨ ਕਿ ਇਹ ਸਿਸਟਮ ਲੰਬੀਆਂ ਅਤੇ ਬਦਲਦੀਆਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ਕਿੰਨੀ ਚੰਗੀ ਤਰ੍ਹਾਂ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਦਾ ਹੈ। ਇੱਕ ਸਮੀਖਿਆਕਾਰ ਨੇ ਲਿਖਿਆ, “ਉਹ ਉਹ ਗੱਲਾਂ ਯਾਦ ਰੱਖਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਬਾਰੇ ਅਸੀਂ ਦੋ ਦਿਨ ਪਹਿਲਾਂ ਗੱਲ ਕੀਤੀ ਸੀ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਅੱਜ ਦੀ ਗੱਲਬਾਤ ਵਿੱਚ ਮੁੜ ਲਿਆਉਂਦੇ ਹਨ।”
ਇਹ ਸੰਕੇਤ ਸਿੱਧੇ ਅੰਦਰੂਨੀ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਜੁੜਦੇ ਹਨ: ਘੱਟ-ਲੇਟੈਂਸੀ ਮਾਡਲ ਕਾਲਾਂ, ਹਰ ਟਰਨ ‘ਤੇ ਸੰਦਰਭ ਮੁੜ-ਨਿਰਮਾਣ, ਅਤੇ ਮਾਡਿਊਲਰ ਮੈਮਰੀ ਅਤੇ ਪਰਸੋਨਾ ਸਿਸਟਮ। ਇਹ ਸਭ ਮਿਲ ਕੇ Tolan ਨੂੰ ਵਿਸ਼ੇ ਦੇ ਬਦਲਾਅ ਟ੍ਰੈਕ ਕਰਨ, ਟੋਨ ਸੰਭਾਲਣ ਅਤੇ ਵੱਡੇ ਪਰ ਨਾਜ਼ੁਕ ਪ੍ਰੌੰਪਟਾਂ ‘ਤੇ ਨਿਰਭਰ ਕੀਤੇ ਬਿਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ਅਧਾਰ ‘ਤੇ ਰੱਖਣ ਦਿੰਦੇ ਹਨ।
ਅੱਗੇ ਵੇਖਦਿਆਂ, Tolan steerability ਅਤੇ ਮੈਮਰੀ ਰੀਫ਼ਾਈਨਮੈਂਟ ਵਿੱਚ ਆਪਣਾ ਨਿਵੇਸ਼ ਹੋਰ ਗਹਿਰਾ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਹੋਰ ਕਸੇ ਹੋਏ ਕੰਪ੍ਰੈਸ਼ਨ, ਬਿਹਤਰ ਰੀਟਰੀਵਲ ਲੌਜਿਕ ਅਤੇ ਵਧੇਰੇ ਪਰਸੋਨਾ ਟਿਊਨਿੰਗ ‘ਤੇ ਧਿਆਨ ਦਿੱਤਾ ਜਾਵੇਗਾ। ਲੰਬੇ ਸਮੇਂ ਦਾ ਲਕਸ਼ ਇਹ ਵਧਾਉਣਾ ਹੈ ਕਿ ਵੌਇਸ ਇੰਟਰਫੇਸ ਕੀ ਹੋ ਸਕਦਾ ਹੈ: ਸਿਰਫ਼ ਜਵਾਬਦੇਹ ਨਹੀਂ, ਸਗੋਂ ਸੰਦਰਭ-ਸਚੇਤ ਅਤੇ ਗੱਲਬਾਤੀ ਤੌਰ ‘ਤੇ ਗਤੀਸ਼ੀਲ।
Quinten ਕਹਿੰਦੇ ਹਨ, “ਅਗਲਾ ਅਤਿ-ਆਧੁਨਿਕ ਖੇਤਰ ਉਹ ਵੌਇਸ ਏਜੰਟ ਬਣਾਉਣਾ ਹੈ ਜੋ ਸਿਰਫ਼ ਜਵਾਬਦੇਹ ਨਾ ਹੋਣ, ਸਗੋਂ ਅਸਲ ਵਿੱਚ ਮਲਟੀਮੋਡਲ ਹੋਣ, ਅਤੇ ਵੌਇਸ, ਵਿਜ਼ਨ ਅਤੇ ਸੰਦਰਭ ਨੂੰ ਇੱਕ ਇਕੱਲੇ, steerable ਸਿਸਟਮ ਵਿੱਚ ਜੋੜ ਸਕਣ।”


