Tolan GPT‑5.1 ਨਾਲ ਵੌਇਸ-ਪਹਿਲਾਂ AI ਕਿਵੇਂ ਬਣਾਉਂਦਾ ਹੈ.

GPT‑5.1 ਨਾਲ Tolan ਨੇ ਘੱਟ ਲੇਟੈਂਸੀ, ਸਹੀ ਸੰਦਰਭ ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਬਦਲਣ ਨਾਲ ਸਥਿਰ ਪਰਸਨਾਲਿਟੀ ਲਈ ਅਨੁਕੂਲਿਤ ਵੌਇਸ ਐਪ ਬਣਾਈ.

ਸੰਤਰੀ ਜਿਗਸਾ ਪਜ਼ਲ ਪਿਛੋਕੜ ਉੱਤੇ Tolan ਦਾ ਲੋਗੋ

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

Tolan⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਇੱਕ ਵੌਇਸ-ਪਹਿਲਾਂ AI ਸਾਥੀ ਹੈ ਜਿੱਥੇ ਲੋਕ ਇੱਕ ਨਿੱਜੀਕ੍ਰਿਤ, ਐਨੀਮੇਟਡ ਕਿਰਦਾਰ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹਨ ਜੋ ਸਮੇਂ ਦੇ ਨਾਲ ਗੱਲਬਾਤਾਂ ਤੋਂ ਸਿੱਖਦਾ ਹੈ।

Portola ਵੱਲੋਂ ਬਣਾਇਆ ਗਿਆ, ਜੋ ਪਹਿਲਾਂ ਸਫਲ ਐਗਜ਼ਿਟ ਕਰ ਚੁੱਕੀ ਤਜਰਬੇਕਾਰ ਟੀਮ ਹੈ, ਇਹ ਐਪ ਛੋਟੇ ਪ੍ਰੌੰਪਟ ਅਤੇ ਜਵਾਬਾਂ ਦੀ ਬਜਾਏ ਲੰਬੀ, ਖੁੱਲ੍ਹੀ ਗੱਲਬਾਤ ਲਈ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਗਿਆ ਹੈ। Portola ਦੇ ਸਹਿ-ਸੰਸਥਾਪਕ ਅਤੇ CEO Quinten Farmer ਕਹਿੰਦੇ ਹਨ, “ਅਸੀਂ ChatGPT ਦੇ ਉਭਾਰ ਨੂੰ ਦੇਖਿਆ ਅਤੇ ਜਾਣ ਲਿਆ ਕਿ ਵੌਇਸ ਅਗਲਾ ਅਤਿ-ਆਧੁਨਿਕ ਖੇਤਰ ਹੈ। ਪਰ ਵੌਇਸ ਹੋਰ ਮੁਸ਼ਕਲ ਹੈ। ਤੁਸੀਂ ਸਿਰਫ਼ ਟਾਈਪ ਕੀਤੇ ਪ੍ਰੌੰਪਟਾਂ ਦਾ ਜਵਾਬ ਨਹੀਂ ਦੇ ਰਹੇ; ਤੁਸੀਂ ਇੱਕ ਜੀਵੰਤ, ਭਟਕਦੀ ਗੱਲਬਾਤ ਨਿਭਾ ਰਹੇ ਹੋ।”

ਵੌਇਸ AI ਲੇਟੈਂਸੀ ਅਤੇ ਸੰਦਰਭ ਪ੍ਰਬੰਧਨ ਲਈ ਮਿਆਰ ਉੱਚਾ ਕਰਦਾ ਹੈ, ਪਰ ਇਹ ਟੈਕਸਟ ਨਾਲੋਂ ਹੋਰ ਖੁੱਲ੍ਹੀਆਂ ਅਤੇ ਖੋਜਪੂਰਣ ਇੰਟਰੈਕਸ਼ਨਾਂ ਨੂੰ ਵੀ ਸੰਭਵ ਬਣਾਉਂਦਾ ਹੈ।

ਜਿਵੇਂ-ਜਿਵੇਂ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ਹੋਰ ਤੇਜ਼, ਸਸਤੇ ਅਤੇ ਸਮਰੱਥ ਬਣੇ, ਟੀਮ ਨੇ ਆਪਣੀ ਕੋਸ਼ਿਸ਼ ਦੋ ਮੁੱਖ ਪੱਖਾਂ ‘ਤੇ ਕੇਂਦਰਿਤ ਕੀਤੀ: ਮੈਮਰੀ ਅਤੇ ਕਿਰਦਾਰ ਡਿਜ਼ਾਇਨ। Portola ਨੇ ਇਨਾਮ-ਜੇਤੂ ਐਨੀਮੇਟਰਾਂ ਅਤੇ ਇੱਕ ਵਿਗਿਆਨ-ਕਲਪਨਾ ਲੇਖਕ ਦੁਆਰਾ ਆਕਾਰ ਦਿੱਤੀ ਕਿਰਦਾਰ-ਆਧਾਰਿਤ ਦੁਨੀਆ ਬਣਾਈ, ਜਿਸ ਵਿੱਚ ਗੱਲਬਾਤ ਦੇ ਅੱਗੇ ਵੱਧਣ ਨਾਲ ਪਰਸਨਾਲਿਟੀ ਅਤੇ ਮੈਮਰੀ ਨੂੰ ਸਥਿਰ ਰੱਖਣ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਸੰਦਰਭ ਪ੍ਰਬੰਧਨ ਸਿਸਟਮ ਵਰਤਿਆ ਗਿਆ।

GPT‑5.1 ਮਾਡਲਾਂ ਦੇ ਜਾਰੀ ਹੋਣ ਨਾਲ ਇੱਕ ਟਰਨਿੰਗ ਪੌਇੰਟ ਆਇਆ, ਜਿਸ ਨੇ steerability ਅਤੇ ਲੇਟੈਂਸੀ ਵਿੱਚ ਵੱਡੇ ਸੁਧਾਰ ਦਿੱਤੇ ਅਤੇ ਇਹ ਹਿੱਸੇ ਇਕੱਠੇ ਕਰਕੇ ਹੋਰ ਜ਼ਿਆਦਾ ਜਵਾਬਦੇਹ ਅਤੇ ਦਿਲਚਸਪ ਵੌਇਸ ਅਨੁਭਵ ਖੋਲ੍ਹਿਆ।

“GPT-5.1 ਨੇ ਸਾਨੂੰ ਉਹ steerability ਦਿੱਤੀ ਜਿਸ ਨਾਲ ਅਸੀਂ ਆਖ਼ਿਰਕਾਰ ਉਹ ਕਿਰਦਾਰ ਪ੍ਰਗਟ ਕਰ ਸਕੇ ਜੋ ਅਸੀਂ ਸੋਚੇ ਹੋਏ ਸਨ। ਇਹ ਸਿਰਫ਼ ਹੋਰ ਸਮਝਦਾਰ ਨਹੀਂ ਸੀ—ਇਹ ਉਸ ਟੋਨ ਅਤੇ ਪਰਸਨਾਲਿਟੀ ਲਈ ਹੋਰ ਵਫ਼ਾਦਾਰ ਸੀ ਜੋ ਅਸੀਂ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਸੀ।”

—Quinten Farmer, CEO, Portola

ਕੁਦਰਤੀ ਵੌਇਸ ਇੰਟਰੈਕਸ਼ਨਾਂ ਲਈ ਡਿਜ਼ਾਇਨ ਕਰਨਾ

Tolan ਦੀ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਵੌਇਸ ਦੀਆਂ ਮੰਗਾਂ ਨੇ ਆਕਾਰ ਦਿੱਤਾ ਹੈ। ਵੌਇਸ ਯੂਜ਼ਰ ਤੁਰੰਤ ਅਤੇ ਕੁਦਰਤੀ ਜਵਾਬ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹਨ, ਭਾਵੇਂ ਗੱਲਬਾਤ ਵਿਚਕਾਰ ਹੀ ਦਿਸ਼ਾ ਬਦਲ ਲਏ। Tolan ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਜਵਾਬ ਦੇਣਾ, ਬਦਲਦੇ ਵਿਸ਼ਿਆਂ ਦਾ ਪਤਾ ਰੱਖਣਾ, ਅਤੇ ਦੇਰੀ ਜਾਂ ਟੋਨ ਡ੍ਰਿਫਟ ਤੋਂ ਬਿਨਾਂ ਇਕਸਾਰ ਪਰਸਨਾਲਿਟੀ ਕਾਇਮ ਰੱਖਣੀ ਪੈਂਦੀ ਸੀ।

ਕੁਦਰਤੀ ਮਹਿਸੂਸ ਹੋਣ ਲਈ, ਗੱਲਬਾਤਾਂ ਨੂੰ ਲਗਭਗ ਤੁਰੰਤ ਲੇਟੈਂਸੀ ਦੀ ਲੋੜ ਸੀ। OpenAI GPT‑5.1 ਅਤੇ Responses API ਦੇ ਆਉਣ ਨਾਲ ਬੋਲਣਾ ਸ਼ੁਰੂ ਕਰਨ ਦਾ ਸਮਾਂ 0.7 ਸਕਿੰਟ ਤੋਂ ਵੱਧ ਘੱਟ ਹੋ ਗਿਆ, ਜੋ ਗੱਲਬਾਤ ਦੇ ਪ੍ਰਵਾਹ ਵਿੱਚ ਸਪਸ਼ਟ ਸੁਧਾਰ ਲਈ ਕਾਫ਼ੀ ਸੀ।

ਇਸੇ ਤਰ੍ਹਾਂ ਮਹੱਤਵਪੂਰਨ ਸੀ ਕਿ ਸਿਸਟਮ ਸੰਦਰਭ ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਦਾ ਸੀ। ਕਈ ਏਜੰਟਾਂ ਤੋਂ ਵੱਖਰੇ, ਜੋ ਕਈ ਟਰਨਾਂ ਵਿੱਚ ਪ੍ਰੌੰਪਟ ਕੈਸ਼ ਕਰਦੇ ਹਨ, Tolan ਹਰ ਟਰਨ ‘ਤੇ ਆਪਣੀ ਸੰਦਰਭ ਵਿੰਡੋ ਸ਼ੁਰੂ ਤੋਂ ਦੁਬਾਰਾ ਬਣਾਉਂਦਾ ਹੈ। ਹਰ ਸੰਦਰਭ ਮੁੜ-ਨਿਰਮਾਣ ਵਿੱਚ ਹਾਲੀਆ ਸੁਨੇਹਿਆਂ ਦਾ ਸਾਰ, ਇੱਕ ਪਰਸੋਨਾ ਕਾਰਡ, ਵੈਕਟਰ-ਰੀਟਰੀਵ ਕੀਤੀਆਂ ਮੈਮਰੀਆਂ, ਟੋਨ ਮਾਰਗਦਰਸ਼ਨ ਅਤੇ ਰੀਅਲ-ਟਾਈਮ ਐਪ ਸਿਗਨਲ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ। ਇਹ ਆਰਕੀਟੈਕਚਰ Tolan ਨੂੰ ਵਿਸ਼ੇ ਵਿੱਚ ਅਚਾਨਕ ਬਦਲਾਅ ਅਨੁਸਾਰ ਰੀਅਲ ਟਾਈਮ ਵਿੱਚ ਅਨੁਕੂਲ ਹੋਣ ਦਿੰਦੀ ਹੈ, ਜੋ ਕੁਦਰਤੀ ਵੌਇਸ-ਆਧਾਰਿਤ ਇੰਟਰੈਕਸ਼ਨ ਲਈ ਲਾਜ਼ਮੀ ਹੈ।

Quinten ਕਹਿੰਦੇ ਹਨ, “ਸਾਨੂੰ ਜਲਦੀ ਸਮਝ ਆ ਗਿਆ ਕਿ ਕੈਸ਼ ਕੀਤੇ ਪ੍ਰੌੰਪਟ ਕਾਫ਼ੀ ਨਹੀਂ ਸਨ। ਯੂਜ਼ਰ ਹਮੇਸ਼ਾਂ ਵਿਸ਼ੇ ਬਦਲਦੇ ਰਹਿੰਦੇ ਹਨ। ਬਿਲਕੁਲ ਸਹਿਜ ਲੱਗਣ ਲਈ, ਸਿਸਟਮ ਨੂੰ ਵਿਚਕਾਰ ਹੀ ਅਨੁਕੂਲ ਹੋਣਾ ਪੈਂਦਾ ਸੀ।”

ਇਹ ਰੀਅਲ-ਟਾਈਮ ਮੁੜ-ਨਿਰਮਾਣ ਪਹੁੰਚ ਤਕਨੀਕੀ ਤੌਰ ‘ਤੇ ਗਹਿਰੀ ਹੈ ਅਤੇ Tolan ਦੀ ਸਫਲਤਾ ਦੀ ਬੁਨਿਆਦ ਵੀ ਹੈ।

ਫ਼ਲੋ ਡਾਇਗ੍ਰਾਮ ਜੋ Tolan ਦੇ ਗੱਲਬਾਤੀ ਚੱਕਰ ਨੂੰ ਦਿਖਾਉਂਦਾ ਹੈ। “ਰੀਕੰਪਿਊਟ ਪਰਸੋਨਾ” ਕਦਮ ਨੂੰ ਚਾਰ ਇਨਪੁੱਟ ਮਿਲਦੇ ਹਨ: ਚੈਟ ਸਾਰ ਅਤੇ ਹਾਲੀਆ ਕੱਚੇ ਸੁਨੇਹੇ, ਯੂਜ਼ਰ ਅਤੇ Tolan ਪਰਸੋਨਾ ਅਤੇ ਹੋਰ ਸੰਦਰਭ, ਮੈਮਰੀ, ਅਤੇ ਟੋਨ। ਇਹ ਇਨਪੁੱਟ ਮਿਲ ਕੇ Tolan ਦਾ ਜਵਾਬ ਬਣਾਉਂਦੇ ਹਨ, ਜਿਸ ਤੋਂ ਬਾਅਦ ਯੂਜ਼ਰ ਦਾ ਜਵਾਬ ਆਉਂਦਾ ਹੈ। ਫਿਰ ਯੂਜ਼ਰ ਦਾ ਜਵਾਬ ਦੋ ਸਮਾਂਤਰ ਪ੍ਰਕਿਰਿਆਵਾਂ ਚਲਾਉਂਦਾ ਹੈ: ਅੱਪਡੇਟ ਕੀਤੀ ਟੋਨ ਨਿਕਾਲਣਾ ਅਤੇ ਮੈਮਰੀਆਂ ਕੱਢਣਾ। ਕੱਢੀਆਂ ਗਈਆਂ ਮੈਮਰੀਆਂ ਮੈਮਰੀ ਨੂੰ ਅੱਪਡੇਟ ਕਰਦੀਆਂ ਹਨ, ਅੱਪਡੇਟ ਕੀਤੀ ਟੋਨ ਵਾਪਸ ਟੋਨ ਵਿੱਚ ਜਾਂਦੀ ਹੈ, ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਇਤਿਹਾਸ ਨੂੰ ਵਾਰ-ਵਾਰ ਮੁੜ ਸਾਰ ਕਰਕੇ ਸੰਕੁਚਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਅਗਲੀ ਵਾਰੀ ਲਈ ਚੈਟ ਸਾਰ ਵਿੱਚ ਵਾਪਸ ਲੂਪ ਬਣਾਉਂਦਾ ਹੈ।

ਐਸੀ ਮੈਮਰੀ ਅਤੇ ਪਰਸਨਾਲਿਟੀ ਬਣਾਉਣਾ ਜੋ ਸਮੇਂ ਨਾਲ ਇਕੱਠੀ ਟਿਕੀ ਰਹੇ

ਸੰਦਰਭ ਸੰਭਾਲਣਾ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਪਰ ਸਮੇਂ ਦੇ ਨਾਲ ਗੱਲਬਾਤ ਨੂੰ ਇਕਸਾਰ ਮਹਿਸੂਸ ਕਰਵਾਉਣ ਲਈ ਇਹ ਕਾਫ਼ੀ ਨਹੀਂ ਸੀ। ਲੰਬੀਆਂ, ਗੈਰ-ਰੇਖੀ ਗੱਲਬਾਤਾਂ ਦਾ ਸਹਾਰਾ ਦੇਣ ਲਈ, Tolan ਨੇ ਐਸੀ ਮੈਮਰੀ ਸਿਸਟਮ ਬਣਾਈ ਜੋ ਸਿਰਫ਼ ਤੱਥ ਅਤੇ ਪਸੰਦਾਂ ਨਹੀਂ, ਸਗੋਂ ਭਾਵਨਾਤਮਕ “ਵਾਈਬ” ਸਿਗਨਲ ਵੀ ਸੰਭਾਲਦੀ ਹੈ—ਅਜੇਹੇ ਇਸ਼ਾਰੇ ਜੋ ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਕਿ Tolan ਨੂੰ ਕਿਵੇਂ ਜਵਾਬ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ।

ਮੈਮਰੀਆਂ ਨੂੰ OpenAI text-embedding-3-large ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਨਾਲ embed ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ Turbopuffer ਵਿੱਚ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਇੱਕ ਉੱਚ-ਗਤੀ ਵੈਕਟਰ ਡਾਟਾਬੇਸ ਹੈ ਅਤੇ 50ms ਤੋਂ ਘੱਟ ਲੁੱਕਅੱਪ ਸਮਾਂ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਇਹ ਗਤੀ ਰੀਅਲ-ਟਾਈਮ ਵੌਇਸ ਇੰਟਰੈਕਸ਼ਨਾਂ ਲਈ ਲਾਜ਼ਮੀ ਹੈ। ਹਰ ਟਰਨ ‘ਤੇ, Tolan ਯੂਜ਼ਰ ਦੇ ਸਭ ਤੋਂ ਤਾਜ਼ਾ ਸੁਨੇਹੇ ਅਤੇ ਸਿਸਟਮ-ਤਿਆਰ ਕੀਤੇ ਸਵਾਲਾਂ (ਜਿਵੇਂ, “ਯੂਜ਼ਰ ਦਾ ਵਿਆਹ ਕਿਸ ਨਾਲ ਹੋਇਆ ਹੈ?”) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮੈਮਰੀ ਰੀਕਾਲ ਟ੍ਰਿਗਰ ਕਰਦਾ ਹੈ। ਮੈਮਰੀ ਦੀ ਗੁਣਵੱਤਾ ਉੱਚੀ ਰੱਖਣ ਲਈ, Tolan ਰਾਤ ਦੀ ਕੰਪ੍ਰੈਸ਼ਨ ਜੌਬ ਚਲਾਉਂਦਾ ਹੈ ਜੋ ਘੱਟ ਮੁੱਲ ਵਾਲੀਆਂ ਜਾਂ ਦੁਹਰਾਈਆਂ ਐਂਟਰੀਆਂ (ਜਿਵੇਂ “ਯੂਜ਼ਰ ਨੇ ਅੱਜ ਕਾਫੀ ਪੀਤੀ”) ਹਟਾਉਂਦੀ ਹੈ ਅਤੇ ਵਿਰੋਧਾਂ ਨੂੰ ਸੁਲਝਾਉਂਦੀ ਹੈ।

ਪਰਸਨਾਲਿਟੀ ਨੂੰ ਵੀ ਇੰਨੀ ਹੀ ਸਾਵਧਾਨੀ ਨਾਲ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ। ਹਰ Tolan ਨੂੰ ਵੱਖਰਾ ਕਿਰਦਾਰ ਢਾਂਚਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਟੀਮ ਦੇ ਇਨ-ਹਾਊਸ ਵਿਗਿਆਨ-ਕਲਪਨਾ ਲੇਖਕ ਨੇ ਲਿਖਿਆ ਅਤੇ ਇੱਕ ਵਿਹਾਰਕ ਖੋਜਕਾਰ ਨੇ ਸੰਵਾਰਿਆ। ਇਹ ਬੀਜ Tolans ਨੂੰ ਇਕਸਾਰਤਾ ਦਿੰਦੇ ਹਨ, ਪਰ ਨਾਲ ਹੀ ਸਮੇਂ ਦੇ ਨਾਲ ਅਨੁਕੂਲ ਹੋਣ ਦੀ ਲਚਕ ਵੀ ਦਿੰਦੇ ਹਨ, ਤਾਂ ਜੋ ਉਹ ਯੂਜ਼ਰ ਦੇ ਨਾਲ-ਨਾਲ ਵਿਕਸਿਤ ਹੋ ਸਕਣ।

ਇੱਕ ਸਮਾਂਤਰ ਸਿਸਟਮ ਗੱਲਬਾਤ ਦੇ ਭਾਵਨਾਤਮਕ ਰੰਗ ‘ਤੇ ਨਜ਼ਰ ਰੱਖਦਾ ਹੈ ਅਤੇ Tolan ਦੀ ਪੇਸ਼ਕਾਰੀ ਨੂੰ ਗਤੀਸ਼ੀਲ ਤੌਰ ‘ਤੇ ਠੀਕ ਕਰਦਾ ਹੈ। ਇਸ ਨਾਲ Tolan ਯੂਜ਼ਰ ਦੇ ਸੰਕੇਤਾਂ ਦੇ ਅਧਾਰ ‘ਤੇ ਖੇਡਾਂ-ਮਜ਼ਾਕੀਆ ਤੋਂ ਗੰਭੀਰ ਮੋਡ ਵਿੱਚ ਬਿਨਾਂ ਆਪਣੀ ਮੁੱਖ ਪਰਸਨਾਲਿਟੀ ਗੁਆਏ ਸੁਗਮ ਤਰੀਕੇ ਨਾਲ ਬਦਲ ਸਕਦਾ ਹੈ।

GPT‑5.1 ਵੱਲ ਬਦਲਾਅ ਇੱਕ ਟਰਨਿੰਗ ਪੌਇੰਟ ਸੀ। ਅਚਾਨਕ, ਪਰਤਦਾਰ ਪ੍ਰੌੰਪਟ ਨਿਰਦੇਸ਼—ਟੋਨ ਸਕੈਫੋਲਡ, ਮੈਮਰੀ ਇੰਜੈਕਸ਼ਨ, ਕਿਰਦਾਰ ਗੁਣ—ਹੋਰ ਵਿਸ਼ਵਾਸਯੋਗ ਤਰੀਕੇ ਨਾਲ ਮੰਨੇ ਜਾਣ ਲੱਗੇ। ਜਿਨ੍ਹਾਂ ਪ੍ਰੌੰਪਟਾਂ ਲਈ ਪਹਿਲਾਂ ਵਰਕਅਰਾਊਂਡ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ, ਉਹ ਮਨਚਾਹੇ ਢੰਗ ਨਾਲ ਵਰਤਣ ਲੱਗੇ।

Quinten ਕਹਿੰਦੇ ਹਨ, “ਪਹਿਲੀ ਵਾਰ, ਸਾਡੇ ਅੰਦਰੂਨੀ ਮਾਹਿਰਾਂ ਨੂੰ ਲੱਗਿਆ ਕਿ ਮਾਡਲ ਸੱਚਮੁੱਚ ਸੁਣ ਰਿਹਾ ਸੀ। ਲੰਬੀਆਂ ਗੱਲਬਾਤਾਂ ਦੌਰਾਨ ਨਿਰਦੇਸ਼ ਸਹੀ ਰਹੇ, ਪਰਸੋਨਾ ਗੁਣਾਂ ਦਾ ਆਦਰ ਕੀਤਾ ਗਿਆ, ਅਤੇ ਅਸੀਂ ਕਾਫ਼ੀ ਘੱਟ ਡ੍ਰਿਫਟ ਵੇਖੀ।”

ਇਹ ਬਦਲਾਅ ਮਿਲ ਕੇ ਹੋਰ ਇਕਸਾਰ ਅਤੇ ਵਿਸ਼ਵਾਸਯੋਗ ਪਰਸਨਾਲਿਟੀ ਵੱਲ ਲੈ ਗਏ, ਜਿਸ ਨਾਲ ਹੋਰ ਦਿਲਚਸਪ ਯੂਜ਼ਰ ਅਨੁਭਵ ਬਣਿਆ। Tolan ਟੀਮ ਨੇ ਸਪਸ਼ਟ ਅਤੇ ਮਾਪਯੋਗ ਸੁਧਾਰ ਵੇਖੇ: ਮੈਮਰੀ ਰੀਕਾਲ ਦੀਆਂ ਗਲਤੀਆਂ 30% ਘੱਟ ਹੋਈਆਂ (ਪ੍ਰੋਡਕਟ ਅੰਦਰ ਫਰਸਟ੍ਰੇਸ਼ਨ ਸਿਗਨਲਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ), ਅਤੇ GPT‑5.1‑ਚਲਿਤ ਪਰਸੋਨਾਜ਼ ਲਾਈਵ ਹੋਣ ਤੋਂ ਬਾਅਦ ਅਗਲੇ ਦਿਨ ਯੂਜ਼ਰ ਰਿਟੇਂਸ਼ਨ 20% ਤੋਂ ਵੱਧ ਵਧੀ।

ਫ਼ਲੋ ਡਾਇਗ੍ਰਾਮ ਜੋ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ Tolan ਗੱਲਬਾਤ ਦੌਰਾਨ ਮੈਮਰੀਆਂ ਕਿਵੇਂ ਲੱਭਦਾ ਅਤੇ ਨਿਖਾਰਦਾ ਹੈ। ਯੂਜ਼ਰ ਦਾ ਸੁਨੇਹਾ (“ਮੈਂ ਇਸ ਵੀਕਐਂਡ ਆਪਣੀ ਯਾਤਰਾ ਲਈ ਬਹੁਤ ਉਤਸ਼ਾਹਿਤ ਹਾਂ”) ਇੱਕ ਅਜਿਹਾ ਕਦਮ ਚਾਲੂ ਕਰਦਾ ਹੈ ਜੋ ਅਗਲੇ ਸਵਾਲ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਵੇਂ ਆਉਣ ਵਾਲੀਆਂ ਯਾਤਰਾਵਾਂ, ਕਿਸੇ ਖ਼ਾਸ ਹਫ਼ਤੇ ਦੀਆਂ ਯੋਜਨਾਵਾਂ, ਅਤੇ ਯੂਜ਼ਰ ਦੀਆਂ ਪਸੰਦਾਂ। ਇਹ ਸਵਾਲ embed ਕੀਤੇ ਜਾਂਦੇ ਹਨ ਅਤੇ ਮੈਮਰੀ ਵੈਕਟਰ ਡਾਟਾਬੇਸ ਨੂੰ ਕਵੈਰੀ ਕਰਨ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ, ਜਿੱਥੇ ਨਤੀਜੇ mean reciprocal rank ਨਾਲ ਜੋੜੇ ਜਾਂਦੇ ਹਨ। ਮਿਲਿਆ ਸੰਦਰਭ Tolan ਦੇ ਜਵਾਬ (“Yosemite ਵਿੱਚ Steven ਨਾਲ ਕੈਂਪਿੰਗ”) ਨੂੰ ਜਾਣਕਾਰੀ ਦਿੰਦਾ ਹੈ। ਬਾਅਦ ਵਿੱਚ Iceland ਦੀ ਭਵਿੱਖੀ ਯਾਤਰਾ ਬਾਰੇ ਯੂਜ਼ਰ ਦਾ ਸੁਨੇਹਾ ਨਵੀਂ ਮੈਮਰੀ ਵਜੋਂ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ, ਫਿਰ ਉਸ ‘ਤੇ ਵਿਚਾਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, embedding-ਆਧਾਰਿਤ k-nearest neighbors ਨਾਲ ਸਬੰਧਤ ਮੈਮਰੀਆਂ ਨਾਲ ਗਰੁੱਪ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਹਰ ਗਰੁੱਪ ਵਿੱਚ ਮੈਮਰੀਆਂ ਨੂੰ ਜੋੜ ਕੇ, ਸੋਧ ਕੇ ਅਤੇ ਨਿਖਾਰ ਕੇ ਸੰਕੁਚਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਕੁਦਰਤੀ ਵੌਇਸ ਏਜੰਟ ਬਣਾਉਣ ਲਈ Tolan ਦੇ ਮੁੱਖ ਸਿਧਾਂਤ

ਜਿਵੇਂ-ਜਿਵੇਂ Tolan ਵਿਕਸਿਤ ਹੋਇਆ, ਕੁਝ ਸਿਧਾਂਤ ਸਾਹਮਣੇ ਆਏ ਜੋ ਹੁਣ ਟੀਮ ਦੀ ਵੌਇਸ ਆਰਕੀਟੈਕਚਰ ਬਣਾਉਣ ਅਤੇ ਵਿਕਸਿਤ ਕਰਨ ਦੀ ਦਿਸ਼ਾ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਨ:

ਗੱਲਬਾਤੀ ਅਸਥਿਰਤਾ ਲਈ ਡਿਜ਼ਾਇਨ ਕਰੋ: ਵੌਇਸ ਗੱਲਬਾਤਾਂ ਵਾਕ ਦੇ ਵਿਚਕਾਰ ਹੀ ਦਿਸ਼ਾ ਬਦਲ ਲੈਂਦੀਆਂ ਹਨ। ਕੁਦਰਤੀ ਲੱਗਣ ਲਈ ਸਿਸਟਮਾਂ ਨੂੰ ਵੀ ਉੱਨੇ ਹੀ ਤੇਜ਼ੀ ਨਾਲ ਰੁਖ ਬਦਲਣਾ ਪੈਂਦਾ ਹੈ।
ਲੇਟੈਂਸੀ ਨੂੰ ਪ੍ਰੋਡਕਟ ਅਨੁਭਵ ਦਾ ਹਿੱਸਾ ਮੰਨੋ: ਇੱਕ ਸਕਿੰਟ ਤੋਂ ਘੱਟ ਜਵਾਬਦੇਹੀ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ ਕਿ ਕੋਈ ਵੌਇਸ ਏਜੰਟ ਗੱਲਬਾਤੀ ਲੱਗਦਾ ਹੈ ਜਾਂ ਮਕੈਨੀਕੀ।
ਮੈਮਰੀ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟ ਨਹੀਂ, ਰੀਟਰੀਵਲ ਸਿਸਟਮ ਵਜੋਂ ਬਣਾਓ: ਉੱਚ-ਗੁਣਵੱਤਾ ਕੰਪ੍ਰੈਸ਼ਨ ਅਤੇ ਤੇਜ਼ ਵੈਕਟਰ ਖੋਜ ਵੱਡੀਆਂ ਸੰਦਰਭ ਵਿੰਡੋਆਂ ਨਾਲੋਂ ਹੋਰ ਇਕਸਾਰ ਪਰਸਨਾਲਿਟੀ ਦਿੰਦੇ ਹਨ।
ਹਰ ਟਰਨ ‘ਤੇ ਸੰਦਰਭ ਮੁੜ ਬਣਾਓ: ਵੱਡੇ ਪ੍ਰੌੰਪਟਾਂ ਨਾਲ ਡ੍ਰਿਫਟ ਨਾਲ ਲੜੋ ਨਾ। ਹਰ ਟਰਨ ‘ਤੇ ਸੰਦਰਭ ਦੁਬਾਰਾ ਬਣਾਉਣਾ ਏਜੰਟਾਂ ਨੂੰ ਗੱਲਬਾਤ ਦੇ ਭਟਕਣ ਦੌਰਾਨ ਜ਼ਮੀਨ ਨਾਲ ਜੋੜਿਆ ਰੱਖਦਾ ਹੈ।

ਇਕੱਠੇ ਮਿਲ ਕੇ, ਇਹ ਸਬਕ Tolan ਦੀ ਨਵੀਨਤਾ ਦੇ ਅਗਲੇ ਪੜਾਅ ਦੀ ਬੁਨਿਆਦ ਬਣਾਉਂਦੇ ਹਨ ਅਤੇ ਵੌਇਸ AI ਕਿੱਥੇ ਵੱਲ ਵੱਧ ਰਿਹਾ ਹੈ, ਉਸ ਦੀ ਦਿਸ਼ਾ ਤੈਅ ਕਰਦੇ ਹਨ।

ਵੌਇਸ AI ਨਾਲ ਸੰਭਾਵਨਾਵਾਂ ਦਾ ਵਿਸਥਾਰ

ਫ਼ਰਵਰੀ 2025 ਵਿੱਚ ਲਾਂਚ ਤੋਂ ਬਾਅਦ, Tolan ਦੇ ਮਹੀਨਾਵਾਰ ਸਰਗਰਮ ਯੂਜ਼ਰ 200,000 ਤੋਂ ਵੱਧ ਹੋ ਗਏ ਹਨ। ਇਸਦੀ 4.8-ਸਟਾਰ ਰੇਟਿੰਗ ਅਤੇ App Store ‘ਤੇ 100,000 ਤੋਂ ਵੱਧ ਸਮੀਖਿਆਵਾਂ ਦਰਸਾਉਂਦੀਆਂ ਹਨ ਕਿ ਇਹ ਸਿਸਟਮ ਲੰਬੀਆਂ ਅਤੇ ਬਦਲਦੀਆਂ ਗੱਲਬਾਤਾਂ ਵਿੱਚ ਕਿੰਨੀ ਚੰਗੀ ਤਰ੍ਹਾਂ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਦਾ ਹੈ। ਇੱਕ ਸਮੀਖਿਆਕਾਰ ਨੇ ਲਿਖਿਆ, “ਉਹ ਉਹ ਗੱਲਾਂ ਯਾਦ ਰੱਖਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਬਾਰੇ ਅਸੀਂ ਦੋ ਦਿਨ ਪਹਿਲਾਂ ਗੱਲ ਕੀਤੀ ਸੀ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਅੱਜ ਦੀ ਗੱਲਬਾਤ ਵਿੱਚ ਮੁੜ ਲਿਆਉਂਦੇ ਹਨ।”

ਇਹ ਸੰਕੇਤ ਸਿੱਧੇ ਅੰਦਰੂਨੀ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਜੁੜਦੇ ਹਨ: ਘੱਟ-ਲੇਟੈਂਸੀ ਮਾਡਲ ਕਾਲਾਂ, ਹਰ ਟਰਨ ‘ਤੇ ਸੰਦਰਭ ਮੁੜ-ਨਿਰਮਾਣ, ਅਤੇ ਮਾਡਿਊਲਰ ਮੈਮਰੀ ਅਤੇ ਪਰਸੋਨਾ ਸਿਸਟਮ। ਇਹ ਸਭ ਮਿਲ ਕੇ Tolan ਨੂੰ ਵਿਸ਼ੇ ਦੇ ਬਦਲਾਅ ਟ੍ਰੈਕ ਕਰਨ, ਟੋਨ ਸੰਭਾਲਣ ਅਤੇ ਵੱਡੇ ਪਰ ਨਾਜ਼ੁਕ ਪ੍ਰੌੰਪਟਾਂ ‘ਤੇ ਨਿਰਭਰ ਕੀਤੇ ਬਿਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ਅਧਾਰ ‘ਤੇ ਰੱਖਣ ਦਿੰਦੇ ਹਨ।

ਅੱਗੇ ਵੇਖਦਿਆਂ, Tolan steerability ਅਤੇ ਮੈਮਰੀ ਰੀਫ਼ਾਈਨਮੈਂਟ ਵਿੱਚ ਆਪਣਾ ਨਿਵੇਸ਼ ਹੋਰ ਗਹਿਰਾ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਹੋਰ ਕਸੇ ਹੋਏ ਕੰਪ੍ਰੈਸ਼ਨ, ਬਿਹਤਰ ਰੀਟਰੀਵਲ ਲੌਜਿਕ ਅਤੇ ਵਧੇਰੇ ਪਰਸੋਨਾ ਟਿਊਨਿੰਗ ‘ਤੇ ਧਿਆਨ ਦਿੱਤਾ ਜਾਵੇਗਾ। ਲੰਬੇ ਸਮੇਂ ਦਾ ਲਕਸ਼ ਇਹ ਵਧਾਉਣਾ ਹੈ ਕਿ ਵੌਇਸ ਇੰਟਰਫੇਸ ਕੀ ਹੋ ਸਕਦਾ ਹੈ: ਸਿਰਫ਼ ਜਵਾਬਦੇਹ ਨਹੀਂ, ਸਗੋਂ ਸੰਦਰਭ-ਸਚੇਤ ਅਤੇ ਗੱਲਬਾਤੀ ਤੌਰ ‘ਤੇ ਗਤੀਸ਼ੀਲ।

Quinten ਕਹਿੰਦੇ ਹਨ, “ਅਗਲਾ ਅਤਿ-ਆਧੁਨਿਕ ਖੇਤਰ ਉਹ ਵੌਇਸ ਏਜੰਟ ਬਣਾਉਣਾ ਹੈ ਜੋ ਸਿਰਫ਼ ਜਵਾਬਦੇਹ ਨਾ ਹੋਣ, ਸਗੋਂ ਅਸਲ ਵਿੱਚ ਮਲਟੀਮੋਡਲ ਹੋਣ, ਅਤੇ ਵੌਇਸ, ਵਿਜ਼ਨ ਅਤੇ ਸੰਦਰਭ ਨੂੰ ਇੱਕ ਇਕੱਲੇ, steerable ਸਿਸਟਮ ਵਿੱਚ ਜੋੜ ਸਕਣ।”

ਪੜ੍ਹਦੇ ਰਹੋ

ਸਭ ਵੇਖੋ

GPT-5.5 ਨਾਲ ਓਪਨ ਸੋਰਸ ਬਣਾਉਣ 'ਤੇ Warp ਦਾ ਵੱਡਾ ਦਾਅ

ਸਟਾਰਟਅੱਪ27 ਮਈ 2026

Parloa builds service agents customers want to talk to

ਸਟਾਰਟਅੱਪ7 ਮਈ 2026

Gradient Labs ਹਰ ਬੈਂਕ ਗਾਹਕ ਨੂੰ AI ਅਕਾਊਂਟ ਮੈਨੇਜਰ ਦਿੰਦਾ ਹੈ

ਸਟਾਰਟਅੱਪ1 ਅਪ੍ਰੈ 2026