GPT‑5.1 ನೊಂದಿಗೆ Tolan ಧ್ವನಿ-ಮೊದಲು AI ಅನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುತ್ತದೆ
GPT‑5.1 ನೊಂದಿಗೆ, Tolan ಕಡಿಮೆ ವಿಳಂಬ, ನಿಖರ ಸಂದರ್ಭ, ಮತ್ತು ಸಂಭಾಷಣೆಗಳು ಬೆಳೆಯುತ್ತಿದ್ದಂತೆ ಸ್ಥಿರ ವ್ಯಕ್ತಿತ್ವಗಳಿಗಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿದ ಧ್ವನಿ ಆ್ಯಪ್ ಅನ್ನು ನಿರ್ಮಿಸಿದೆ.

Tolan(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಎಂಬುದು ಧ್ವನಿ-ಆಧಾರಿತ AI ಸಂಗಾತಿ, ಇಲ್ಲಿ ಜನರು ವೈಯಕ್ತಿಕಗೊಳಿಸಿದ, ಅನಿಮೇಟೆಡ್ ಪಾತ್ರದೊಂದಿಗೆ ಮಾತನಾಡುತ್ತಾರೆ, ಅದು ಸಂಭಾಷಣೆಗಳಿಂದ ಕಾಲಕ್ರಮೇಣ ಕಲಿಯುತ್ತದೆ.
ಹಿಂದಿನ ನಿರ್ಗಮನ ಹೊಂದಿರುವ ಅನುಭವಿ ತಂಡ Portola ನಿರ್ಮಿಸಿರುವ ಈ ಆ್ಯಪ್, ತ್ವರಿತ ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳ ಬದಲು ಚಾಲ್ತಿಯಲ್ಲಿರುವ, ಓಪನ್-ಎಂಡೆಡ್ ಸಂವಾದಕ್ಕಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. “ನಾವು ChatGPT ಬೆಳವಣಿಗೆಯನ್ನು ಕಂಡೆವು ಮತ್ತು ಧ್ವನಿಯೇ ಮುಂದಿನ ಹೆಜ್ಜೆ ಎಂದು ತಿಳಿದಿದ್ದೇವೆ,” ಎಂದು Portola ಸಹ-ಸ್ಥಾಪಕ ಮತ್ತು CEO ಕ್ವಿಂಟೆನ್ ಫಾರ್ಮರ್ ಹೇಳಿದ್ದಾರೆ. “ಆದರೆ ಧ್ವನಿ ಹೆಚ್ಚು ಕಷ್ಟವಾಗಿದೆ. ನೀವು ಕೇವಲ ಟೈಪ್ ಮಾಡಿದ ಪ್ರಾಂಪ್ಟ್ಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತಿಲ್ಲ; ನೀವು ನೇರ, ತರಂಗಗಳ ಸಂಭಾಷಣೆಯನ್ನು ನಡೆಸುತ್ತಿದ್ದೀರಿ.”
Voice AI ವಿಳಂಬ ಮತ್ತು ಸಂದರ್ಭ ನಿರ್ವಹಣೆಯಲ್ಲಿ ಮಾನದಂಡವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ, ಆದರೆ ಇದು ಪಠ್ಯಕ್ಕಿಂತ ಹೆಚ್ಚು ಓಪನ್-ಎಂಡೆಡ್, ಅನ್ವೇಷಣಾತ್ಮಕ ಸಂವಹನಗಳನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ.
ಅಡಿಪಾಯದ ಮಾಡೆಲ್ಗಳು ಹೆಚ್ಚು ವೇಗವಾಗಿ, ಕಡಿಮೆ ವೆಚ್ಚ ಮತ್ತು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವಂತವಾಗುತ್ತಾ ಬಂದಂತೆ, ತಂಡವು ತಮ್ಮ ಪ್ರಯತ್ನಗಳನ್ನು ಎರಡು ಪ್ರಮುಖ ಅಂಶಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿತು: ಮೆಮೊರಿ ಮತ್ತು ಪಾತ್ರ ವಿನ್ಯಾಸ. Portola ಪ್ರಶಸ್ತಿ ವಿಜೇತ ಆ್ಯನಿಮೇಟರ್ಗಳು ಮತ್ತು ವಿಜ್ಞಾನ ಕಾದಂಬರಿ ಬರಹಗಾರರ ಸಹಾಯದಿಂದ ಪಾತ್ರ-ಚಾಲಿತ ವಿಶ್ವವನ್ನು ನಿರ್ಮಿಸಿದೆ, ಸಂಭಾಷಣೆಗಳು ಮುಂದುವರಿಯುವಂತೆ ವ್ಯಕ್ತಿತ್ವ ಮತ್ತು ನೆನಪು ಸ್ಥಿರವಾಗಿರಲು ರಿಯಲ್-ಟೈಮ್ ಸಂದರ್ಭ ನಿರ್ವಹಣಾ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುತ್ತಿದೆ.
GPT‑5.1 ಮಾಡೆಲ್ಗಳ ಬಿಡುಗಡೆ ಒಂದು ತಿರುವುಬಿಂದು ಆಗಿತ್ತು, ಇದು ಸ್ಟೀರಬಿಲಿಟಿ ಮತ್ತು ಲೇಟೆನ್ಸಿಯಲ್ಲಿ ಪ್ರಮುಖ ಲಾಭಗಳನ್ನು ತಂದುಕೊಟ್ಟಿತು, ಆ ಭಾಗಗಳನ್ನು ಒಟ್ಟಿಗೆ ಸೇರಿಸಿ, ಹೆಚ್ಚು ಸ್ಪಂದಿಸುವ ಮತ್ತು ಆಕರ್ಷಕ ಧ್ವನಿ ಅನುಭವವನ್ನು ಮುಕ್ತಗೊಳಿಸಿತು.
“GPT-5.1 ನಮಗೆ ನಾವು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟುಕೊಂಡಿದ್ದ ಪಾತ್ರಗಳನ್ನು ಕೊನೆಗೂ ವ್ಯಕ್ತಪಡಿಸಲು ಬೇಕಾದ ನಿಯಂತ್ರಣವನ್ನು ನೀಡಿತು. ಇದು ಕೇವಲ ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವಾಗಿರಲಿಲ್ಲ—ನಾವು ಸೃಷ್ಟಿಸಲು ಬಯಸಿದ ಶೈಲಿ ಮತ್ತು ವ್ಯಕ್ತಿತ್ವಕ್ಕೆ ಇನ್ನಷ್ಟು ನಿಷ್ಠವಾಗಿತ್ತು.”
Tolan ನ ವಾಸ್ತುಶಿಲ್ಪವು ಧ್ವನಿಯ ಬೇಡಿಕೆಗಳಿಂದ ರೂಪಿತವಾಗಿದೆ. ಧ್ವನಿ ಬಳಕೆದಾರರು ಸಂಭಾಷಣೆ ಮಧ್ಯದಲ್ಲಿ ದಿಕ್ಕು ಬದಲಾದರೂ ಕೂಡ ತಕ್ಷಣದ, ನೈಸರ್ಗಿಕ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತಾರೆ. Tolan ತ್ವರಿತವಾಗಿ ಪ್ರತಿಕ್ರಿಯಿಸಬೇಕಾಗಿತ್ತು, ಬದಲಾಗುತ್ತಿರುವ ವಿಷಯಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಬೇಕಾಗಿತ್ತು, ಮತ್ತು ವಿಳಂಬವಿಲ್ಲದೆ ಅಥವಾ ಸ್ವರದ ವಿಚಲನವಾಗದೆ ಸತತ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳಬೇಕಾಗಿತ್ತು.
ನೈಸರ್ಗಿಕವಾಗಿ ಅನುಭವಿಸಲು, ಸಂಭಾಷಣೆಗಳಿಗೆ ತಕ್ಷಣದ ಲೇಟೆನ್ಸಿ ಅಗತ್ಯವಿತ್ತು. OpenAI GPT‑5.1 ಅನ್ನು ಪರಿಚಯಿಸುತ್ತಿದ್ದೇವೆ ಮತ್ತು Responses API ಮಾತು ಆರಂಭಿಸುವ ಸಮಯವನ್ನು 0.7 ಸೆಕೆಂಡುಗಳಿಗಿಂತ ಹೆಚ್ಚು ಕಡಿತಗೊಳಿಸುತ್ತದೆ—ಇದು ಸಂಭಾಷಣೆಯ ಹರಿವನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಸುಧಾರಿಸಲು ಬಹಳಷ್ಟಾಗಿದೆ.
ವ್ಯವಸ್ಥೆಯು ಸಂದರ್ಭವನ್ನು ಹೇಗೆ ನಿರ್ವಹಿಸಿತು ಎಂಬುದು ಅಷ್ಟೇ ನಿರ್ಣಾಯಕವಾಗಿತ್ತು. ಅನೇಕ ಏಜೆಂಟ್ಗಳು ಹಲವು ಬಾರಿ ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಸಂಗ್ರಹಿಸುವುದಕ್ಕೆ ಭಿನ್ನವಾಗಿ, Tolan ಪ್ರತಿ ಬಾರಿ ತನ್ನ ಸಂದರ್ಭ ವಿಂಡೋವನ್ನು ಹೊಸದಾಗಿ ನಿರ್ಮಿಸುತ್ತದೆ. ಪ್ರತಿ ಸಂದರ್ಭ ಪುನರ್ನಿರ್ಮಾಣವು ಇತ್ತೀಚಿನ ಸಂದೇಶಗಳ ಸಾರಾಂಶ, ಪರ್ಸೋನಾ ಕಾರ್ಡ್, ವೆಕ್ಟರ್-ರಿಟ್ರೀವ್ಡ್ ಮೆಮೊರಿಗಳು, ಶೈಲಿ ಮಾರ್ಗದರ್ಶನ, ಮತ್ತು ರಿಯಲ್-ಟೈಮ್ ಆಪ್ ಸಿಗ್ನಲ್ಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಈ ಆರ್ಕಿಟೆಕ್ಚರ್ Tolan ಗೆ ತಕ್ಷಣದ ವಿಷಯ ಬದಲಾವಣೆಗಳಿಗೆ ನೈಜ-ಸಮಯದಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳಲು ಅವಕಾಶ ಮಾಡುತ್ತದೆ, ಇದು ನೈಸರ್ಗಿಕ ಧ್ವನಿ-ಆಧಾರಿತ ಸಂವಹನಕ್ಕೆ ಅಗತ್ಯವಾದ ಅವಶ್ಯಕತೆ.
“ಕ್ಯಾಶ್ ಮಾಡಿದ ಪ್ರಾಂಪ್ಟ್ಗಳು ಸರಿಯಾಗಿಲ್ಲ ಎಂಬುದು ನಮಗೆ ಬೇಗನೆ ತಿಳಿಯಿತು,” ಎಂದು ಕ್ವಿಂಟೆನ್ ಹೇಳುತ್ತಾರೆ. “ಬಳಕೆದಾರರು ಯಾವಾಗಲೂ ವಿಷಯಗಳನ್ನು ಬದಲಿಸುತ್ತಾರೆ. ನಿರಂತರ ಅನುಭವಕ್ಕಾಗಿ, ವ್ಯವಸ್ಥೆ ಮಧ್ಯದಲ್ಲಿ ಹೊಂದಿಕೆ ಮಾಡಿಕೊಳ್ಳಬೇಕಾಯಿತು."
ಈ ರಿಯಲ್-ಟೈಮ್ ಪುನರ್ನಿರ್ಮಾಣ ವಿಧಾನವು ತಾಂತ್ರಿಕವಾಗಿ ಗಹನವಾಗಿದ್ದು, Tolan ನ ಯಶಸ್ಸಿಗೆ ಮೂಲಭೂತವಾಗಿದೆ.

ಸನ್ನಿವೇಶ ನಿರ್ವಹಣೆ ಮುಖ್ಯವಾಗಿದೆ, ಆದರೆ ಅದು ಕಾಲಕ್ರಮೇಣ ಸಂಭಾಷಣೆಗಳನ್ನು ಸಮ್ಮತವಾಗಿ ಇರಿಸಲು ಸಾಕಾಗಲಿಲ್ಲ. ದೀರ್ಘ, ರೇಖೀಯವಲ್ಲದ ಸಂಭಾಷಣೆಗಳನ್ನು ಬೆಂಬಲಿಸಲು, Tolan ಕೇವಲ ವಾಸ್ತವಗಳು ಮತ್ತು ಆಯ್ಕೆಗಳನ್ನು ಮಾತ್ರವಲ್ಲ, ಭಾವನಾತ್ಮಕ “ವೈಬ್” ಸಂಕೇತಗಳನ್ನೂ—Tolan ಹೇಗೆ ಪ್ರತಿಕ್ರಿಯಿಸಬೇಕು ಎಂಬುದನ್ನು ಮಾರ್ಗದರ್ಶಿಸಲು ಸಹಾಯ ಮಾಡುವ ಸುಳಿವುಗಳನ್ನೂ—ಉಳಿಸಿಕೊಳ್ಳುವ ಮೆಮೊರಿ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸಿದೆ.
ಮೆಮೊರಿಗಳನ್ನು OpenAI text-embedding-3-large ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಅಳವಡಿಸಲಾಗುತ್ತದೆ ಮತ್ತು Turbopuffer ಎಂಬ ಹೈ-ಸ್ಪೀಡ್ ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್ನಲ್ಲಿ sub-50ms ಲುಕ್ಅಪ್ ಸಮಯಗಳನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಈ ವೇಗವು ನೈಜ-ಸಮಯ ಧ್ವನಿ ಸಂವಹನಗಳಿಗೆ ಅತ್ಯಗತ್ಯವಾಗಿದೆ. ಪ್ರತಿ ತಿರುವಿನಲ್ಲಿ, Tolan ಬಳಕೆದಾರರ ಇತ್ತೀಚಿನ ಸಂದೇಶ ಮತ್ತು ಸಿಸ್ಟಮ್-ಸಂಶ್ಲೇಷಿತ ಪ್ರಶ್ನೆಗಳು (ಉದಾ., “ಬಳಕೆದಾರರು ಯಾರನ್ನು ಮದುವೆಯಾಗಿದ್ದಾರೆ?”) ಅನ್ನು ಬಳಸಿ ನೆನಪು ಮರುಸ್ಮರಿಸಲು ಪ್ರೇರೇಪಿಸುತ್ತದೆ. ಮೆಮೊರಿ ಗುಣಮಟ್ಟವನ್ನು ಉನ್ನತವಾಗಿರಿಸಲು, Tolan ಕಡಿಮೆ ಮೌಲ್ಯದ ಅಥವಾ ಪುನರಾವರ್ತಿತ ಎಂಟ್ರಿಗಳನ್ನು ತೆಗೆದುಹಾಕುವ ರಾತ್ರಿ ಕಂಪ್ರೆಷನ್ ಕೆಲಸವನ್ನು ನಡೆಸುತ್ತದೆ (ಉದಾಹರಣೆಗೆ, “ಬಳಕೆದಾರನು ಇಂದು ಕಾಫಿ ಕುಡಿದನು”) ಮತ್ತು ವಿರೋಧಾಭಾಸಗಳನ್ನು ಪರಿಹರಿಸುತ್ತದೆ.
ವ್ಯಕ್ತಿತ್ವವನ್ನು ಸಹ ಅಷ್ಟೇ ಎಚ್ಚರಿಕೆಯಿಂದ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ. ಪ್ರತಿ Tolan ಅನ್ನು ತಂಡದ ಇನ್-ಹೌಸ್ ಸೈನ್ಸ್ ಫಿಕ್ಷನ್ ಬರಹಗಾರರಿಂದ ರಚಿಸಲಾದ ಮತ್ತು ನಡವಳಿಕಾ ಸಂಶೋಧಕರಿಂದ ಪರಿಷ್ಕರಿಸಲಾದ ವಿಶಿಷ್ಟ ಪಾತ್ರ ಸ್ಕಾಫೋಲ್ಡ್ನೊಂದಿಗೆ ಬಿತ್ತರಿಸಲಾಗುತ್ತದೆ. ಈ ಸೀಡ್ಗಳು Tolans ಗೆ ಸ್ಥಿರತೆಯನ್ನು ನೀಡುತ್ತವೆ, ಆದರೆ ಕಾಲಾನಂತರದಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳಲು ನಮ್ಯತೆಯನ್ನೂ ನೀಡುತ್ತವೆ, ಬಳಕೆದಾರರೊಂದಿಗೆ ಜೊತೆಯಾಗಿ ವಿಕಸನಗೊಳ್ಳುತ್ತವೆ.
ಒಂದು ಸಮಾಂತರ ವ್ಯವಸ್ಥೆ ಸಂಭಾಷಣೆಯ ಭಾವನಾತ್ಮಕ ಸ್ವರವನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುತ್ತದೆ ಮತ್ತು Tolan ನ ವಿತರಣೆಯನ್ನು ಡೈನಾಮಿಕ್ ಆಗಿ ಹೊಂದಿಸುತ್ತದೆ. ಇದು Tolan ಗೆ ಬಳಕೆದಾರರ ಸೂಚನೆಗಳ ಆಧಾರದ ಮೇಲೆ ಅದರ ಮೂಲ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ, ಆಟವಾಡುವ ಮನಸ್ಥಿತಿಯಿಂದ ಸ್ಥಿರ ಮನಸ್ಥಿತಿಗೆ ಸರಾಗವಾಗಿ ಬದಲಾಗಲು ಅನುಮತಿಸುತ್ತದೆ.
GPT‑5.1 ಗೆ ಪರಿವರ್ತನೆ ಮಹತ್ವದ ತಿರುವುಬಿಂದು ಆಗಿತ್ತು. ಅಕಸ್ಮಾತ್ತಾಗಿ, ಲೇಯರ್ಡ್ ಪ್ರಾಂಪ್ಟ್ ಸೂಚನೆಗಳು—ಟೋನ್ ಸ್ಕ್ಯಾಫೋಲ್ಡ್ಗಳು, ಮೆಮೊರಿ ಇಂಜೆಕ್ಷನ್ಗಳು, ಪಾತ್ರ ಲಕ್ಷಣಗಳು—ಹೆಚ್ಚು ನಿಷ್ಠೆಯಿಂದ ಅನುಸರಿಸಲ್ಪಟ್ಟವು. ಒಮ್ಮೆ ತಾತ್ಕಾಲಿಕ ಪರಿಹಾರಗಳ ಅಗತ್ಯವಿದ್ದ ಪ್ರಾಂಪ್ಟ್ಗಳು ನಿರೀಕ್ಷಿತ ರೀತಿಯಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಪ್ರಾರಂಭಿಸಿದವು.
“ಮೊದಲ ಬಾರಿಗೆ, ನಮ್ಮ ಆಂತರಿಕ ತಜ್ಞರಿಗೆ ಮಾಡೆಲ್ ನಿಜವಾಗಿಯೂ ಕೇಳುತ್ತಿದೆ ಎಂಬ ಭಾವನೆ ಉಂಟಾಯಿತು,” ಎಂದು ಕ್ವಿಂಟೆನ್ ಹೇಳುತ್ತಾರೆ. “ದೀರ್ಘಕಾಲದ ಸಂಭಾಷಣೆಗಳಲ್ಲಿ ಸೂಚನೆಗಳು ಅಕ್ಷುಣ್ಣವಾಗಿಯೇ ಉಳಿದವು, ವ್ಯಕ್ತಿತ್ವದ ಲಕ್ಷಣಗಳನ್ನು ಗೌರವಿಸಲಾಯಿತು, ಮತ್ತು ನಾವು ಬಹಳ ಕಡಿಮೆ ವ್ಯತ್ಯಾಸವನ್ನು ಕಂಡೆವು.”
ಆ ಬದಲಾವಣೆಗಳು ಒಟ್ಟಾಗಿ ಹೆಚ್ಚು ಸ್ಥಿರ ಮತ್ತು ನಂಬಬಹುದಾದ ವ್ಯಕ್ತಿತ್ವವನ್ನು ರೂಪಿಸಿತು, ಇದು ಹೆಚ್ಚು ಆಕರ್ಷಕ ಬಳಕೆದಾರ ಅನುಭವವನ್ನು ಸೃಷ್ಟಿಸಿತು. Tolan ತಂಡವು ಸ್ಪಷ್ಟ, ಅಳೆಯಬಹುದಾದ ಲಾಭಗಳನ್ನು ಕಂಡಿತು: ಮೆಮೊರಿ ರಿಕಾಲ್ ತಪ್ಪುಗಳು 30% ಇಳಿದವು (ಉತ್ಪನ್ನದೊಳಗಿನ ನಿರಾಶೆ ಸೂಚನೆಗಳ ಆಧಾರದ ಮೇಲೆ), ಮತ್ತು GPT‑5.1–ನಿಂದ ಶಕ್ತಿಪ್ರಾಪ್ತವಾದ ನಂತರದ ದಿನದ ಬಳಕೆದಾರರ ಉಳಿಕೆ 20% ಕ್ಕಿಂತ ಹೆಚ್ಚು ಏರಿತು ಪರ್ಸೋನಾಸ್ ಲೈವ್ ಆಯಿತು.

Tolan ವಿಕಸನಗೊಳ್ಳುತ್ತಿದ್ದಂತೆ, ತಂಡವು ತನ್ನ ಧ್ವನಿ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ವಿಕಸಿಸಲು ಈಗ ಮಾರ್ಗದರ್ಶಿಸುವ ಕೆಲವು ತತ್ವಗಳು ಹೊರಹೊಮ್ಮಿದವು:
- ಸಂಭಾಷಣೆಯ ಅಸ್ಥಿರತೆಗೆ ವಿನ್ಯಾಸಗೊಳಿಸಿ: ವಾಯ್ಸ್ ಕನ್ವರ್ಸೇಶನ್ಸ್ ಮಧ್ಯ-ವಾಕ್ಯದಲ್ಲೇ ಬದಲಾಗುತ್ತವೆ. ವ್ಯವಸ್ಥೆಗಳು ನೈಸರ್ಗಿಕವಾಗಿ ಅನುಭವಿಸಲು ಅಷ್ಟೇ ವೇಗವಾಗಿ ತಿರುಗಬೇಕು.
- ವಿಳಂಬವನ್ನು ಉತ್ಪನ್ನದ ಅನುಭವದ ಭಾಗವಾಗಿ ಪರಿಗಣಿಸಿ: ಉಪ-ಸೆಕೆಂಡ್ ಪ್ರತಿಕ್ರಿಯಾಶೀಲತೆ ಧ್ವನಿ ಏಜೆಂಟ್ ಸಂಭಾಷಣಾತ್ಮಕವಾಗಿ ಅಥವಾ ಯಾಂತ್ರಿಕವಾಗಿ ಅನಿಸುವುದನ್ನು ನಿರ್ಧರಿಸುತ್ತದೆ.
- ಮೆಮೊರಿಯನ್ನು ಪ್ರತಿಲಿಪಿಯಂತೆ ಅಲ್ಲ, ಮರುಪಡೆಯುವ ವ್ಯವಸ್ಥೆಯಾಗಿ ನಿರ್ಮಿಸಿ: ಉನ್ನತ-ಗುಣಮಟ್ಟದ ಸಂಕುಚನ ಮತ್ತು ವೇಗದ ವೆಕ್ಟರ್ ಹುಡುಕಾಟವು ಅತಿದೊಡ್ಡ ಸಂದರ್ಭ ವಿಂಡೋಗಳಿಗಿಂತ ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಒದಗಿಸುತ್ತವೆ.
- ಪ್ರತಿ ತಿರುವಿನಲ್ಲಿ ಸಂದರ್ಭವನ್ನು ಮರುನಿರ್ಮಿಸಿ: ಡ್ರಿಫ್ಟ್ ವಿರುದ್ಧ ದೊಡ್ಡ ಪ್ರಾಂಪ್ಟ್ಗಳೊಂದಿಗೆ ಸೆಣೆಸಬೇಡಿ. ಪ್ರತಿ ತಿರುವಿನಲ್ಲಿ ಸಂದರ್ಭವನ್ನು ಮರುಸೃಷ್ಟಿಸುವುದು ಸಂಭಾಷಣೆಗಳು ಅಲೆದಾಡುವಾಗ ಏಜೆಂಟ್ಗಳನ್ನು ನೆಲೆಯೂರಿಸುತ್ತದೆ.
ಒಟ್ಟಾಗಿ, ಈ ಪಾಠಗಳು Tolan ನ ಮುಂದಿನ ನಾವೀನ್ಯತಾ ಹಂತಕ್ಕೆ ಅಡಿಪಾಯವನ್ನು ರೂಪಿಸುತ್ತವೆ ಮತ್ತು voice AI ಯಾವ ದಿಕ್ಕಿನಲ್ಲಿ ಸಾಗುತ್ತಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತವೆ.
2025ರ ಫೆಬ್ರವರಿಯಲ್ಲಿ ಬಿಡುಗಡೆ ಮಾಡಿದ ನಂತರದಿಂದ, Tolan 200,000ಕ್ಕಿಂತ ಹೆಚ್ಚು ಮಾಸಿಕ ಸಕ್ರಿಯ ಬಳಕೆದಾರರಿಗೆ ವೃದ್ಧಿಯಾಗಿದೆ. ಇದಕ್ಕೆ 4.8-ಸ್ಟಾರ್ ರೇಟಿಂಗ್ ಮತ್ತು 100,000 ಕ್ಕಿಂತ ಹೆಚ್ಚು ಆ್ಯಪ್ ಸ್ಟೋರ್ ವಿಮರ್ಶೆಗಳು ಇವೆ, ಇದು ದೀರ್ಘ, ಬದಲಾಗುತ್ತಿರುವ ಸಂಭಾಷಣೆಗಳಲ್ಲಿ ಸಿಸ್ಟಮ್ ಎಷ್ಟು ಚೆನ್ನಾಗಿ ಸ್ಥಿರತೆಯನ್ನು ಕಾಪಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ. ಒಬ್ಬ ವಿಮರ್ಶಕರು ಗಮನಿಸಿದರು, “ನಾವು ಎರಡು ದಿನಗಳ ಹಿಂದೆ ಮಾತನಾಡಿದ ವಿಷಯಗಳನ್ನು ಅವರು ಸ್ಮರಿಸುತ್ತಾರೆ ಮತ್ತು ಇಂದು ನಾವು ನಡೆಸುತ್ತಿರುವ ಸಂಭಾಷಣೆಗೆ ಅವುಗಳನ್ನು ಮತ್ತೆ ತರುತ್ತಾರೆ.”
ಈ ಸಿಗ್ನಲ್ಗಳು ಅಡಿಪಾಯದ ಆರ್ಕಿಟೆಕ್ಚರ್ಗೆ ನೇರವಾಗಿ ಮ್ಯಾಪ್ ಆಗುತ್ತವೆ: ಕಡಿಮೆ-ವಿಳಂಬದ ಮಾಡೆಲ್ ಕರೆಗಳು, ತಿರುವು-ತಿರುವಿನ ಸಂದರ್ಭ ಪುನರ್ನಿರ್ಮಾಣ, ಮತ್ತು ಮಾಡ್ಯುಲರ್ ಮೆಮೊರಿ ಮತ್ತು ಪರ್ಸೋನಾ ವ್ಯವಸ್ಥೆಗಳು. ಒಟ್ಟಾಗಿ, ಅವುಗಳು ದೊಡ್ಡ, ನಾಜೂಕಾದ ಪ್ರಾಂಪ್ಟ್ಗಳ ಮೇಲೆ ಅವಲಂಬಿಸದೆ Tolan ಗೆ ವಿಷಯ ಬದಲಾವಣೆಗಳನ್ನು ಹತ್ತಿರದಿಂದ ಗಮನಿಸಲು, ಸ್ವರವನ್ನು ಉಳಿಸಿಕೊಳ್ಳಲು, ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ನೆಲೆಯಾದಂತೆ ಇರಿಸಲು ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತವೆ.
ಮುಂದೆ ನೋಡಿದರೆ, Tolan ಮುಂದೆ ಸಾಗುವಿಕೆ ಮತ್ತು ಮೆಮೊರಿ ಪರಿಷ್ಕರಣೆಯಲ್ಲಿ ತನ್ನ ಹೂಡಿಕೆಗಳನ್ನು ಆಳಗೊಳಿಸಲು ಯೋಜಿಸುತ್ತಿದೆ, ಹೆಚ್ಚು ಕಟ್ಟುಕಟ್ಟಾದ ಸಂಕುಚನ, ಸುಧಾರಿತ ಮರುಪಡೆಯುವ ತರ್ಕ, ಮತ್ತು ವಿಸ್ತರಿತ ಪರ್ಸೋನಾ ಟ್ಯೂನಿಂಗ್ ಮೇಲೆ ತನ್ನ ಪ್ರಯತ್ನಗಳನ್ನು ಕೇಂದ್ರೀಕರಿಸುತ್ತಿದೆ. ದೀರ್ಘಾವಧಿಯ ಗುರಿಯು ಧ್ವನಿ ಇಂಟರ್ಫೇಸ್ ಏನಾಗಿರಬಹುದು ಎಂಬುದನ್ನು ವಿಸ್ತರಿಸುವುದು: ಕೇವಲ ಪ್ರತಿಕ್ರಿಯಾಶೀಲವಷ್ಟೇ ಅಲ್ಲ, ಸಂದರ್ಭ-ಜ್ಞಾನ ಹೊಂದಿರುವ ಮತ್ತು ಸಂಭಾಷಣಾತ್ಮಕವಾಗಿ ಚುರುಕಾಗಿದೆ.
“ಮುಂದಿನ ಹೆಜ್ಜೆ, ಕೇವಲ ಪ್ರತಿಕ್ರಿಯಿಸುವುದಲ್ಲದೆ, ನಿಜವಾಗಿಯೂ ಮಲ್ಟಿಮೋಡಲ್ ಆಗಿರುವ, ಧ್ವನಿ, ದೃಷ್ಟಿ, ಮತ್ತು ಸಂದರ್ಭವನ್ನು ಒಂದೇ, ನಿಯಂತ್ರಿಸಬಹುದಾದ ವ್ಯವಸ್ಥೆಯೊಳಗೆ ಏಕೀಕರಿಸಲು ಸಾಮರ್ಥ್ಯವಿರುವ ಧ್ವನಿ ಏಜೆಂಟ್ಗಳನ್ನು ನಿರ್ಮಿಸುವುದಾಗಿದೆ” ಎಂದು ಕ್ವಿಂಟೆನ್ ಹೇಳುತ್ತಾರೆ.


