GPT‑5.1 ನೊಂದಿಗೆ Tolan ಧ್ವನಿ-ಮೊದಲು AI ಅನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುತ್ತದೆ

GPT‑5.1 ನೊಂದಿಗೆ, Tolan ಕಡಿಮೆ ವಿಳಂಬ, ನಿಖರ ಸಂದರ್ಭ, ಮತ್ತು ಸಂಭಾಷಣೆಗಳು ಬೆಳೆಯುತ್ತಿದ್ದಂತೆ ಸ್ಥಿರ ವ್ಯಕ್ತಿತ್ವಗಳಿಗಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿದ ಧ್ವನಿ ಆ್ಯಪ್ ಅನ್ನು ನಿರ್ಮಿಸಿದೆ.

ಲೋಡ್ ಆಗುತ್ತಿದೆ…

Tolan⁠(ಹೊಸ ಕಿಟಕಿಯಲ್ಲಿ ತೆರೆಯುತ್ತದೆ) ಎಂಬುದು ಧ್ವನಿ-ಆಧಾರಿತ AI ಸಂಗಾತಿ, ಇಲ್ಲಿ ಜನರು ವೈಯಕ್ತಿಕಗೊಳಿಸಿದ, ಅನಿಮೇಟೆಡ್ ಪಾತ್ರದೊಂದಿಗೆ ಮಾತನಾಡುತ್ತಾರೆ, ಅದು ಸಂಭಾಷಣೆಗಳಿಂದ ಕಾಲಕ್ರಮೇಣ ಕಲಿಯುತ್ತದೆ.

ಹಿಂದಿನ ನಿರ್ಗಮನ ಹೊಂದಿರುವ ಅನುಭವಿ ತಂಡ Portola ನಿರ್ಮಿಸಿರುವ ಈ ಆ್ಯಪ್, ತ್ವರಿತ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳ ಬದಲು ಚಾಲ್ತಿಯಲ್ಲಿರುವ, ಓಪನ್-ಎಂಡೆಡ್ ಸಂವಾದಕ್ಕಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. “ನಾವು ChatGPT ಬೆಳವಣಿಗೆಯನ್ನು ಕಂಡೆವು ಮತ್ತು ಧ್ವನಿಯೇ ಮುಂದಿನ ಹೆಜ್ಜೆ ಎಂದು ತಿಳಿದಿದ್ದೇವೆ,” ಎಂದು Portola ಸಹ-ಸ್ಥಾಪಕ ಮತ್ತು CEO ಕ್ವಿಂಟೆನ್ ಫಾರ್ಮರ್ ಹೇಳಿದ್ದಾರೆ. “ಆದರೆ ಧ್ವನಿ ಹೆಚ್ಚು ಕಷ್ಟವಾಗಿದೆ. ನೀವು ಕೇವಲ ಟೈಪ್ ಮಾಡಿದ ಪ್ರಾಂಪ್ಟ್‌ಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತಿಲ್ಲ; ನೀವು ನೇರ, ತರಂಗಗಳ ಸಂಭಾಷಣೆಯನ್ನು ನಡೆಸುತ್ತಿದ್ದೀರಿ.”

Voice AI ವಿಳಂಬ ಮತ್ತು ಸಂದರ್ಭ ನಿರ್ವಹಣೆಯಲ್ಲಿ ಮಾನದಂಡವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ, ಆದರೆ ಇದು ಪಠ್ಯಕ್ಕಿಂತ ಹೆಚ್ಚು ಓಪನ್-ಎಂಡೆಡ್, ಅನ್ವೇಷಣಾತ್ಮಕ ಸಂವಹನಗಳನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ.

ಅಡಿಪಾಯದ ಮಾಡೆಲ್‌ಗಳು ಹೆಚ್ಚು ವೇಗವಾಗಿ, ಕಡಿಮೆ ವೆಚ್ಚ ಮತ್ತು ಹೆಚ್ಚು ಸಾಮರ್ಥ್ಯವಂತವಾಗುತ್ತಾ ಬಂದಂತೆ, ತಂಡವು ತಮ್ಮ ಪ್ರಯತ್ನಗಳನ್ನು ಎರಡು ಪ್ರಮುಖ ಅಂಶಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿತು: ಮೆಮೊರಿ ಮತ್ತು ಪಾತ್ರ ವಿನ್ಯಾಸ. Portola ಪ್ರಶಸ್ತಿ ವಿಜೇತ ಆ್ಯನಿಮೇಟರ್‌ಗಳು ಮತ್ತು ವಿಜ್ಞಾನ ಕಾದಂಬರಿ ಬರಹಗಾರರ ಸಹಾಯದಿಂದ ಪಾತ್ರ-ಚಾಲಿತ ವಿಶ್ವವನ್ನು ನಿರ್ಮಿಸಿದೆ, ಸಂಭಾಷಣೆಗಳು ಮುಂದುವರಿಯುವಂತೆ ವ್ಯಕ್ತಿತ್ವ ಮತ್ತು ನೆನಪು ಸ್ಥಿರವಾಗಿರಲು ರಿಯಲ್-ಟೈಮ್ ಸಂದರ್ಭ ನಿರ್ವಹಣಾ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುತ್ತಿದೆ.

GPT‑5.1 ಮಾಡೆಲ್‌ಗಳ ಬಿಡುಗಡೆ ಒಂದು ತಿರುವುಬಿಂದು ಆಗಿತ್ತು, ಇದು ಸ್ಟೀರಬಿಲಿಟಿ ಮತ್ತು ಲೇಟೆನ್ಸಿಯಲ್ಲಿ ಪ್ರಮುಖ ಲಾಭಗಳನ್ನು ತಂದುಕೊಟ್ಟಿತು, ಆ ಭಾಗಗಳನ್ನು ಒಟ್ಟಿಗೆ ಸೇರಿಸಿ, ಹೆಚ್ಚು ಸ್ಪಂದಿಸುವ ಮತ್ತು ಆಕರ್ಷಕ ಧ್ವನಿ ಅನುಭವವನ್ನು ಮುಕ್ತಗೊಳಿಸಿತು.

“GPT-5.1 ನಮಗೆ ನಾವು ಮನಸ್ಸಿನಲ್ಲಿ ಇಟ್ಟುಕೊಂಡಿದ್ದ ಪಾತ್ರಗಳನ್ನು ಕೊನೆಗೂ ವ್ಯಕ್ತಪಡಿಸಲು ಬೇಕಾದ ನಿಯಂತ್ರಣವನ್ನು ನೀಡಿತು. ಇದು ಕೇವಲ ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವಾಗಿರಲಿಲ್ಲ—ನಾವು ಸೃಷ್ಟಿಸಲು ಬಯಸಿದ ಶೈಲಿ ಮತ್ತು ವ್ಯಕ್ತಿತ್ವಕ್ಕೆ ಇನ್ನಷ್ಟು ನಿಷ್ಠವಾಗಿತ್ತು.”

—ಕ್ವಿಂಟೆನ್ ಫಾರ್ಮರ್, CEO, Portola

ನೈಸರ್ಗಿಕ ಧ್ವನಿ ಸಂವಹನಗಳಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸುವುದು

Tolan ನ ವಾಸ್ತುಶಿಲ್ಪವು ಧ್ವನಿಯ ಬೇಡಿಕೆಗಳಿಂದ ರೂಪಿತವಾಗಿದೆ. ಧ್ವನಿ ಬಳಕೆದಾರರು ಸಂಭಾಷಣೆ ಮಧ್ಯದಲ್ಲಿ ದಿಕ್ಕು ಬದಲಾದರೂ ಕೂಡ ತಕ್ಷಣದ, ನೈಸರ್ಗಿಕ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತಾರೆ. Tolan ತ್ವರಿತವಾಗಿ ಪ್ರತಿಕ್ರಿಯಿಸಬೇಕಾಗಿತ್ತು, ಬದಲಾಗುತ್ತಿರುವ ವಿಷಯಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಬೇಕಾಗಿತ್ತು, ಮತ್ತು ವಿಳಂಬವಿಲ್ಲದೆ ಅಥವಾ ಸ್ವರದ ವಿಚಲನವಾಗದೆ ಸತತ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳಬೇಕಾಗಿತ್ತು.

ನೈಸರ್ಗಿಕವಾಗಿ ಅನುಭವಿಸಲು, ಸಂಭಾಷಣೆಗಳಿಗೆ ತಕ್ಷಣದ ಲೇಟೆನ್ಸಿ ಅಗತ್ಯವಿತ್ತು. OpenAI GPT‑5.1 ಅನ್ನು ಪರಿಚಯಿಸುತ್ತಿದ್ದೇವೆ ಮತ್ತು Responses API ಮಾತು ಆರಂಭಿಸುವ ಸಮಯವನ್ನು 0.7 ಸೆಕೆಂಡುಗಳಿಗಿಂತ ಹೆಚ್ಚು ಕಡಿತಗೊಳಿಸುತ್ತದೆ—ಇದು ಸಂಭಾಷಣೆಯ ಹರಿವನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಸುಧಾರಿಸಲು ಬಹಳಷ್ಟಾಗಿದೆ.

ವ್ಯವಸ್ಥೆಯು ಸಂದರ್ಭವನ್ನು ಹೇಗೆ ನಿರ್ವಹಿಸಿತು ಎಂಬುದು ಅಷ್ಟೇ ನಿರ್ಣಾಯಕವಾಗಿತ್ತು. ಅನೇಕ ಏಜೆಂಟ್‌ಗಳು ಹಲವು ಬಾರಿ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಸಂಗ್ರಹಿಸುವುದಕ್ಕೆ ಭಿನ್ನವಾಗಿ, Tolan ಪ್ರತಿ ಬಾರಿ ತನ್ನ ಸಂದರ್ಭ ವಿಂಡೋವನ್ನು ಹೊಸದಾಗಿ ನಿರ್ಮಿಸುತ್ತದೆ. ಪ್ರತಿ ಸಂದರ್ಭ ಪುನರ್‌ನಿರ್ಮಾಣವು ಇತ್ತೀಚಿನ ಸಂದೇಶಗಳ ಸಾರಾಂಶ, ಪರ್ಸೋನಾ ಕಾರ್ಡ್, ವೆಕ್ಟರ್-ರಿಟ್ರೀವ್ಡ್ ಮೆಮೊರಿಗಳು, ಶೈಲಿ ಮಾರ್ಗದರ್ಶನ, ಮತ್ತು ರಿಯಲ್-ಟೈಮ್ ಆಪ್ ಸಿಗ್ನಲ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಈ ಆರ್ಕಿಟೆಕ್ಚರ್ Tolan ಗೆ ತಕ್ಷಣದ ವಿಷಯ ಬದಲಾವಣೆಗಳಿಗೆ ನೈಜ-ಸಮಯದಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳಲು ಅವಕಾಶ ಮಾಡುತ್ತದೆ, ಇದು ನೈಸರ್ಗಿಕ ಧ್ವನಿ-ಆಧಾರಿತ ಸಂವಹನಕ್ಕೆ ಅಗತ್ಯವಾದ ಅವಶ್ಯಕತೆ.

“ಕ್ಯಾಶ್ ಮಾಡಿದ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ಸರಿಯಾಗಿಲ್ಲ ಎಂಬುದು ನಮಗೆ ಬೇಗನೆ ತಿಳಿಯಿತು,” ಎಂದು ಕ್ವಿಂಟೆನ್ ಹೇಳುತ್ತಾರೆ. “ಬಳಕೆದಾರರು ಯಾವಾಗಲೂ ವಿಷಯಗಳನ್ನು ಬದಲಿಸುತ್ತಾರೆ. ನಿರಂತರ ಅನುಭವಕ್ಕಾಗಿ, ವ್ಯವಸ್ಥೆ ಮಧ್ಯದಲ್ಲಿ ಹೊಂದಿಕೆ ಮಾಡಿಕೊಳ್ಳಬೇಕಾಯಿತು."

ಈ ರಿಯಲ್-ಟೈಮ್ ಪುನರ್‌ನಿರ್ಮಾಣ ವಿಧಾನವು ತಾಂತ್ರಿಕವಾಗಿ ಗಹನವಾಗಿದ್ದು, Tolan ನ ಯಶಸ್ಸಿಗೆ ಮೂಲಭೂತವಾಗಿದೆ.

Tolan ನ ಸಂಭಾಷಣಾ ಲೂಪ್ ಅನ್ನು ತೋರಿಸುವ ಫ್ಲೋ ಡಯಾಗ್ರಾಮ್. “Recompute persona” ಹಂತವು ನಾಲ್ಕು ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ: ಚಾಟ್ ಸಾರಾಂಶ, ಇತ್ತೀಚಿನ ಕಚ್ಚಾ ಸಂದೇಶಗಳು, ಬಳಕೆದಾರ ಮತ್ತು Tolan ಪರ್ಸೋನಾಗಳು, ಮತ್ತು ಇತರ ಸಂದರ್ಭ, ಮೆಮೊರಿ, ಮತ್ತು ಧ್ವನಿ. ಈ ಇನ್‌ಪುಟ್‌ಗಳು ಸೇರಿ Tolan ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ರಚಿಸುತ್ತವೆ, ಇದು ಬಳಕೆದಾರರ ಪ್ರತಿಕ್ರಿಯೆಗೆ ಕಾರಣವಾಗುತ್ತದೆ. ಬಳಕೆದಾರರ ಪ್ರತಿಕ್ರಿಯೆಯು ನಂತರ ಎರಡು ಸಮಾಂತರ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಚಾಲಿತಗೊಳಿಸುತ್ತದೆ: ನವೀಕರಿಸಿದ ಧ್ವನಿಯನ್ನು ನಿರ್ಧರಿಸುವುದು ಮತ್ತು ಮೆಮೊರಿಗಳನ್ನು ಹೊರತೆಗೆಯುವುದು. ಹೆಕ್ಕಿದ ಮೆಮೊರಿಗಳು ಮೆಮೊರಿಯನ್ನು ನವೀಕರಿಸುತ್ತವೆ, ನವೀಕರಿಸಿದ ಟೋನ್ ಟೋನ್‌ಗೆ ಹಿಂತಿರುಗುತ್ತದೆ, ಮತ್ತು ಸಂಭಾಷಣೆ ಇತಿಹಾಸವನ್ನು ನಿಯಮಿತವಾಗಿ ಮರು-ಸಾರಾಂಶಗೊಳಿಸಿ ಮತ್ತು ಸಂಕುಚಿತಗೊಳಿಸಲಾಗುತ್ತದೆ, ಮುಂದಿನ ಸುತ್ತಿಗೆ ಚಾಟ್ ಸಾರಾಂಶಕ್ಕೆ ಲೂಪ್ ಆಗಿ ಹಿಂತಿರುಗುತ್ತದೆ.

ಕಾಲಾಂತರದಲ್ಲಿ ಒಟ್ಟಿಗೆ ಉಳಿಯುವ ಮೆಮೊರಿ ಮತ್ತು ವ್ಯಕ್ತಿತ್ವವನ್ನು ನಿರ್ಮಿಸುವುದು

ಸನ್ನಿವೇಶ ನಿರ್ವಹಣೆ ಮುಖ್ಯವಾಗಿದೆ, ಆದರೆ ಅದು ಕಾಲಕ್ರಮೇಣ ಸಂಭಾಷಣೆಗಳನ್ನು ಸಮ್ಮತವಾಗಿ ಇರಿಸಲು ಸಾಕಾಗಲಿಲ್ಲ. ದೀರ್ಘ, ರೇಖೀಯವಲ್ಲದ ಸಂಭಾಷಣೆಗಳನ್ನು ಬೆಂಬಲಿಸಲು, Tolan ಕೇವಲ ವಾಸ್ತವಗಳು ಮತ್ತು ಆಯ್ಕೆಗಳನ್ನು ಮಾತ್ರವಲ್ಲ, ಭಾವನಾತ್ಮಕ “ವೈಬ್” ಸಂಕೇತಗಳನ್ನೂ—Tolan ಹೇಗೆ ಪ್ರತಿಕ್ರಿಯಿಸಬೇಕು ಎಂಬುದನ್ನು ಮಾರ್ಗದರ್ಶಿಸಲು ಸಹಾಯ ಮಾಡುವ ಸುಳಿವುಗಳನ್ನೂ—ಉಳಿಸಿಕೊಳ್ಳುವ ಮೆಮೊರಿ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸಿದೆ.

ಮೆಮೊರಿಗಳನ್ನು OpenAI text-embedding-3-large ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಅಳವಡಿಸಲಾಗುತ್ತದೆ ಮತ್ತು Turbopuffer ಎಂಬ ಹೈ-ಸ್ಪೀಡ್ ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್‌ನಲ್ಲಿ sub-50ms ಲುಕ್‌ಅಪ್ ಸಮಯಗಳನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಈ ವೇಗವು ನೈಜ-ಸಮಯ ಧ್ವನಿ ಸಂವಹನಗಳಿಗೆ ಅತ್ಯಗತ್ಯವಾಗಿದೆ. ಪ್ರತಿ ತಿರುವಿನಲ್ಲಿ, Tolan ಬಳಕೆದಾರರ ಇತ್ತೀಚಿನ ಸಂದೇಶ ಮತ್ತು ಸಿಸ್ಟಮ್-ಸಂಶ್ಲೇಷಿತ ಪ್ರಶ್ನೆಗಳು (ಉದಾ., “ಬಳಕೆದಾರರು ಯಾರನ್ನು ಮದುವೆಯಾಗಿದ್ದಾರೆ?”) ಅನ್ನು ಬಳಸಿ ನೆನಪು ಮರುಸ್ಮರಿಸಲು ಪ್ರೇರೇಪಿಸುತ್ತದೆ. ಮೆಮೊರಿ ಗುಣಮಟ್ಟವನ್ನು ಉನ್ನತವಾಗಿರಿಸಲು, Tolan ಕಡಿಮೆ ಮೌಲ್ಯದ ಅಥವಾ ಪುನರಾವರ್ತಿತ ಎಂಟ್ರಿಗಳನ್ನು ತೆಗೆದುಹಾಕುವ ರಾತ್ರಿ ಕಂಪ್ರೆಷನ್ ಕೆಲಸವನ್ನು ನಡೆಸುತ್ತದೆ (ಉದಾಹರಣೆಗೆ, “ಬಳಕೆದಾರನು ಇಂದು ಕಾಫಿ ಕುಡಿದನು”) ಮತ್ತು ವಿರೋಧಾಭಾಸಗಳನ್ನು ಪರಿಹರಿಸುತ್ತದೆ.

ವ್ಯಕ್ತಿತ್ವವನ್ನು ಸಹ ಅಷ್ಟೇ ಎಚ್ಚರಿಕೆಯಿಂದ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ. ಪ್ರತಿ Tolan ಅನ್ನು ತಂಡದ ಇನ್-ಹೌಸ್ ಸೈನ್ಸ್ ಫಿಕ್ಷನ್ ಬರಹಗಾರರಿಂದ ರಚಿಸಲಾದ ಮತ್ತು ನಡವಳಿಕಾ ಸಂಶೋಧಕರಿಂದ ಪರಿಷ್ಕರಿಸಲಾದ ವಿಶಿಷ್ಟ ಪಾತ್ರ ಸ್ಕಾಫೋಲ್ಡ್‌ನೊಂದಿಗೆ ಬಿತ್ತರಿಸಲಾಗುತ್ತದೆ. ಈ ಸೀಡ್‌ಗಳು Tolans ಗೆ ಸ್ಥಿರತೆಯನ್ನು ನೀಡುತ್ತವೆ, ಆದರೆ ಕಾಲಾನಂತರದಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳಲು ನಮ್ಯತೆಯನ್ನೂ ನೀಡುತ್ತವೆ, ಬಳಕೆದಾರರೊಂದಿಗೆ ಜೊತೆಯಾಗಿ ವಿಕಸನಗೊಳ್ಳುತ್ತವೆ.

ಒಂದು ಸಮಾಂತರ ವ್ಯವಸ್ಥೆ ಸಂಭಾಷಣೆಯ ಭಾವನಾತ್ಮಕ ಸ್ವರವನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುತ್ತದೆ ಮತ್ತು Tolan ನ ವಿತರಣೆಯನ್ನು ಡೈನಾಮಿಕ್ ಆಗಿ ಹೊಂದಿಸುತ್ತದೆ. ಇದು Tolan ಗೆ ಬಳಕೆದಾರರ ಸೂಚನೆಗಳ ಆಧಾರದ ಮೇಲೆ ಅದರ ಮೂಲ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ, ಆಟವಾಡುವ ಮನಸ್ಥಿತಿಯಿಂದ ಸ್ಥಿರ ಮನಸ್ಥಿತಿಗೆ ಸರಾಗವಾಗಿ ಬದಲಾಗಲು ಅನುಮತಿಸುತ್ತದೆ.

GPT‑5.1 ಗೆ ಪರಿವರ್ತನೆ ಮಹತ್ವದ ತಿರುವುಬಿಂದು ಆಗಿತ್ತು. ಅಕಸ್ಮಾತ್ತಾಗಿ, ಲೇಯರ್ಡ್ ಪ್ರಾಂಪ್ಟ್ ಸೂಚನೆಗಳು—ಟೋನ್ ಸ್ಕ್ಯಾಫೋಲ್ಡ್‌ಗಳು, ಮೆಮೊರಿ ಇಂಜೆಕ್ಷನ್‌ಗಳು, ಪಾತ್ರ ಲಕ್ಷಣಗಳು—ಹೆಚ್ಚು ನಿಷ್ಠೆಯಿಂದ ಅನುಸರಿಸಲ್ಪಟ್ಟವು. ಒಮ್ಮೆ ತಾತ್ಕಾಲಿಕ ಪರಿಹಾರಗಳ ಅಗತ್ಯವಿದ್ದ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ನಿರೀಕ್ಷಿತ ರೀತಿಯಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಪ್ರಾರಂಭಿಸಿದವು.

“ಮೊದಲ ಬಾರಿಗೆ, ನಮ್ಮ ಆಂತರಿಕ ತಜ್ಞರಿಗೆ ಮಾಡೆಲ್ ನಿಜವಾಗಿಯೂ ಕೇಳುತ್ತಿದೆ ಎಂಬ ಭಾವನೆ ಉಂಟಾಯಿತು,” ಎಂದು ಕ್ವಿಂಟೆನ್ ಹೇಳುತ್ತಾರೆ. “ದೀರ್ಘಕಾಲದ ಸಂಭಾಷಣೆಗಳಲ್ಲಿ ಸೂಚನೆಗಳು ಅಕ್ಷುಣ್ಣವಾಗಿಯೇ ಉಳಿದವು, ವ್ಯಕ್ತಿತ್ವದ ಲಕ್ಷಣಗಳನ್ನು ಗೌರವಿಸಲಾಯಿತು, ಮತ್ತು ನಾವು ಬಹಳ ಕಡಿಮೆ ವ್ಯತ್ಯಾಸವನ್ನು ಕಂಡೆವು.”

ಆ ಬದಲಾವಣೆಗಳು ಒಟ್ಟಾಗಿ ಹೆಚ್ಚು ಸ್ಥಿರ ಮತ್ತು ನಂಬಬಹುದಾದ ವ್ಯಕ್ತಿತ್ವವನ್ನು ರೂಪಿಸಿತು, ಇದು ಹೆಚ್ಚು ಆಕರ್ಷಕ ಬಳಕೆದಾರ ಅನುಭವವನ್ನು ಸೃಷ್ಟಿಸಿತು. Tolan ತಂಡವು ಸ್ಪಷ್ಟ, ಅಳೆಯಬಹುದಾದ ಲಾಭಗಳನ್ನು ಕಂಡಿತು: ಮೆಮೊರಿ ರಿಕಾಲ್ ತಪ್ಪುಗಳು 30% ಇಳಿದವು (ಉತ್ಪನ್ನದೊಳಗಿನ ನಿರಾಶೆ ಸೂಚನೆಗಳ ಆಧಾರದ ಮೇಲೆ), ಮತ್ತು GPT‑5.1–ನಿಂದ ಶಕ್ತಿಪ್ರಾಪ್ತವಾದ ನಂತರದ ದಿನದ ಬಳಕೆದಾರರ ಉಳಿಕೆ 20% ಕ್ಕಿಂತ ಹೆಚ್ಚು ಏರಿತು ಪರ್ಸೋನಾಸ್ ಲೈವ್ ಆಯಿತು.

ಸಂಭಾಷಣೆಯ ಸಮಯದಲ್ಲಿ Tolan ಮೆಮೊರಿಗಳನ್ನು ಹೇಗೆ ಹಿಂಪಡೆಯುತ್ತದೆ ಮತ್ತು ಪರಿಷ್ಕರಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುವ ಫ್ಲೋ ಡಯಾಗ್ರಾಂ. ಬಳಕೆದಾರರ ಸಂದೇಶ (“ವಾರಾಂತ್ಯದ ಪ್ರವಾಸಕ್ಕಾಗಿ ನಾನು ತುಂಬಾ ಉತ್ಸುಕನಾಗಿದ್ದೇನೆ”) ಮುಂದಿನ ಪ್ರಶ್ನೆಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸುವ ಹಂತವನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತದೆ, ಉದಾಹರಣೆಗೆ ಮುಂದಿನ ಪ್ರವಾಸಗಳು, ನಿರ್ದಿಷ್ಟ ವಾರದ ಯೋಜನೆಗಳು, ಮತ್ತು ಬಳಕೆದಾರರ ಆದ್ಯತೆಗಳು. ಈ ಪ್ರಶ್ನೆಗಳನ್ನು ಎಂಬೆಡ್ ಮಾಡಲಾಗುತ್ತದೆ ಮತ್ತು ಮೆಮೊರಿ ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಕ್ವೆರಿ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ, ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಮೀನ್ ರೆಸಿಪ್ರೋಕಲ್ ಶ್ರೇಯಾಂಕ ಬಳಸಿ ಸಂಯೋಜಿಸಲಾಗುತ್ತದೆ. ಹಿಂಪಡೆಯಲಾದ ಸಂದರ್ಭವು Tolan ನ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ತಿಳಿಸುತ್ತದೆ (“ಯೋಸೆಮೈಟ್‌ನಲ್ಲಿ ಸ್ಟೀವನ್ ಜೊತೆಗೆ ಕ್ಯಾಂಪಿಂಗ್ ಮಾಡುವುದು”). ಐಸ್‌ಲ್ಯಾಂಡ್‌ಗೆ ಭವಿಷ್ಯದ ಪ್ರಯಾಣದ ಬಗ್ಗೆ ನಂತರದ ಬಳಕೆದಾರರ ಸಂದೇಶವನ್ನು ಹೊಸ ಮೆಮೊರಿಯಾಗಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ. ನಂತರ ಅದನ್ನು ಪರಾಮರ್ಶಿಸಲಾಗುತ್ತದೆ, ಮತ್ತು ಎಂಬೆಡಿಂಗ್-ಆಧರಿತ ಕೆ-ಅತಿಸಮೀಪದ ನೇಬರ್‌ಗಳು ಬಳಸಿ ಸಂಬಂಧಿತ ಮೆಮೊರಿಗಳೊಂದಿಗೆ ಗುಂಪು ಮಾಡಲಾಗುತ್ತದೆ. ಪ್ರತಿಯೊಂದು ಗುಂಪಿನೊಳಗಿನ ಮೆಮೊರಿಗಳನ್ನು ಸಂಯೋಜಿಸಿ, ಸಂಪಾದಿಸಿ, ಮತ್ತು ಸುಧಾರಿಸುವ ಮೂಲಕ ಕಂಪ್ರೆಸ್ ಮಾಡಲಾಗುತ್ತದೆ.

ನೈಸರ್ಗಿಕ ಧ್ವನಿ ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಲು Tolan ನ ಮೂಲ ತತ್ವಗಳು

Tolan ವಿಕಸನಗೊಳ್ಳುತ್ತಿದ್ದಂತೆ, ತಂಡವು ತನ್ನ ಧ್ವನಿ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ನಿರ್ಮಿಸಲು ಮತ್ತು ವಿಕಸಿಸಲು ಈಗ ಮಾರ್ಗದರ್ಶಿಸುವ ಕೆಲವು ತತ್ವಗಳು ಹೊರಹೊಮ್ಮಿದವು:

ಸಂಭಾಷಣೆಯ ಅಸ್ಥಿರತೆಗೆ ವಿನ್ಯಾಸಗೊಳಿಸಿ: ವಾಯ್ಸ್ ಕನ್ವರ್ಸೇಶನ್ಸ್ ಮಧ್ಯ-ವಾಕ್ಯದಲ್ಲೇ ಬದಲಾಗುತ್ತವೆ. ವ್ಯವಸ್ಥೆಗಳು ನೈಸರ್ಗಿಕವಾಗಿ ಅನುಭವಿಸಲು ಅಷ್ಟೇ ವೇಗವಾಗಿ ತಿರುಗಬೇಕು.
ವಿಳಂಬವನ್ನು ಉತ್ಪನ್ನದ ಅನುಭವದ ಭಾಗವಾಗಿ ಪರಿಗಣಿಸಿ: ಉಪ-ಸೆಕೆಂಡ್ ಪ್ರತಿಕ್ರಿಯಾಶೀಲತೆ ಧ್ವನಿ ಏಜೆಂಟ್ ಸಂಭಾಷಣಾತ್ಮಕವಾಗಿ ಅಥವಾ ಯಾಂತ್ರಿಕವಾಗಿ ಅನಿಸುವುದನ್ನು ನಿರ್ಧರಿಸುತ್ತದೆ.
ಮೆಮೊರಿಯನ್ನು ಪ್ರತಿಲಿಪಿಯಂತೆ ಅಲ್ಲ, ಮರುಪಡೆಯುವ ವ್ಯವಸ್ಥೆಯಾಗಿ ನಿರ್ಮಿಸಿ: ಉನ್ನತ-ಗುಣಮಟ್ಟದ ಸಂಕುಚನ ಮತ್ತು ವೇಗದ ವೆಕ್ಟರ್ ಹುಡುಕಾಟವು ಅತಿದೊಡ್ಡ ಸಂದರ್ಭ ವಿಂಡೋಗಳಿಗಿಂತ ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ವ್ಯಕ್ತಿತ್ವವನ್ನು ಒದಗಿಸುತ್ತವೆ.
ಪ್ರತಿ ತಿರುವಿನಲ್ಲಿ ಸಂದರ್ಭವನ್ನು ಮರುನಿರ್ಮಿಸಿ: ಡ್ರಿಫ್ಟ್ ವಿರುದ್ಧ ದೊಡ್ಡ ಪ್ರಾಂಪ್ಟ್‌ಗಳೊಂದಿಗೆ ಸೆಣೆಸಬೇಡಿ. ಪ್ರತಿ ತಿರುವಿನಲ್ಲಿ ಸಂದರ್ಭವನ್ನು ಮರುಸೃಷ್ಟಿಸುವುದು ಸಂಭಾಷಣೆಗಳು ಅಲೆದಾಡುವಾಗ ಏಜೆಂಟ್‌ಗಳನ್ನು ನೆಲೆಯೂರಿಸುತ್ತದೆ.

ಒಟ್ಟಾಗಿ, ಈ ಪಾಠಗಳು Tolan ನ ಮುಂದಿನ ನಾವೀನ್ಯತಾ ಹಂತಕ್ಕೆ ಅಡಿಪಾಯವನ್ನು ರೂಪಿಸುತ್ತವೆ ಮತ್ತು voice AI ಯಾವ ದಿಕ್ಕಿನಲ್ಲಿ ಸಾಗುತ್ತಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತವೆ.

ಧ್ವನಿ AI ಮೂಲಕ ಸಾಧ್ಯತೆಯನ್ನು ವಿಸ್ತರಿಸುವುದು

2025ರ ಫೆಬ್ರವರಿಯಲ್ಲಿ ಬಿಡುಗಡೆ ಮಾಡಿದ ನಂತರದಿಂದ, Tolan 200,000ಕ್ಕಿಂತ ಹೆಚ್ಚು ಮಾಸಿಕ ಸಕ್ರಿಯ ಬಳಕೆದಾರರಿಗೆ ವೃದ್ಧಿಯಾಗಿದೆ. ಇದಕ್ಕೆ 4.8-ಸ್ಟಾರ್ ರೇಟಿಂಗ್ ಮತ್ತು 100,000 ಕ್ಕಿಂತ ಹೆಚ್ಚು ಆ್ಯಪ್ ಸ್ಟೋರ್ ವಿಮರ್ಶೆಗಳು ಇವೆ, ಇದು ದೀರ್ಘ, ಬದಲಾಗುತ್ತಿರುವ ಸಂಭಾಷಣೆಗಳಲ್ಲಿ ಸಿಸ್ಟಮ್ ಎಷ್ಟು ಚೆನ್ನಾಗಿ ಸ್ಥಿರತೆಯನ್ನು ಕಾಪಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ. ಒಬ್ಬ ವಿಮರ್ಶಕರು ಗಮನಿಸಿದರು, “ನಾವು ಎರಡು ದಿನಗಳ ಹಿಂದೆ ಮಾತನಾಡಿದ ವಿಷಯಗಳನ್ನು ಅವರು ಸ್ಮರಿಸುತ್ತಾರೆ ಮತ್ತು ಇಂದು ನಾವು ನಡೆಸುತ್ತಿರುವ ಸಂಭಾಷಣೆಗೆ ಅವುಗಳನ್ನು ಮತ್ತೆ ತರುತ್ತಾರೆ.”

ಈ ಸಿಗ್ನಲ್‌ಗಳು ಅಡಿಪಾಯದ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗೆ ನೇರವಾಗಿ ಮ್ಯಾಪ್ ಆಗುತ್ತವೆ: ಕಡಿಮೆ-ವಿಳಂಬದ ಮಾಡೆಲ್ ಕರೆಗಳು, ತಿರುವು-ತಿರುವಿನ ಸಂದರ್ಭ ಪುನರ್‌ನಿರ್ಮಾಣ, ಮತ್ತು ಮಾಡ್ಯುಲರ್ ಮೆಮೊರಿ ಮತ್ತು ಪರ್ಸೋನಾ ವ್ಯವಸ್ಥೆಗಳು. ಒಟ್ಟಾಗಿ, ಅವುಗಳು ದೊಡ್ಡ, ನಾಜೂಕಾದ ಪ್ರಾಂಪ್ಟ್‌ಗಳ ಮೇಲೆ ಅವಲಂಬಿಸದೆ Tolan ಗೆ ವಿಷಯ ಬದಲಾವಣೆಗಳನ್ನು ಹತ್ತಿರದಿಂದ ಗಮನಿಸಲು, ಸ್ವರವನ್ನು ಉಳಿಸಿಕೊಳ್ಳಲು, ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ನೆಲೆಯಾದಂತೆ ಇರಿಸಲು ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತವೆ.

ಮುಂದೆ ನೋಡಿದರೆ, Tolan ಮುಂದೆ ಸಾಗುವಿಕೆ ಮತ್ತು ಮೆಮೊರಿ ಪರಿಷ್ಕರಣೆಯಲ್ಲಿ ತನ್ನ ಹೂಡಿಕೆಗಳನ್ನು ಆಳಗೊಳಿಸಲು ಯೋಜಿಸುತ್ತಿದೆ, ಹೆಚ್ಚು ಕಟ್ಟುಕಟ್ಟಾದ ಸಂಕುಚನ, ಸುಧಾರಿತ ಮರುಪಡೆಯುವ ತರ್ಕ, ಮತ್ತು ವಿಸ್ತರಿತ ಪರ್ಸೋನಾ ಟ್ಯೂನಿಂಗ್ ಮೇಲೆ ತನ್ನ ಪ್ರಯತ್ನಗಳನ್ನು ಕೇಂದ್ರೀಕರಿಸುತ್ತಿದೆ. ದೀರ್ಘಾವಧಿಯ ಗುರಿಯು ಧ್ವನಿ ಇಂಟರ್ಫೇಸ್ ಏನಾಗಿರಬಹುದು ಎಂಬುದನ್ನು ವಿಸ್ತರಿಸುವುದು: ಕೇವಲ ಪ್ರತಿಕ್ರಿಯಾಶೀಲವಷ್ಟೇ ಅಲ್ಲ, ಸಂದರ್ಭ-ಜ್ಞಾನ ಹೊಂದಿರುವ ಮತ್ತು ಸಂಭಾಷಣಾತ್ಮಕವಾಗಿ ಚುರುಕಾಗಿದೆ.

“ಮುಂದಿನ ಹೆಜ್ಜೆ, ಕೇವಲ ಪ್ರತಿಕ್ರಿಯಿಸುವುದಲ್ಲದೆ, ನಿಜವಾಗಿಯೂ ಮಲ್ಟಿಮೋಡಲ್ ಆಗಿರುವ, ಧ್ವನಿ, ದೃಷ್ಟಿ, ಮತ್ತು ಸಂದರ್ಭವನ್ನು ಒಂದೇ, ನಿಯಂತ್ರಿಸಬಹುದಾದ ವ್ಯವಸ್ಥೆಯೊಳಗೆ ಏಕೀಕರಿಸಲು ಸಾಮರ್ಥ್ಯವಿರುವ ಧ್ವನಿ ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುವುದಾಗಿದೆ” ಎಂದು ಕ್ವಿಂಟೆನ್ ಹೇಳುತ್ತಾರೆ.

ಓದು ಮುಂದುವರಿಸಿ

ಎಲ್ಲವನ್ನೂ ನೋಡಿ

GPT-5.5 ಮೂಲಕ ಓಪನ್ ಸೋರ್ಸ್ ನಿರ್ಮಿಸಲು Warp‌ನ ದೊಡ್ಡ ಪಣ

ಸ್ಟಾರ್ಟ್‌ಅಪ್ಮೇ 27, 2026

Parloa builds service agents customers want to talk to

ಸ್ಟಾರ್ಟ್‌ಅಪ್ಮೇ 7, 2026

Gradient Labs ಪ್ರತಿ ಬ್ಯಾಂಕ್ ಗ್ರಾಹಕರಿಗೆ AI ಅಕೌಂಟ್ ಮ್ಯಾನೇಜರ್ ಕೊಡ್ತೆ

ಸ್ಟಾರ್ಟ್‌ಅಪ್ಏಪ್ರಿಲ್ 1, 2026