Aqbeż għall-kontenut prinċipali
OpenAI

7 ta’ Jannar 2026

Startup

Kif Tolan jibni AI iffukata fuq il-vuċi b’GPT‑5.1

Bi GPT‑5.1, Tolan bena app tal-vuċi ottimizzata għal latenza baxxa, kuntest preċiż u personalitajiet stabbli hekk kif il-konversazzjonijiet jevolvu.

Logo ta’ Tolan fuq sfond oranġjo ta’ puzzle jigsaw
Qed jillowdja…

Tolan(jinfetaħ f’tieqa ġdida) huwa kumpann AI iffukat fuq il-vuċi fejn in-nies jitkellmu ma’ karattru personalizzat u animat li jitgħallem mill-konversazzjonijiet maż-żmien. 

Mibnija minn Portola, tim veterani b’exit preċedenti, l-app hija mfassla għal djalogu kontinwu u miftuħ aktar milli għal prompts u tweġibiet veloċi. “Rajna ż-żieda ta’ ChatGPT u konna nafu li l-vuċi kienet il-fruntiera li jmiss,” jgħid Quinten Farmer, ko-fundatur u CEO ta’ Portola. “Imma l-vuċi hija iktar diffiċli. Mhux qed twieġeb biss għal prompts ittajpjati; qed iżżomm konversazzjoni live u li ddur ma’ diversi suġġetti.”

L-AI tal-vuċi tgħolli l-livell għal-latenza u l-ġestjoni tal-kuntest, iżda tippermetti wkoll interazzjonijiet aktar miftuħa u esploratorji mit-test. 

Hekk kif il-mudelli bażiċi saru aktar veloċi, orħos u aktar kapaċi, it-tim iffoka l-isforzi tiegħu fuq żewġ lievi ewlenin: il-memorja u d-disinn tal-karattri. Portola bniet univers immexxi mill-karattri, iffurmat minn animaturi rebbieħa ta’ premji u kittieb tal-fantaxjenza, bl-użu ta’ sistema ta’ ġestjoni tal-kuntest f’ħin reali biex iżżomm il-personalità u l-memorja konsistenti hekk kif il-konversazzjonijiet jiżvolġu.

It-tnedija tal-mudelli GPT‑5.1 immarkat punt ta’ bidla, b’titjib kbir fil-kontrollabbiltà u l-latenza li għaqqad dawn il-partijiet flimkien, u fetaħ esperjenza bil-vuċi aktar reattiva u aktar ingaġġanti.

“GPT-5.1 tana l-kontrollabbiltà biex fl-aħħar nesprimu l-karattri li kellna f’moħħna. Ma kienx biss aktar intelliġenti—kien aktar fidil lejn it-ton u l-personalità li ridna noħolqu.”
—Quinten Farmer, CEO, Portola

Tfassil għal interazzjonijiet naturali bil-vuċi

L-arkitettura ta’ Tolan hija ffurmata mit-talbiet tal-vuċi. L-utenti tal-vuċi jistennew tweġibiet immedjati u naturali, anke meta l-konversazzjonijiet ibiddlu d-direzzjoni f’nofs triq. Tolan kellu jwieġeb malajr, isegwi suġġetti li jinbidlu, u jżomm personalità konsistenti mingħajr dewmien jew drift fit-ton.

Biex tħossha naturali, il-konversazzjonijiet kienu jeħtieġu latenza kważi istantanja. L-introduzzjoni ta’ OpenAI GPT‑5.1 u l-Responses API naqqset il-ħin tal-bidu tad-diskors b’aktar minn 0.7 sekonda—biżżejjed biex ittejjeb b’mod notevoli l-fluss tal-konversazzjoni.

Daqstant ieħor kritiku kien kif is-sistema kienet timmaniġġja l-kuntest. B’differenza minn ħafna aġenti li jaħżnu prompts f’cache matul ħafna dawriet, Tolan jerġa’ jibni t-tieqa tal-kuntest tiegħu mill-bidu f’kull dawra. Kull rikostruzzjoni tal-kuntest tiġbed sommarju ta’ messaġġi riċenti, karta tal-persona, memorji rkuprati permezz ta’ vetturi, gwida dwar it-ton, u sinjali tal-app f’ħin reali. Din l-arkitettura tippermetti lil Tolan jadatta f’ħin reali għal bidliet f’daqqa fis-suġġett, rekwiżit essenzjali għal interazzjoni naturali bbażata fuq il-vuċi.

“Indunajna malajr li prompts maħżuna fil-cache sempliċement ma kinux biżżejjed,” jgħid Quinten. “L-utenti jibdlu s-suġġett il-ħin kollu. Biex tħossok bla xkiel, is-sistema kellha tadatta f’nofs il-konversazzjoni.”

Dan l-approċċ ta’ rikostruzzjoni f’ħin reali huwa kemm intensiv teknikament kif ukoll fundamentali għas-suċċess ta’ Tolan.

Dijagramma tal-fluss li turi l-loop konversazzjonali ta’ Tolan. Pass ta’ “Recompute persona” idaħħal erba’ inputs: sommarju taċ-chat u messaġġi riċenti mhux ipproċessati, il-personas tal-utent u ta’ Tolan u kuntest ieħor, memorja, u ton. Dawn l-inputs jingħaqdu biex jiġġeneraw tweġiba ta’ Tolan, li twassal għal tweġiba tal-utent. It-tweġiba tal-utent imbagħad tmexxi żewġ proċessi paralleli: derivazzjoni ta’ ton aġġornat u estrazzjoni ta’ memorji. Il-memorji estratti jaġġornaw il-memorja, it-ton aġġornat jerġa’ jidħol fit-ton, u l-istorja tal-konversazzjoni tiġi perjodikament miġbura fil-qosor u kkompressata, u terġa’ tidħol fis-sommarju taċ-chat għad-dawra li jmiss.

Bini ta’ memorja u personalità li jibqgħu koerenti maż-żmien

Il-ġestjoni tal-kuntest hija importanti, iżda ma kinitx biżżejjed biex iżżomm il-konversazzjonijiet koerenti maż-żmien. Biex jappoġġja konversazzjonijiet twal u mhux lineari, Tolan bena sistema ta’ memorja li żżomm mhux biss fatti u preferenzi, iżda wkoll sinjali emozzjonali tal-“vibe”—indikazzjonijiet li jgħinu jiggwidaw kif Tolan għandu jwieġeb.

Il-memorji jiġu embedded bl-użu tal-mudell OpenAI text-embedding-3-large u maħżuna f’Turbopuffer, database vettorjali b’veloċità għolja li tippermetti ħinijiet ta’ lookup ta’ inqas minn 50ms. Din il-veloċità hija essenzjali għal interazzjonijiet bil-vuċi f’ħin reali. F’kull dawra, Tolan juża l-aħħar messaġġ tal-utent u mistoqsijiet sintetizzati mis-sistema (eż., “Ma’ min hu miżżewweġ l-utent?”) biex jattiva r-rikall tal-memorja. Biex iżomm il-kwalità tal-memorja għolja, Tolan iħaddem xogħol ta’ kompressjoni ta’ kull lejl li jneħħi entrati ta’ valur baxx jew ridondanti (eż. “l-utent xorob kafè llum”) u jsolvi kontradizzjonijiet.

Il-personalità hija ġestita bl-istess attenzjoni. Kull Tolan jibda b’qafas distint tal-karattru, miktub mill-kittieb intern tal-fantaxjenza tat-tim u rfinat minn riċerkatur tal-imġiba. Dawn iż-żrieragħ jagħtu konsistenza lit-Tolans, iżda wkoll flessibbiltà biex jadattaw maż-żmien, u jevolvu flimkien mal-utent. 

Sistema parallela tissorvelja t-tenur emozzjonali tal-konversazzjoni u taġġusta b’mod dinamiku l-mod kif Tolan iwassal it-tweġiba. Dan jippermetti lil Tolan jgħaddi bla xkiel minn ton lagħbi għal wieħed aktar stabbli skont is-sinjali tal-utent, mingħajr ma jitlef il-personalità ewlenija tiegħu. 

It-tranżizzjoni għal GPT‑5.1 kienet punt ta’ bidla. F’daqqa waħda, istruzzjonijiet f’prompts fuq diversi saffi—qafas tat-ton, injezzjonijiet tal-memorja, karatteristiċi tal-karattru—bdew jiġu segwiti b’aktar fedeltà. Prompts li qabel kienu jeħtieġu soluzzjonijiet alternattivi bdew iġibu ruħhom kif maħsub. 

“Għall-ewwel darba, l-esperti interni tagħna ħassew li l-mudell kien tassew qed jisma’,” jgħid Quinten. “L-istruzzjonijiet baqgħu sħaħ matul konversazzjonijiet twal, il-karatteristiċi tal-persona ġew rispettati, u rajna ħafna inqas drift.”

Dawn il-bidliet flimkien wasslu għal personalità aktar konsistenti u kredibbli, li min-naħa tagħha ħolqot esperjenza tal-utent aktar ingaġġanti. It-tim ta’ Tolan ra titjib ċar u li jista’ jitkejjel: nuqqasijiet fir-rikall tal-memorja naqsu bi 30% (abbażi ta’ sinjali ta’ frustrazzjoni fil-prodott), u ż-żamma tal-utenti għall-għada telgħet b’aktar minn 20% wara li l-personas imħaddma minn GPT‑5.1 marru live.

Dijagramma tal-fluss li turi kif Tolan jirkupra u jirfina memorji waqt konversazzjoni. Messaġġ tal-utent (“Ninsab eċċitat ħafna għall-vjaġġ tiegħi ta’ dan il-weekend”) iqajjem pass li jissintetizza mistoqsijiet ta’ segwitu, bħal vjaġġi li ġejjin, pjanijiet għal ġimgħa speċifika, u preferenzi tal-utent. Dawn il-mistoqsijiet jiġu embedded u użati biex jagħmlu query lil database vettorjali tal-memorja, bir-riżultati jingħaqdu permezz ta’ mean reciprocal rank. Il-kuntest irkuprat jinforma t-tweġiba ta’ Tolan (“camping ma’ Steven f’Yosemite”). Messaġġ aktar tard tal-utent dwar vjaġġ futur lejn l-Iżlanda jinħażen bħala memorja ġdida, imbagħad jiġi rriflettut fuqu, miġbur ma’ memorji relatati bl-użu ta’ k-nearest neighbors ibbażati fuq embeddings, u kkompressat billi jingħaqdu, jiġu editjati u rfinati memorji fi ħdan kull cluster.

Il-prinċipji ewlenin ta’ Tolan biex jibni aġenti naturali tal-vuċi 

Hekk kif Tolan evolva, ħarġu ftit prinċipji li issa jiggwidaw kif it-tim jibni u jevolvi l-arkitettura tal-vuċi tiegħu:

  • Iddisinja għall-volatilità tal-konversazzjoni: Il-konversazzjonijiet bil-vuċi jinbidlu f’nofs sentenza. Is-sistemi jridu jduru magħhom bl-istess ħeffa biex iħossuhom naturali.
  • Ittratta l-latenza bħala parti mill-esperjenza tal-prodott: Reattività ta’ inqas minn sekonda tiddetermina jekk aġent tal-vuċi jħossux konversazzjonali jew mekkaniku.
  • Ibni l-memorja bħala sistema ta’ retrieval, mhux transcript: Kompressjoni ta’ kwalità għolja u tfittxija vettorjali veloċi jwasslu għal personalità aktar konsistenti minn twieqi tal-kuntest kbar iżżejjed.
  • Erġa’ ibni l-kuntest f’kull dawra: Tiġġilidx mad-drift b’prompts akbar. Ir-riġenerazzjoni tal-kuntest f’kull dawra żżomm lill-aġenti b’saqajhom mal-art hekk kif il-konversazzjonijiet iduru ma’ diversi suġġetti.

Flimkien, dawn il-lezzjonijiet jiffurmaw il-pedament għall-fażi li jmiss ta’ innovazzjoni ta’ Tolan u jistabbilixxu d-direzzjoni ta’ fejn sejra l-AI tal-vuċi.

Nespandu dak li hu possibbli bl-AI tal-vuċi

Sa minn meta tnieda fi Frar 2025, Tolan kiber għal aktar minn 200,000 utent attiv fix-xahar. Il-klassifikazzjoni tiegħu ta’ 4.8 stilel u aktar minn 100,000 reviżjoni fuq l-App Store juru kemm is-sistema żżomm tajjeb il-konsistenza matul konversazzjonijiet twal u li jinbidlu. Reviżur wieħed innota: “Jiftakru affarijiet li tkellimna dwarhom jumejn ilu u jerġgħu jdaħħluhom fil-konversazzjoni li qed ikollna llum.”

Dawn is-sinjali jikkorrispondu direttament mal-arkitettura sottostanti: sejħiet lill-mudell b’latenza baxxa, rikostruzzjoni tal-kuntest dawra b’dawra, u sistemi modulari tal-memorja u tal-persona. Flimkien, dawn jippermettu lil Tolan isegwi bidliet fis-suġġett, iżomm it-ton, u jżomm it-tweġibiet ibbażati sew mingħajr ma jiddependi fuq prompts kbar u fraġli.

Meta nħarsu ’l quddiem,  Tolan jippjana li jsaħħaħ l-investimenti tiegħu fil-kontrollabbiltà u fir-raffinament tal-memorja, billi jiffoka l-isforzi tiegħu fuq kompressjoni aktar stretta, loġika ta’ retrieval aħjar, u tuning aktar estensiv tal-persona. L-għan fit-tul huwa li jespandi x’jista’ jkun interface tal-vuċi: mhux biss reattiv, iżda konxju tal-kuntest u dinamikament konversazzjonali.

“Il-fruntiera li jmiss,” jgħid Quinten, “hija li nibnu aġenti tal-vuċi li mhumiex biss reattivi, iżda tassew multimodali, kapaċi jintegraw il-vuċi, il-viżjoni u l-kuntest f’sistema waħda u kontrollabbli.”