Léim go dtí an príomhábhar
OpenAI

29 Márta 2024

Táirge

Dúshláin agus Deiseanna Guthanna Sintéiseacha a Nascleanúint

Táimid ag roinnt ceachtanna ó réamhamharc ar scála beag ar Voice Engine, samhail chun guthanna saincheaptha a chruthú.

Ag lódáil…

Tá OpenAI tiomanta do IS shábháilte agus thairbheach go forleathan a fhorbairt. Inniu táimid ag roinnt léargas agus torthaí tosaigh ó réamhamharc ar scála beag ar shamhail darb ainm Voice Engine, a úsáideann ionchur téacs agus sampla fuaime aonair 15 shoicind chun caint nádúrtha a ghiniúint atá an-chosúil leis an gcainteoir bunaidh. Is suntasach gur féidir le samhail bheag le sampla aonair 15 shoicind guthanna mothúchánacha agus réalaíocha a chruthú.

D’fhorbraíomar Voice Engine den chéad uair go déanach in 2022, agus d’úsáideamar é chun na guthanna réamhshocraithe atá ar fáil san API téacs-go-caint(osclaíonn i bhfuinneog nua) a chumhachtú chomh maith le ChatGPT Voice and Read Aloud. Ag an am céanna, táimid ag glacadh cur chuige cúramach eolasach i leith scaoileadh níos leithne mar gheall ar an bhféidearthacht go mbainfí mí-úsáid as guth sintéiseach. Tá súil againn idirphlé a thosú faoi imscaradh freagrach guthanna sintéiseacha, agus faoin gcaoi ar féidir leis an tsochaí oiriúnú do na cumais nua seo. Bunaithe ar na comhráite seo agus ar thorthaí na dtástálacha beaga seo, déanfaimid cinneadh níos eolaí faoi cé acu ar cheart agus conas an teicneolaíocht seo a imscaradh ar scála mór.

Feidhmchláir luatha de Voice Engine

Chun úsáidí féideartha na teicneolaíochta seo a thuiscint níos fearr, thosaigh muid á tástáil go príobháideach le grúpa beag comhpháirtithe iontaofa go déanach anuraidh. Táimid an-tógtha leis na feidhmchláir atá forbartha ag an ngrúpa seo. Tá na himscaradh beagscála seo ag cabhrú lenár gcur chuige, lenár gcosaintí, agus lenár smaointeoireacht maidir leis an gcaoi a bhféadfaí Voice Engine a úsáid ar mhaithe leis an leas i dtionscail éagsúla. I measc roinnt samplaí luatha tá:

  • Cúnamh léitheoireachta a chur ar fáil do dhaoine nach léann agus do pháistí trí ghuthanna nádúrtha mothúchánacha a léiríonn réimse níos leithne cainteoirí ná mar is féidir le guthanna réamhshocraithe. Tá Age of Learning(osclaíonn i bhfuinneog nua), cuideachta teicneolaíochta oideachais atá tiomnaithe do rath acadúil páistí, ag úsáid é seo chun ábhar réamhscriptithe guthaithe a ghiniúint. Úsáideann siad Voice Engine agus GPT‑4 freisin chun freagraí pearsantaithe fíor-ama a chruthú chun idirghníomhú le mic léinn. Leis an teicneolaíocht seo, bhí Age of Learning in ann níos mó ábhair a chruthú do lucht féachana níos leithne.
  • Ábhar a aistriú, amhail físeáin agus podchraoltaí, ionas gur féidir le cruthaitheoirí agus le gnólachtaí teacht ar níos mó daoine ar fud an domhain, go líofa agus lena nguthanna féin. Is é HeyGen(osclaíonn i bhfuinneog nua) duine de na luath-uchtaitheoirí anseo, ardán amhairc scéalaíochta IS a oibríonn lena chustaiméirí fiontair chun avataranna saincheaptha daonnúla a chruthú do réimse ábhair, ó mhargaíocht táirgí go taispeántais díolacháin. Úsáideann siad Voice Engine le haghaidh aistriúchán físe, ionas gur féidir leo guth cainteora a aistriú go iliomad teangacha agus lucht féachana domhanda a bhaint amach. Nuair a úsáidtear é le haghaidh aistriúcháin, caomhnaíonn Voice Engine blas dúchais an chainteora bhunaidh: mar shampla, dá nginfí Béarla le sampla fuaime ó chainteoir Fraincise, chruthófaí caint le blas Francach.
Ag lódáil...
  • Teacht ar phobail dhomhanda, trí sholáthar seirbhísí riachtanacha a fheabhsú i suíomhanna iargúlta. Tá Dimagi(osclaíonn i bhfuinneog nua) ag tógáil uirlisí d’oibrithe sláinte pobail chun éagsúlacht seirbhísí riachtanacha a sholáthar, amhail comhairleoireacht do mháithreacha atá ag beathú cíche. Chun cabhrú leis na hoibrithe seo a scileanna a fhorbairt, úsáideann Dimagi Voice Engine agus GPT‑4 chun aiseolas idirghníomhach a thabhairt i bpríomhtheanga gach oibrí, lena n-áirítear Svahaílis nó teangacha níos neamhfhoirmiúla cosúil le Sheng, teanga mheasctha chóid a bhfuil tóir uirthi sa Chéinia.
Ag lódáil...
  • Tacaíocht do dhaoine nach bhfuil in ann labhairt, amhail feidhmchláir theiripeacha do dhaoine a bhfuil riochtaí acu a chuireann isteach ar an gcaint agus feabhsuithe oideachais dóibh siúd a bhfuil riachtanais foghlama acu. Cumhachtaíonn Livox(osclaíonn i bhfuinneog nua), aip chumarsáide mhalartaí IS, gléasanna Cumarsáide Breisithe agus Malartaí (AAC) a chuireann ar chumas daoine faoi mhíchumas cumarsáid a dhéanamh. Trí Voice Engine a úsáid, is féidir leo guthanna uathúla neamh-róbatacha a thairiscint do dhaoine nach bhfuil in ann labhairt, i mórán teangacha. Is féidir lena n-úsáideoirí an chaint a roghnú is fearr a léiríonn iad, agus d’úsáideoirí ilteangacha, guth comhsheasmhach a choinneáil thar gach teanga labhartha.
Ag lódáil...
  • Cabhrú le hothair a nguth a aisghabháil, dóibh siúd atá ag fulaingt ó riochtaí cainte tobanna nó meathlúcháin. Tá Institiúid Néareolaíochtaí Norman Prince ag Lifespan(osclaíonn i bhfuinneog nua), córas sláinte neamhbhrabúis atá mar phríomh-chleamhnaithe teagaisc do scoil leighis Ollscoil Brown, ag fiosrú úsáidí IS i gcomhthéacsanna cliniciúla. Tá clár píolótach ar siúl acu a thairgeann Voice Engine do dhaoine a bhfuil lagú cainte orthu de dheasca cúiseanna oinceolaíocha nó néareolaíocha. Toisc nach dteastaíonn ach sampla fuaime an-ghearr ó Voice Engine, bhí na dochtúirí Fatima Mirza, Rohaid Ali agus Konstantina Svokos in ann guth othair óig a chur ar ais a chaill a cuid cainte líofa de bharr siada inchinne soithíoch, ag úsáid fuaime ó fhíseán a taifeadadh do thionscadal scoile.
Ag lódáil...

Voice Engine a thógáil go sábháilte

Aithnímid go bhfuil rioscaí tromchúiseacha ag baint le caint a ghiniúint atá cosúil le guthanna daoine, agus bíonn siad sin chun tosaigh inár n-intinn go háirithe i mbliain toghcháin. Táimid i mbun teagmhála le comhpháirtithe sna Stáit Aontaithe agus go hidirnáisiúnta ó réimsí an rialtais, na meán, na siamsaíochta, an oideachais, na sochaí sibhialta agus eile lena chinntiú go bhfuilimid ag cur a n-aiseolais san áireamh agus muid ag tógáil. Tá na comhpháirtithe atá ag tástáil Voice Engine inniu tar éis glacadh lenár bpolasaithe úsáide, a chuireann cosc ar dhuine nó eagraíocht eile a phearsanú gan toiliú ná ceart dlíthiúil. Ina theannta sin, ceanglaíonn ár dtéarmaí leis na comhpháirtithe seo toiliú sainráite feasach ón gcainteoir bunaidh agus ní cheadaímid d’fhorbróirí bealaí a thógáil d’úsáideoirí aonair chun a nguthanna féin a chruthú. Ní mór do chomhpháirtithe a nochtadh go soiléir dá lucht éisteachta gur le IS a gineadh na guthanna atá siad ag cloisteáil. Ar deireadh, tá sraith beart sábháilteachta curtha i bhfeidhm againn, lena n-áirítear comhartha uisce chun bunús aon fhuaime a ghineann Voice Engine a rianú, chomh maith le monatóireacht réamhghníomhach ar an gcaoi a bhfuil sé á úsáid. Creidimid gur cheart go mbeadh eispéiris fíordheimhnithe gutha ag gabháil le haon imscaradh leathan de theicneolaíocht gutha sintéisigh a fhíoraíonn go bhfuil an cainteoir bunaidh ag cur a ghutha leis an tseirbhís go feasach agus liosta guthanna toirmiscthe a bhraitheann agus a choisceann cruthú guthanna atá róchosúil le daoine mór le rá.

Ag féachaint chun cinn

Is leanúint é Voice Engine dár dtiomantas an teorainn theicniúil a thuiscint agus an méid atá ag éirí indéanta le IS a roinnt go hoscailte. Ag teacht lenár gcur chuige i leith shábháilteacht IS agus lenár ngealltanais dheonacha, táimid ag roghnú réamhamharc a thabhairt ar an teicneolaíocht seo anois ach gan í a scaoileadh go forleathan ag an am seo. Tá súil againn go gcuirfidh an réamhamharc seo ar Voice Engine béim ar a acmhainneacht agus go spreagfaidh sé freisin an gá le hathléimneacht shochaíoch a neartú i gcoinne na ndúshlán a eascraíonn as samhlacha giniúna atá níos diongbháilte de shíor. Go sonrach, molaimid céimeanna mar seo:

  • Deireadh céimneach a chur le fíordheimhniú guthbhunaithe mar bheart slándála chun cuntais bhainc agus faisnéis íogair eile a rochtain
  • Polasaithe a fhiosrú chun úsáid ghuthanna daoine aonair in IS a chosaint
  • Oideachas a chur ar an bpobal chun cumais agus teorainneacha theicneolaíochtaí IS a thuiscint, lena n-áirítear an fhéidearthacht go mbeadh ábhar mealltach IS ann
  • Forbairt agus glacadh teicnící a luathú chun bunús ábhair chlosamhairc a rianú, ionas go mbeidh sé soiléir i gcónaí an bhfuil tú ag idirghníomhú le duine fíor nó le IS

Tá sé tábhachtach go dtuigfeadh daoine ar fud an domhain cén treo ina bhfuil an teicneolaíocht seo ag dul, cibé acu a imscarann muid go forleathan í sa deireadh nó nach n-imscarann. Táimid ag tnúth le leanúint dár rannpháirtíocht i gcomhráite faoi dhúshláin agus deiseanna guthanna sintéiseacha le lucht déanta beartas, taighdeoirí, forbróirí agus daoine cruthaitheacha.