U bood nuxurka ugu muhiimsan
OpenAI

Juun 7, 2024

Badqabka

Faahfaahin dheeraad ah oo ku saabsan sida Voice Engine u shaqeeyo iyo cilmi-baaristayada amniga

Sahaminta tignoolajiyada ka dambeysa noocayaga qoraal-ilaa-hadal.

Sawir rinjiyeyn abstrakt ah oo leh isku-dar midabbo pastel ah, oo ay ku jiraan casaan, oranji, guduud, iyo cagaar, kuna eg muuqaal dhul firfircoon.
Soo kacaya…

Waxaan bixinaynaa faham dheeraad ah oo ku saabsan sida Voice Engine u shaqeeyo iyo cilmi-baaristayada amniga si qof walba ula socdo horumarkayaga. Voice Engine waa nooc awood u leh samaynta codad gaar ah.

Waa muhiim in dadka adduunka oo dhan ay fahmaan halka tignoolajiyadani u socoto, haddii ugu dambayn aan si ballaaran annagu u daahfurno ama aanan sidaas yeelin. Taas ayaana sabab u ah inaan rabno inaan sharaxno sida noocu u shaqeeyo, sida aan ugu isticmaalno cilmi-baaris iyo waxbarasho, iyo sida aan uga hirgelinayno tallaabooyinkayaga amniga hareerihiisa. Voice Engine weli si ballaaran looma heli karo.

Sida Voice Engine u shaqeeyo

Awoodda codka waxaa awood siiya nooc qoraal-ilaa-hadal (TTS) ah, kaas oo awood u leh inuu ka abuuro maqal u eg bani'aadam qoraal keliya iyo muunad hadal oo 15-ilbiriqsi ah. 

Nidaamka TTS waxaa la horumariyaa iyadoo laga caawinayo nooca inuu fahmo faahfaahinta hadalka iyada oo la adeegsanayo maqal iyo qoraal-rogid is barbar socda. Noocu wuxuu bartaa inuu saadaaliyo dhawaaqyada ugu badan ee suuragalka ah ee qof hadlaya uu samayn doono marka la siiyo qoraal gaar ah, isagoo tixgelinaya codad kala duwan, lahjado, iyo hababka hadalka. Intaas ka dib, noocu wuxuu abuuri karaa ma aha oo keliya noocyada la hadlo ee qoraalka, balse sidoo kale weedho la hadlo oo ka tarjumaya sida noocyo kala duwan oo dad hadlayaa ay u odhan lahaayeen.

Halkaas kadib, samaynta maqal iyadoo la adeegsanayo nooca TTS waxay u baahan tahay oo keliya muunad 15-ilbiriqsi ah oo ka timid qofka hadlaya iyo qoraalka u dhigma. Nooca looma sameeyo fine-tuning gaar u ah qof hadle oo cayiman, mana jiro wax habayn nooc ah oo ku lug leh. Halkii, wuxuu adeegsadaa hab diffusion ah, isagoo ka bilaabaya buuq aan kala sooc lahayn kadibna si tartiib tartiib ah u nadiifinaya si uu ugu ekaado sida qofka hadlaya ee muunadda maqalka 15-ilbiriqsiga ahi uu u odhan lahaa qoraalka.

Waxaan horumarinaynay noocan in ka badan hal sano

Waxaan markii ugu horreysay horumarinay Voice Engine dabayaaqadii 2022. Bilowgii hore, si aan u qiimeyno awoodaha iyo xaddidaadaha nooca Voice Engine, waxaan gudaha ku tijaabinay annagoo adeegsanayna isku-dar muunado cod oo dadweyne iyo kuwo gaar loo leeyahay. Noocan gudaha ah wuxuu muhiim u ahaa cilmi-baaristayada iswaafajinta iyo amniga, isagoo hagay tallaabooyinkayaga ilaalinta, waana sii wadidda ballanqaadkeenna ah inaan fahanno xadka tignoolajiyada ugu casriyeysan.

Muhiim ahaan, wax-soo-saarradan waxaa loo qoondeeyay tijaabo gudaha ah, loogumana isticmaalin tababarka noocyada awooda siiya badeecooyinkayaga.

Iyada oo qayb ka ah qaab-dhismeedkayaga dejinta soo noqnoqda, noocan hore wuxuu sidoo kale door qiimo leh ka qaatay ka caawinta dejiyeyaasha siyaasadda inay fahmaan awoodaha noocyada codka synthetic-ka ah. Tusaale ahaan, laga bilaabo xagaagii hore waxaan tusnay dejiyeyaasha siyaasadda caalamiga ah ee heerarka ugu sarreeya awoodda tignoolajiyadan, waxaana kala hadalnay khataraha la xiriira. 

Bishii Sebtembar 2023, waxaan u adeegsanay Voice Engine inuu awood siiyo astaanta qaabka codka ee ChatGPT. Maadaama awoodahani sidoo kale soo bandhigeen khataro cusub, waxaan u daahfurnay oo keliya kiiskan isticmaalka gaarka ah. Qaabka codka waxaa laga sameeyay oo keliya codad dhab ah, si taxaddar leh loo doortay iyada oo loo marayo hannaan faahfaahsan oo bilaabmay May 2023 kaas oo ku lug lahaa jilayaal cod oo xirfadlayaal ah, wakaalado hibbo, agaasimayaal xulasho, iyo la-taliyeyaal warshadeed.

Bishii Noofembar 2023, waxaan sii deynay TTS API(ku furmaa daaqad cusub) fudud oo uu sidoo kale awood siiyo Voice Engine. Waxaan doorannay sii-deyn kale oo xaddidan halkaas oo aan la shaqeynay jilayaal cod oo xirfadlayaal ah si aan u abuurno muunado maqal ah oo 15-ilbiriqsi ah si ay u awood siiyaan mid kasta oo ka mid ah lixda cod ee hore loo dejiyey ee API-ga. Horumariyayaashu waxay ku dhex dari karaan tan mareegahooda si ay tusaale ahaan qoraallada blog-ga cod ugu akhriyaan.

Bishii Maarso ee sanadkan, waxaan muunad ahaan u tusnay awoodda Voice Engine ee samaynta codad gaar ah koox yar oo lammaane lagu kalsoon yahay. Hindisahan wuxuu ujeedkiisu ahaa in kor loo qaado wacyiga ku saabsan awoodaha codadka synthetic-ka ah iyo in la taageero yoolalkan soo socda:

  • In si tartiib tartiib ah looga takhaluso xaqiijinta ku saleysan codka oo ah cabbir amni oo lagu galo akoonnada bangiyada iyo macluumaad kale oo xasaasi ah
  • Sahaminta siyaasad lagu ilaalinayo isticmaalka codadka shakhsiyaadka ee AI
  • Waxbaridda dadweynaha si ay u fahmaan awoodaha iyo xaddidaadaha tignoolajiyada AI, oo ay ku jirto suurtagalnimada nuxur AI ah oo khiyaano leh
  • Dardargelinta horumarinta iyo qaadashada farsamooyinka lagu raadraaco halka uu ka yimid nuxurka maqal-muuqaalka ah, si had iyo jeer ay u caddaato marka aad la falgalayso qof dhab ah ama AI

Dejintan yaryar ayaa sidoo kale naga caawinaya inay hagaan habkeenna, tallaabooyinka ilaalinta, iyo fikirkeenna ku saabsan sida Voice Engine loogu adeegsan karo wanaag warshado kala duwan.

In si ammaan ah loo dhiso Voice Engine waa mudnaan sare

Waxaan sii wadeynaa la shaqeynta lammaanayaal Maraykan iyo caalami ah oo ka kala socda dowladda, warbaahinta, madadaalada, waxbarashada, bulshada rayidka ah iyo meelo kale si aan u hubinno inaan ku darayno jawaab-celintooda inta aan wax dhisayno.

Lammaanayaasha tijaabinaya Voice Engine waxay ku heshiiyeen siyaasado isticmaal oo mamnuucaya isu-ekeysiin aan oggolaansho lahayn una baahan oggolaansho cad oo ka yimaada qofkii asalka ahaa ee hadlay, sidoo kalena u baahan in cod kasta oo AI-abuuray loo sheego dhageystayaasha inuu sidaas yahay. Intaa waxaa dheer, tallaabooyinka amni sida watermarking iyo kormeer firfircoon ayaa jira si loo raadraaco loona kormeero isticmaalka tignoolajiyada.

Amniga mustaqbalka ee codadka synthetic-ka ah

Omnimodellada sida GPT‑4o, oo leh awoodo maqal oo asal ah, waxay suurageliyaan isdhexgallo cusub oo noocyadii hore sida Voice Engine aysan karin. Waxaan sidoo kale aqoonsannahay in qaabka maqalka ee GPT‑4o uu keenayo khataro cusub oo dhowr ah, gaar ahaan samaynta codka. Waxaan si firfircoon ugu sameyneynaa red-teaming GPT‑4o si aan u aqoonsanno oo wax uga qabanno khataraha la yaqaan iyo kuwa aan la sii odorosin ee dhinacyo kala duwan sida cilmi-nafsiga bulshada, eexda iyo caddaaladda, iyo macluumaad khaldan. Waxaan dhisaynaa lakabyo badan oo yarayn ah sida hagaajinta dabeecadaha nooca, waafajinta nidaamyada qoraal-ku-saleysan ee jira qaab-dhismeedka GPT‑4o, iyo samaynta kala-saarayaal cusub.

Iyadoo waafaqsan habkayaga taxaddarka leh ee sii deynta Voice Engine, waxaan ku xaddidi doonnaa wax-soo-saarka maqalka ee GPT‑4o xulasho codad hore loo dejiyey ah marka si guud loo sii daayo. Codadkan waxaa laga helay jilayaal cod oo xirfadlayaal ah oo lagu doortay hannaan xulasho oo si taxaddar leh looga fiirsaday. Waxaan wadaagi doonnaa macluumaad dheeraad ah oo ku saabsan khataraha la xiriira maqalka iyo yareyntooda kaarka siistamka ee GPT‑4o ee soo socda.

Qoraa

OpenAI