亚洲人成免费,国产精品色在线网站,亚洲精品久久久一线二线三线,国产欧美久久久,中文字幕av一区二区三区人,三级国产毛片,美女被麻豆免费网站

您當(dāng)前的位置是:  首頁(yè) > 新聞 > 國(guó)際 >
 首頁(yè) > 新聞 > 國(guó)際 >

語(yǔ)音合成技術(shù)已接近人類(lèi)語(yǔ)言水平

--DeepMind最新AI進(jìn)展

2016-09-13 15:02:26   作者:   來(lái)源:雷鋒網(wǎng)   評(píng)論:0  點(diǎn)擊:


  AlphaGo背后的谷歌人工智能部門(mén)DeepMind近日披露最新研究成果,其正在設(shè)法研發(fā)出更為接近人類(lèi)實(shí)際語(yǔ)言水平的機(jī)器語(yǔ)音合成系統(tǒng)。據(jù)說(shuō),這個(gè)被稱為Wave Net的新型人工智能系統(tǒng)是一種深層神經(jīng)網(wǎng)絡(luò),能通過(guò)抽樣現(xiàn)實(shí)中的人類(lèi)語(yǔ)言形成原始音頻波形,最后達(dá)到生成語(yǔ)音的目的。 
  從面向廣大英語(yǔ)和普通話聽(tīng)眾的測(cè)試中發(fā)現(xiàn),WaveNet的表現(xiàn)已經(jīng)優(yōu)于現(xiàn)有的語(yǔ)音合成系統(tǒng),但結(jié)果還是略遜于人類(lèi)真正的語(yǔ)言水平。
  目前的語(yǔ)音合成系統(tǒng)只有兩種工作方式:第一種是截取實(shí)際的講話錄音,然后打碎重組成新的語(yǔ)音——有點(diǎn)像綁架電話慣用的手段;另一種是依賴電腦合成,通過(guò)編程生成語(yǔ)音,這意味著它不需要預(yù)先錄制好語(yǔ)音材料,但是聽(tīng)起來(lái)的效果并不好,很像機(jī)器人。
  另一方面,WaveNet仍然使用真實(shí)的語(yǔ)音輸入,但通過(guò)學(xué)習(xí)和模仿來(lái)合成語(yǔ)音,而不是將其打破重組。項(xiàng)目的研究人員寫(xiě)道:“單單一個(gè)WaveNet就能以相同的保真度捕捉記錄下各個(gè)不同說(shuō)話者的特點(diǎn),并且可以任意切換聲音。”
  同樣令人印象深刻的是,它可以利用諸如唇部運(yùn)動(dòng)和人工呼吸來(lái)模擬語(yǔ)調(diào)、情緒和口音。如果這還不夠,WaveNet也許還能像鋼琴一樣彈奏樂(lè)曲,研究人員只需提供一些經(jīng)典片段,它就能創(chuàng)作出自己的作品。
  DeepMind在Twitter發(fā)文稱:“讓人類(lèi)和機(jī)器對(duì)話是人機(jī)交互領(lǐng)域長(zhǎng)久以來(lái)的夢(mèng)想”

專(zhuān)題