問(wèn):何先生對(duì)語(yǔ)音識(shí)別不同的應(yīng)用領(lǐng)域有什么想法?
何國(guó)濤:ASR技術(shù)可以應(yīng)用在很多領(lǐng)域:
·移動(dòng)互聯(lián)網(wǎng):盡管目前還沒(méi)有明晰獲利前景,但在未來(lái)卻有極大的市場(chǎng)潛能。這塊的競(jìng)爭(zhēng)已經(jīng)白熱化,許多實(shí)力玩家,像百度,騰訊,科大訊飛,云之聲,等等正在爭(zhēng)斗,未來(lái)還會(huì)有更多人加入進(jìn)來(lái)。
·企業(yè)呼叫中心:要進(jìn)入這個(gè)市場(chǎng),企業(yè)不僅要有領(lǐng)先的ASR語(yǔ)音識(shí)別技術(shù),同時(shí)還要有專(zhuān)業(yè)知識(shí)。普強(qiáng)則是這個(gè)領(lǐng)域的佼佼者。
·車(chē)載導(dǎo)航:這個(gè)領(lǐng)域ASR語(yǔ)音識(shí)別技術(shù)是必須的。銷(xiāo)售周期比較長(zhǎng),但是你一旦進(jìn)入這個(gè)市場(chǎng),你就擁有能做十年的客戶。
·教育領(lǐng)域:要有很強(qiáng)的政府背景和專(zhuān)業(yè)知識(shí)?拼笥嶏w在這塊有壓倒性的優(yōu)勢(shì)。
·聲紋識(shí)別領(lǐng)域:增強(qiáng)系統(tǒng)安全性能,這是今年語(yǔ)音識(shí)別的主要收入增長(zhǎng)點(diǎn)。
·醫(yī)療保健領(lǐng)域:應(yīng)用到電子病歷中,可自動(dòng)實(shí)現(xiàn)把醫(yī)生的聲音轉(zhuǎn)換成文本。這一領(lǐng)域也是若干發(fā)達(dá)國(guó)家在語(yǔ)音識(shí)別的主要收入領(lǐng)域。
由于擁有領(lǐng)先的語(yǔ)音識(shí)別技術(shù),普強(qiáng)已經(jīng)做好了進(jìn)入這些領(lǐng)域的準(zhǔn)備。普強(qiáng)將先鎖定在企業(yè)客戶這塊。當(dāng)我們?cè)谶@個(gè)領(lǐng)域做到最好時(shí),我們?cè)倮^續(xù)滲透到其它版塊。
普強(qiáng)目前擁有:
千語(yǔ)語(yǔ)音平臺(tái):向企業(yè)提供語(yǔ)音識(shí)別服務(wù)
千語(yǔ)語(yǔ)音云平臺(tái):為手機(jī)互聯(lián)網(wǎng)應(yīng)用提供的語(yǔ)音識(shí)別云服務(wù)
普強(qiáng)智能語(yǔ)音分析系統(tǒng):為企業(yè)提供360度大數(shù)據(jù)分析(語(yǔ)音,視頻,文學(xué)數(shù)據(jù)等)
問(wèn):ASR語(yǔ)音識(shí)別技術(shù)有哪些難點(diǎn)?
李全忠:語(yǔ)音識(shí)別技術(shù)要求快速,準(zhǔn)確。語(yǔ)音識(shí)別目前還達(dá)不到百分百準(zhǔn)確,達(dá)到完美的距離還很遠(yuǎn)。因?yàn)橹形?千字中發(fā)音有406個(gè),是最難辨識(shí)的語(yǔ)種,例如(wu),可以是吳、無(wú)、吾、梧、蜈等。同樣文字各地方言發(fā)音不一,便會(huì)增加難度,所以語(yǔ)音辯識(shí)應(yīng)用的成功關(guān)鍵,更傾向是專(zhuān)業(yè)能力。人類(lèi)有眼睛,耳朵,文字來(lái)幫助識(shí)別,語(yǔ)音識(shí)別是只通過(guò)能“聽(tīng)”來(lái)完成,有限的聲音數(shù)據(jù)要用來(lái)識(shí)別聲音的同時(shí)也要區(qū)分不同的背景雜音,需要花時(shí)間和精力去完善核心算法和積累數(shù)據(jù)。為了使每個(gè)垂直領(lǐng)域達(dá)到最優(yōu)的識(shí)別效果,我們都需要積累經(jīng)驗(yàn)去適當(dāng)調(diào)整算法和采集選擇數(shù)據(jù),例如為呼叫中心的電話信道建立模型與移動(dòng)互聯(lián)網(wǎng)的聲學(xué)模型是不一樣的。
問(wèn):ASR技術(shù)怎么應(yīng)用在智能家居設(shè)備和穿戴設(shè)備上?
何國(guó)濤:在可穿戴設(shè)備上,語(yǔ)音識(shí)別技術(shù)將是必備技術(shù)之一,但是要應(yīng)用ASR技術(shù)到可穿戴設(shè)備,我們首先要解決能耗問(wèn)題,這類(lèi)設(shè)備一般沒(méi)有太多電能。
一個(gè)成功的案例是:低功耗的語(yǔ)音喚醒技術(shù)。它通過(guò)只針對(duì)特定人和少數(shù)命令詞的識(shí)別解決了低能耗的問(wèn)題,成功應(yīng)用在許多嵌入式產(chǎn)品中,例如:手機(jī)語(yǔ)音喚醒,寵物語(yǔ)音鎖鏈(鎖鏈回答寵物主人的叫喚)等。