語(yǔ)音識(shí)別技術(shù)——電子商務(wù)的 “推進(jìn)器”
張欣 2001/06/29
“Speech Technology is The Next Big Thing in Computing。ㄕZ(yǔ)音技術(shù)是計(jì)算機(jī)行業(yè)的下一個(gè)重點(diǎn))”這句曾經(jīng)出現(xiàn)在美國(guó)《商務(wù)周刊》封面上的論點(diǎn),給記者留下了十分深刻的印象。從目前的技術(shù)來(lái)看,要使高科技的IT產(chǎn)業(yè)真正走向大眾生活,充分利用語(yǔ)音技術(shù)、將語(yǔ)音技術(shù)與數(shù)據(jù)技術(shù)結(jié)合是必然趨勢(shì)。言豐科技的梁康忠博士說(shuō):“語(yǔ)音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟(jì)最重要的‘推進(jìn)器’之一,該市場(chǎng)正在迅速成長(zhǎng),且發(fā)展勢(shì)頭良好!庇袊(guó)外的分析家預(yù)測(cè),從2000年到2005年,語(yǔ)音技術(shù)市場(chǎng)將以每年31%的速度持續(xù)增長(zhǎng)。語(yǔ)音技術(shù)市場(chǎng)的迅速擴(kuò)展,意味著我們正面臨著大量部署語(yǔ)音應(yīng)用的轉(zhuǎn)折期。
提到語(yǔ)音技術(shù),更應(yīng)該強(qiáng)調(diào)語(yǔ)音識(shí)別技術(shù)。因?yàn)橹挥邢到y(tǒng)能夠自動(dòng)識(shí)別語(yǔ)音內(nèi)容,才能真正實(shí)現(xiàn)全程智能化、自動(dòng)化。同時(shí),只有當(dāng)大家真正認(rèn)識(shí)到語(yǔ)音識(shí)別技術(shù)在通信系統(tǒng)中所起到的核心作用時(shí),才標(biāo)志著語(yǔ)音應(yīng)用進(jìn)入到了一個(gè)新的階段。
以往,我們都比較熟悉IBM的ViaVoice等個(gè)人識(shí)別軟件,但真正帶來(lái)最大利潤(rùn)的還是企業(yè)級(jí)語(yǔ)音識(shí)別軟件。企業(yè)級(jí)語(yǔ)音識(shí)別軟件往往可被擴(kuò)展為一個(gè)平臺(tái),集信息查詢、信息點(diǎn)播、交易處理、統(tǒng)一消息四大功能模塊于一體,很多人稱之為語(yǔ)音門戶。目前,常見的語(yǔ)音解決方案的供應(yīng)商主要是IBM、Nuance、SpeechWorks、Philips,以及香港言豐科技。
在很多人對(duì)實(shí)現(xiàn)語(yǔ)音功能頗為撓頭的時(shí)候,言豐科技高級(jí)系統(tǒng)開發(fā)經(jīng)理周魯生卻說(shuō):“語(yǔ)音識(shí)別技術(shù)的門檻其實(shí)不高。”語(yǔ)音識(shí)別技術(shù)需要對(duì)語(yǔ)言規(guī)律的高度理解,因此,對(duì)于漢語(yǔ)識(shí)別系統(tǒng),中國(guó)的公司在核心模塊二進(jìn)制級(jí)別對(duì)漢語(yǔ)的雙字節(jié)處理上要具有很多優(yōu)勢(shì)。并且,源語(yǔ)音采集庫(kù)的規(guī)模直接決定語(yǔ)音識(shí)別的范圍和精確性,中國(guó)公司在這方面要大大占先。
現(xiàn)在,很多語(yǔ)音技術(shù)大多如此:先跟著指導(dǎo)練習(xí)一段時(shí)間,相當(dāng)于與系統(tǒng)的“磨合”,然后再根據(jù)系統(tǒng)的提示,在“嘀”聲后開始說(shuō)話,一問一答地完成此過程。語(yǔ)音識(shí)別的難度在于突破這種傳統(tǒng)的非人性化、非靈活性的語(yǔ)音環(huán)境,實(shí)現(xiàn)一些新功能,包括:說(shuō)話者可以隨時(shí)開口,而相應(yīng)系統(tǒng)隨時(shí)都可覺察并錄制、識(shí)別;說(shuō)話者可以多種方言甚至多種語(yǔ)種輸入,而系統(tǒng)能夠識(shí)別出來(lái);說(shuō)話者在噪音非常大(甚至與說(shuō)話者音量相當(dāng))的環(huán)境中說(shuō)話,系統(tǒng)能識(shí)別出來(lái)等。言豐科技的語(yǔ)音識(shí)別系統(tǒng)目前已經(jīng)能實(shí)現(xiàn)這些功能,人工智能會(huì)話斷插(barge-in)、多語(yǔ)音混合識(shí)別和回聲消除等,已使語(yǔ)音識(shí)別技術(shù)正在進(jìn)一步獲得突破。
梁博士認(rèn)為,語(yǔ)音識(shí)別只是一種技術(shù)手段,它的應(yīng)用不能脫離應(yīng)用主體去單獨(dú)實(shí)施,否則,語(yǔ)音技術(shù)開發(fā)者就不可能承接好各種應(yīng)用項(xiàng)目。因此,在推動(dòng)企業(yè)應(yīng)用語(yǔ)音系統(tǒng)開展商務(wù)活動(dòng)和進(jìn)行內(nèi)外部管理的時(shí)候,必須讓集成商介入這個(gè)領(lǐng)域。而且,由于舊有的語(yǔ)音應(yīng)用還處于一個(gè)比較低級(jí)的階段,技術(shù)上的突破將會(huì)給這個(gè)領(lǐng)域帶來(lái)重新洗牌的機(jī)會(huì)。
摘自《中國(guó)計(jì)算機(jī)報(bào)》
語(yǔ)音開拓應(yīng)用最重要 2001-06-25 |
語(yǔ)音應(yīng)用開財(cái)源 2001-06-25 |
語(yǔ)音技術(shù):走出實(shí)驗(yàn)室的革命 2001-06-21 |
炎黃新星與新華世紀(jì)聯(lián)手推出《新華音霸KingVoice 1.0》 2001-06-08 |
統(tǒng)一消息平臺(tái)中的語(yǔ)音技術(shù) 2001-06-04 |