手機(jī)里的語(yǔ)音技術(shù),你了解嗎?
手機(jī)嵌入式語(yǔ)音應(yīng)用介紹
2006/02/24
隨著人們對(duì)各種終端設(shè)備智能化程度要求的提高,語(yǔ)音技術(shù)正發(fā)揮著越來(lái)越重要的作用。語(yǔ)音技術(shù)的應(yīng)用就相當(dāng)于給終端設(shè)備裝上了嘴巴和耳朵,使得終端設(shè)備成為一個(gè)能說(shuō)會(huì)道又聽(tīng)話的智能設(shè)備。
隨著經(jīng)濟(jì)的發(fā)展,人們生活水平的提高,手機(jī)的使用日漸普及,并且人們對(duì)手機(jī)的娛樂(lè)性和智能化要求越來(lái)越高,給語(yǔ)音技術(shù)在手機(jī)上的應(yīng)用帶來(lái)了機(jī)遇。語(yǔ)音技術(shù)的應(yīng)用將使手機(jī)變得更加智能,更加好玩,并且使用更加方便。這無(wú)疑會(huì)成為手機(jī)的一大特色,受到消費(fèi)者們的喜愛(ài),并且會(huì)成為一種流行趨勢(shì)。
當(dāng)手機(jī)具有語(yǔ)音合成功能時(shí),我們的手機(jī)就可以"說(shuō)話"了。
當(dāng)有來(lái)電時(shí),如果來(lái)電號(hào)碼在我們的通訊錄里有,手機(jī)就可以播報(bào)出來(lái)電者的姓名,如果通訊錄里沒(méi)有,手機(jī)就可以播報(bào)出電話號(hào)碼。并且,如果預(yù)先讓手機(jī)具有識(shí)別區(qū)號(hào)和手機(jī)號(hào)所屬地區(qū)的功能,那么它還可以變得更智能一些,可以播報(bào)出是哪個(gè)地方的誰(shuí)來(lái)的電話。
當(dāng)有新的短消息到達(dá)時(shí),手機(jī)可以為我們讀出短信息的內(nèi)容和來(lái)信人的姓名,當(dāng)然為了保護(hù)我們的隱私,也可以設(shè)置不讓手機(jī)自動(dòng)閱讀短消息,在我們讓它讀的時(shí)候它才讀,通過(guò)一個(gè)按鍵便可以控制。
顯然,如果在駕車狀態(tài)下使用語(yǔ)音智能手機(jī),那么將達(dá)到駕車、通訊兩不誤的效果,并且提高了駕駛的安全性。
另外,我們也可以把鬧鈴的鈴聲設(shè)置成個(gè)性化的語(yǔ)音提醒,例如可以讓手機(jī)說(shuō):"懶蟲(chóng),起床了",等所有您想讓手機(jī)喊您起床時(shí)說(shuō)的話,而且可以天天更換,您所要做得只是輸入您想手機(jī)說(shuō)的話的內(nèi)容,這樣,連您起床時(shí)都可以不用聽(tīng)老套的鬧鈴的鈴聲了,而是聽(tīng)您想聽(tīng)的話。同時(shí),日程表也可以用語(yǔ)音合成讀出來(lái),當(dāng)有日程提醒時(shí),我們不用看手機(jī),就知道該干什么了。
當(dāng)手機(jī)具有識(shí)別功能后,我們的手機(jī)就變得"聽(tīng)話"了。
當(dāng)我們需要查找某人的電話號(hào)碼時(shí),我們?cè)僖膊挥貌煌5匕词謾C(jī)按鍵來(lái)查找了,只需對(duì)著手機(jī)說(shuō)出我們要找的人的名字,手機(jī)便可以自動(dòng)幫我們找出要查找的人的所有的電話號(hào)碼,并且用語(yǔ)音提示您當(dāng)前所處的是哪個(gè)號(hào)碼。
要打電話嗎,同樣簡(jiǎn)單,對(duì)著電話喊一下就行了,同時(shí)手機(jī)還會(huì)給您反饋,提醒您撥打的是哪個(gè)號(hào)碼,防止您撥錯(cuò)了可以及時(shí)停止操作。另外,還可以用語(yǔ)音的方式實(shí)現(xiàn)很多常用的功能,如我們可以對(duì)著手機(jī)說(shuō):打開(kāi)通訊錄,打開(kāi)收信箱,打開(kāi)系統(tǒng)設(shè)置等等很多命令,手機(jī)接收到之后便可以執(zhí)行相應(yīng)的命令。這樣可以大大節(jié)省您進(jìn)行復(fù)雜的按鍵操作所需要的時(shí)間。
目前,市場(chǎng)已經(jīng)有較多具有語(yǔ)音功能的手機(jī),特別是語(yǔ)音識(shí)別方面,已經(jīng)有很多手機(jī)應(yīng)用了這種功能。而在合成方面則只有比較少數(shù)的機(jī)型才具有,當(dāng)然還有一些公司推出了一些既具有合成功能又具有識(shí)別功能的智能手機(jī)。如磨托羅拉A728,A760,A780等既具有合成功能又具有識(shí)別功能,還有很多產(chǎn)品具有識(shí)別功能,諾基亞很多產(chǎn)品具有識(shí)別功能,三星也推出了多款具有合成功能的手機(jī)和具有識(shí)別功能的手機(jī)。
我們可以預(yù)期,隨著人們對(duì)手機(jī)娛樂(lè)性和智能化的不斷追求,同時(shí)在這些大型手機(jī)制造商的帶領(lǐng)下,語(yǔ)音技術(shù)的應(yīng)用必將成為手機(jī)行業(yè)的一個(gè)應(yīng)用潮流。
目前,國(guó)內(nèi)提供語(yǔ)音技術(shù)的有很多家,其中以安徽中科大訊飛在中文語(yǔ)音技術(shù)方面具有最好的效果。并且在手機(jī)上已經(jīng)有較多的成功應(yīng)用案例。
據(jù)了解,安徽中科大訊飛信息科技有限公司是于1999年6月在國(guó)家智能計(jì)算機(jī)研究開(kāi)發(fā)中心、中國(guó)科學(xué)技術(shù)大學(xué)人機(jī)語(yǔ)音通信實(shí)驗(yàn)室的基礎(chǔ)上組建,專注于語(yǔ)音技術(shù)的核心研究及其產(chǎn)業(yè)化的一家高新技術(shù)企業(yè)。經(jīng)過(guò)幾年的發(fā)展,該公司已經(jīng)成為中國(guó)產(chǎn)業(yè)化實(shí)體中,在語(yǔ)音技術(shù)方面基礎(chǔ)研究時(shí)間最長(zhǎng)、資產(chǎn)規(guī)模最大、歷屆評(píng)測(cè)成績(jī)最好、專業(yè)人才最多的公司,并且獲得了多項(xiàng)中文語(yǔ)音研究和產(chǎn)業(yè)界最高榮譽(yù),2003年獲得"國(guó)家科技進(jìn)步二等獎(jiǎng)"和"中國(guó)十大杰出青年科技創(chuàng)新獎(jiǎng)",2005年獲得05年"國(guó)家信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎(jiǎng)"獎(jiǎng)。
經(jīng)過(guò)多年研究,該公司在以往技術(shù)的基礎(chǔ)上,于2005年初推出了具有更好的合成效果的嵌入式語(yǔ)音合成軟件InterSound 4.0KT。
InterSound 4.0KT語(yǔ)音合成軟件是業(yè)界最小的輕量級(jí)中文連續(xù)語(yǔ)音合成軟件。系統(tǒng)針對(duì)有一定處理能力,但資源受到嚴(yán)格限制的嵌入式環(huán)境。它在合成效果上更加自然和流暢,已經(jīng)接近傳統(tǒng)大語(yǔ)料庫(kù)語(yǔ)音合成算法的效果;它集成了智能的文本分析算法,將規(guī)則和統(tǒng)計(jì)等處理方法進(jìn)行了有機(jī)的結(jié)合,具備了較強(qiáng)的分詞、多音字識(shí)別、姓氏識(shí)別、韻律環(huán)境預(yù)測(cè)能力,以及自動(dòng)識(shí)別和處理日期時(shí)間、數(shù)值金額、電話號(hào)碼等文本的能力,并能通過(guò)添加外部規(guī)則的方式,快速增加對(duì)新的文本格式的支持能力。按照5分制計(jì)算,其合成的自然度可以達(dá)到4.2分,可懂度為98%,節(jié)奏正確率達(dá)到95%。
InterSound 4.0KT在系統(tǒng)架構(gòu)、代碼實(shí)現(xiàn)、資源結(jié)構(gòu)等方面進(jìn)行了大量的研究和優(yōu)化工作。整體系統(tǒng)架構(gòu)的設(shè)計(jì)緊湊高效;系統(tǒng)開(kāi)發(fā)過(guò)程中,在合成算法、數(shù)據(jù)結(jié)構(gòu)、代碼編寫(xiě)等不同層面都進(jìn)行了深入優(yōu)化;庫(kù)資源的結(jié)構(gòu)設(shè)計(jì)也非常精巧,目前的庫(kù)資源的尺寸已經(jīng)低于1.2M字節(jié),同時(shí)提升了資源訪問(wèn)的效率。最終的優(yōu)化結(jié)果,使得InterSound 4.0KT系統(tǒng)在存儲(chǔ)資源的需求方面較傳統(tǒng)的合成系統(tǒng)有了極大的降低,但整體的效果卻有了顛覆性的提升。
InterSound 4.0KT系統(tǒng)具有很強(qiáng)的移植性,已經(jīng)在以下的操作系統(tǒng)下實(shí)現(xiàn)移植:Linux,WinCE,Omap,Smartphone,PPC等等,并成功的在Arm、TI、Epson、Philips等硬件平臺(tái)上實(shí)現(xiàn)了移植。Intersound 4.0KT充分考慮了手機(jī)的應(yīng)用環(huán)境,滿足了在手機(jī)的嵌入式環(huán)境下的要求,使得實(shí)現(xiàn)手機(jī)里的語(yǔ)音合成技術(shù)已經(jīng)不再成為困難,并且合成效果將令用戶非常滿意,增加了手機(jī)的個(gè)性化特點(diǎn)。
科大訊飛的目標(biāo)是以最好的產(chǎn)品、最優(yōu)的服務(wù)、最合適的應(yīng)用全面推動(dòng)語(yǔ)音產(chǎn)業(yè)的發(fā)展,做最專業(yè)的中文語(yǔ)音應(yīng)用整體解決方案提供商。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接: