2006/07/20
3 歲的小孩在語音識別方面就非常老練了。另一方面,在經(jīng)過30年的發(fā)展后,計算機(jī)在語音識別方面的表現(xiàn)仍然不盡如人意。由于相關(guān)廠商在語音識別軟件方面所取得的進(jìn)展,以及它們?yōu)闋帄Z面向手機(jī)和汽車的語音命令市場而進(jìn)行的競爭,這種情況可能會有所改變。
本周二,Nuance Communications 發(fā)布了其新版PC語音識別軟件━━Dragon NaturallySpeaking 9.0. 與8.0 版本相比,新版本的語音識別準(zhǔn)確率提高了20% ,這意味著它的識別準(zhǔn)確率能夠達(dá)到99% ,殘疾人可以用語音“指揮”他們的PC。
Nuance的工程師還為用戶使用他們的軟件提供了一條捷徑,使用戶無須經(jīng)過對軟件進(jìn)行長時間的訓(xùn)練就能夠使用它,軟件會在使用的過程中進(jìn)行自我訓(xùn)練。
Nuance負(fù)責(zé)產(chǎn)品管理的主管瑪特說,三、四年前曾經(jīng)試用過我們產(chǎn)品的用戶會發(fā)現(xiàn),新版軟件有了相當(dāng)大的進(jìn)步。它能夠“自學(xué)”。
微軟正在測試其語音識別技術(shù),并計劃在Vista 中捆綁該技術(shù)。與Nuance一樣,微軟也一直在提高語音識別技術(shù)的準(zhǔn)確率,使它能夠根據(jù)上下文環(huán)境區(qū)分“beach”和“peach”。
微軟還在改進(jìn)其技術(shù)的用戶界面,使普通用戶能夠更方便地讓軟件修正出現(xiàn)的錯誤,或切換應(yīng)用軟件。微軟的軟件架構(gòu)師羅勃說,語音識別技術(shù)正在日益成熟,準(zhǔn)確率正在以指數(shù)速度提高。
語音識別在計算機(jī)領(lǐng)域是個難題。例如,外部噪音會干擾語音識別軟件對用戶語音的接收,造成它不能正確地理解用戶的語音。
另一個障礙是各個用戶的語音有很大差別。語音識別軟件必須掌握各個用戶語音模式間的細(xì)微差別,才能夠達(dá)到最高的準(zhǔn)確率。
語音識別技術(shù)的下一次飛躍將出現(xiàn)在手機(jī)市場上。黑莓等手掌式產(chǎn)品使用戶能夠口授一封電子郵件而無須使用“迷你”鍵盤輸入文字。
語音識別技術(shù)還使汽車駕駛?cè)藛T在手握方向盤的同時更好地控制空調(diào)設(shè)備,斕乇硎,Nuance正在與各大手機(jī)運(yùn)營商和手機(jī)廠商進(jìn)行相關(guān)談判。
微軟也瞄上了這一市場。羅勃表示,他相信計算機(jī)的語音識別能力終有一天會超過人。計算機(jī)的數(shù)字運(yùn)算能力已經(jīng)超過了人。
CNET科技資訊網(wǎng)