圖1 語音識別系統(tǒng)的基本流程
語音信號輸入后首先經(jīng)過濾波器,去除干擾及可能造成混淆的成分,然后由前端處理模塊提取語音識別所需的特征參數(shù)。當前語音識別所用的特征參數(shù)主要有兩種類型:線性預測倒譜系數(shù)(Linear Prediction Cepstrum Coefficient, LPCC)和MEL頻標倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)。
新玩具產(chǎn)品要得到公司主管的欣賞并不容易,抱怨通常會很多,例如會笑的玩具聽起來像"惡魔的聲音"(實際上就存在這樣的訴訟案例);詼諧的玩具又"太低級趣味";有的玩具很容易引起驚慌,這是因為玩具突發(fā)大聲或猛然動作的緣故;馬達或齒輪噪聲太大等。要解決這些問題,工程師還要進行一系列的調(diào)整。
深圳捷通公司供稿 CTI論壇編輯