具備語音識別功能的系統(tǒng)越來越多的被企業(yè)及運營商所采用, 很明顯,它將提升客戶服務質(zhì)量從而帶來很好的投資回報率。Dialogic公司通過提供獨特的技術,推動業(yè)內(nèi)標準的實現(xiàn),及廣泛的生態(tài)合作伙伴聯(lián)盟成為此類業(yè)務的領先者。
領導業(yè)界標準
Dialogic公司正領導并推動語音識別領域的業(yè)界標準如VXML和SALT,這些標準提供了開放的技術接口以符合實現(xiàn)面向互聯(lián)網(wǎng)工作模式的業(yè)界趨勢。同時,Dialogic公司也活躍于其它相關標準組織如W3C和IETF.
語音識別應用
成本和技術復雜度一直是困繞語音識別服務發(fā)展的障礙。現(xiàn)在正在改變,不間斷的針對性能價格比提升的投入使得語音識別技術被越來越多的廣泛應用之中。無論你身處價值鏈的哪一部分,Dialogic的生態(tài)系統(tǒng)都可以提供幫助。
高質(zhì)量和高性能結(jié)合所產(chǎn)生的具備語音識別功能的解決方案,促成了越來越多的業(yè)務模式,使得今天的人們需要考慮,應該部署一個具備語音識別功能的業(yè)務。以下為幾種典型的具備語音識別功能的業(yè)務。
- 具備語音識別功能的 IVR: 語音識別可以增強IVR系統(tǒng)的功能,訪問者可以與IVR進行交談,而不需按鍵選擇菜單。自動語音識別是IVR的發(fā)展方向,其中,語音門戶應用已經(jīng)在全球擁有很多成功案例
- 具備語音識別功能的消息服務: 具有此功能的語音信箱系統(tǒng)使用戶不必用手按鍵取得語音消息,這帶來很大的便利,比如在開車時
- 語音撥號: 是較早在無線語音商中部署的應用,用戶可以通過直接呼叫姓名進行撥號而不必用手,這在開車時會帶來很大便利
Dialogic 針對語音識別功能的技術
Dialogic 公司針對語音識別應用提供了一系列通信構(gòu)建模塊采用了基于開放標準的獨特技術。開發(fā)者可以通過各種組合以構(gòu)建符合業(yè)務要求的平臺。
其中Dialogic Continuous Speech Processing (CSP)連續(xù)語音處理技術可以顯著提升識別準確率并大幅減低CPU占用率。
為構(gòu)建高質(zhì)量,高性能的語音識別服務平臺提供了堅實的基礎。
以下是CSP一些關鍵技術特點
- 回音消除(EC): 應用于語音識別,IP電話,DTMF/Tone檢測,以消除呼叫信號的雜音
- 全雙工方式: 應用程序可以在每個端口同時發(fā)送和接收語音數(shù)據(jù)
- 語音能量檢測(VAD): 檢測觸發(fā)識別的語音能量
- 打斷Barge-In: 當語音能量達到識別觸發(fā)值時,CSP可以自動中止在那個端口的提示音,將呼叫者的有效語音送給主機,降低了系統(tǒng)消耗并使用戶不必等待提示音的完成
- 語音事件信號: 當語音能量達到識別觸發(fā)值時,CSP可以想ASR引擎主程序發(fā)出信號
- 語音預緩存: 語音識別觸發(fā)前250毫秒的語音得以保存,并轉(zhuǎn)發(fā)給ASR,大幅提高了識別率。
關于CSP技術,詳見:http://www.dialogic.com
Dialogic具備CSP技術的通信構(gòu)建模塊
表一 點擊看大圖