
STT賦能的語音控制應用程序于2017年啟動,為視頻生成字幕,并在其他功能中處理每個月超過十億分鐘的語音。
Google Cloud現(xiàn)在發(fā)布了一個新的神經(jīng)序列到序列模型,用于語音識別,該模型在不同的用例,噪聲環(huán)境,聲學條件和詞匯量方面進行了測試。
新模型基礎架構(gòu)基于尖端的機器學習技術(shù),該技術(shù)使用戶可以更有效地利用語音培訓數(shù)據(jù)。
Google Cloud Speech Team杰出科學家Fran?oiseBeaufays在博客文章中說:
“使用STTAPI時,企業(yè)和開發(fā)人員都會立即看到盒子外質(zhì)量的改進,盡管您始終可以調(diào)整模型以提高性能,但可以在無需任何初始調(diào)整下即可感受到這種新體系結(jié)構(gòu)的好處。”
“隨著模型對各種聲音,噪聲環(huán)境和聲學條件的擴展支持,您可以在更多的上下文中產(chǎn)生更準確的輸出,從而使您更快,輕松,有效地將語音技術(shù)嵌入在應用程序中。”
隨著模型的擴展支持,用戶現(xiàn)在可以更自然地對其智能家居設備使用更長的句子說話。
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載