語音帝國之夢
張旭東 2002/01/07
雄心勃勃的科大訊飛,欲把 “嘴巴”與“ 耳朵”擰到計算機(jī)上。
當(dāng)你面對一臺冷冰冰的電腦,問道:“你是誰?”“你今年幾歲?”“你的主人是誰?”電腦一字一頓地分別回答說:“我是樂樂!薄拔医衲陜蓺q。”“我的主人是科大訊飛。”你千萬別以為這是魔術(shù)。
靠技術(shù)吃飯
神奇、有趣,這是每一個初次接觸語音技術(shù)的人可能發(fā)出的驚嘆?拼笥嶏w在這方面擁有自己的核心技術(shù)——語音合成、語音識別和語音壓縮編碼是其看家本領(lǐng)。對以上三種技術(shù)的區(qū)別和特征,科大訊飛總裁劉慶峰有一種形象的比喻:語音合成是讓機(jī)器能開口說話;語音識別是讓機(jī)器能聽懂人的說話;語音編碼壓縮是讓龐大的語音文件完成壓縮,可方便地儲存、傳輸和使用。
從實驗室鉆出兩年后,28歲的劉慶峰時常表現(xiàn)出充分的自信。其實,劉慶峰的履歷極其簡單:1991年進(jìn)入中國科技大學(xué)就讀,并在該校從學(xué)士、碩士、博士一路拿下文憑。1999年11月,因為“首次將中文語音合成技術(shù)推向?qū)嵱秒A段”,他與自己的6位伙伴獲得科大訊飛668.85萬元的技術(shù)股權(quán)獎勵。此后,劉就任科大訊飛公司總裁,開始了尋找將語音技術(shù)商業(yè)化的征途。
據(jù)科大訊飛技術(shù)人員介紹,在獨特的前端文本分析、韻律模型和龐大的語料庫基礎(chǔ)上錘煉出的這一技術(shù),主要具有語音識別、語音聽寫和語音導(dǎo)航等功能。人說的話可以通過電腦屏幕顯示出來;電腦可以像人一樣說話;人發(fā)出 一種指令,電腦可以遵照完成;根據(jù)每一個人的語音特征,電腦可以確認(rèn)人的身份。這些可以實現(xiàn)人機(jī)交互、對話的功能,以其類魔術(shù)的形態(tài)吸引來各種關(guān)注的目光。
1999年6月,中國科技大學(xué)、安徽省經(jīng)貿(mào)委和福建中銀集團(tuán)拿出300多萬元,扶助科大訊飛下水起航;同年年底,美菱集團(tuán)、中國科技大學(xué)、安徽省信托、安徽省企投、合肥永信等公司注資,使科大訊飛資本金攀升至3000萬元;2001年6月,聯(lián)想投資公司、國家火炬投資公司給科大訊飛再次注入大額資金。來自社會的各種勢力看好劉慶峰及語音技術(shù),使科大訊飛這樣一個純高校概念的小公司迅速走出實驗室,進(jìn)入產(chǎn)業(yè)化快車道。
目前,劉慶峰麾下已經(jīng)聚集了200多人的隊伍,這些人雄心勃勃,欲圖齊力打造一個語音帝國。
打造商業(yè)鏈
2001年10月7日,遼寧五里河體育場,中國足球隊沖擊世界杯的比賽正在進(jìn)行。不少球迷紛紛撥打十強(qiáng)賽熱線電話16840168,詳盡地了解出場隊員情況、賽況、花絮等資料。
“這只是科大訊飛語音技術(shù)的一種應(yīng)用。”劉慶峰這樣說。在他看來,語音技術(shù)可以應(yīng)用于辦公、教育、游戲軟件,以及各種基于語音技術(shù)的動態(tài)、海量信息實時查詢平臺,語音服務(wù)器、語音商務(wù)平臺等;此外該技術(shù)還可以在智能信息終端、信息家電和智能玩具等嵌入式系統(tǒng)中大顯身手。比如,采用語音技術(shù)的教育軟件,當(dāng)孩子看到一首唐詩的文字和插圖的同時,還可以聽到用標(biāo)準(zhǔn)普通話朗誦的聲音;在游戲中,原先出現(xiàn)在虛擬人物頭頂上的文字將被取消,你聽到的是活生生的話語;一臺嵌入語音芯片的冰箱,假如你對它下命令:“打開!”冰箱真的就會敞開;一輛玩具小汽車,你命令它往前它就往前,你讓它拐彎它就拐彎。
在劉慶峰看來,語音技術(shù)應(yīng)用的范圍極其廣泛,到2005年,因該技術(shù)拉動的產(chǎn)業(yè)規(guī)模將能達(dá)到1000億元。
2000年5月,科大訊飛在中國科技大學(xué)、中國科學(xué)院聲學(xué)研究所和中國社科院語言研究所中分別成立了聯(lián)合實驗室,這些實驗室所有研究成果的產(chǎn)業(yè)化權(quán)利,都將由科大訊飛獨家應(yīng)用;與此同時,還成立 了“中國中文語音創(chuàng)業(yè)聯(lián)盟”!斑@是在語音技術(shù)從實驗室走向產(chǎn)業(yè)化前夕,將我國最強(qiáng)的科研力量進(jìn)行的一次集結(jié)!眲c峰說,“我們要打造一個強(qiáng)大的語音技術(shù)平臺,讓廠商開發(fā)各種應(yīng)用,從而生產(chǎn)出千奇百怪的產(chǎn)品!
其實,建立一個語音技術(shù)核心平臺,讓各行各業(yè)的軟件開發(fā)商、系統(tǒng)集成商以及運營服務(wù)商在此平臺上進(jìn)行二次開發(fā),進(jìn)而推出新型產(chǎn)品,正是科大訊飛的企業(yè)發(fā)展戰(zhàn)略。
從1999年底到現(xiàn)在,在科大訊飛的語音軟件平臺上,已經(jīng)聚集了中國IT領(lǐng)域中可能會應(yīng)用到語音技術(shù)的各個方面的210多家開發(fā)廠商。這些廠商名單中包括中國電信、海爾、聯(lián)想、實達(dá)、TCL等巨頭。
“產(chǎn)業(yè)太龐大,我們無法吃獨食。對于從科大訊飛手中拿到語音平臺的二次開發(fā)商,我們會對其開發(fā)人員進(jìn)行培訓(xùn),對他們所構(gòu)架的應(yīng)用方案給予咨詢支持;另外,所有合作伙伴的開發(fā)經(jīng)驗我們都將拿出來共享!眲c峰說,“現(xiàn)在正是我們的二次開發(fā)商緊鑼密鼓開發(fā)新產(chǎn)品的關(guān)鍵時刻。到明年年底,經(jīng)過產(chǎn)品開發(fā)期、測試期、市場推廣期之后,你會在很多領(lǐng)域看到語音技術(shù)的大范圍的應(yīng)用!
很明顯,科大訊飛希望站在產(chǎn)業(yè)鏈的上游,靠出讓自己的語音技術(shù)平臺生存。
劉慶峰雄心勃勃地說:“中國最著名的IT公司中,方正的看家本領(lǐng)是漢字照排;四通借漢字打印機(jī)成名;聯(lián)想靠漢卡起家。我們正努力使科大訊飛成為他們之后的下一個!睂⒐景l(fā)展成為全球最大的智能化多語種語音技術(shù)提供商,這是劉慶峰最終的夢想。其實,在今年9月份,科大訊飛已經(jīng)推出了一款很吸引人的產(chǎn)品——中英文混讀系統(tǒng)。
在一項技術(shù)變成一個龐大的商業(yè)生態(tài)圈時,人才、資本、管理、市場等等諸多因素都可能成為其前進(jìn)道路上的陷阱。而且,正在往前奔跑的科大訊飛,突然在自己身邊發(fā)現(xiàn)有很多強(qiáng)大的競爭對手——微軟亞洲研究院、炎黃新星、捷通等廠商都在研發(fā)中文語音技術(shù)平臺。---雖然有人要分吃同樣一碗飯,雖然前路坎坷,但劉慶峰依然信心十足:“我們手頭有5000萬元的現(xiàn)金,我們有200多人的隊伍。到明年年底,你會看到一個圍繞科大訊飛的語音帝國的雛形!
科大訊飛供稿 原文刊登于《IT經(jīng)理世界》