鄭方:產(chǎn)學研合作肩負標準與產(chǎn)業(yè)重任
鄭方 2006/02/24
比爾·蓋茨在1999年出版的《未來時速》一書中曾經(jīng)預測,人類計算的未來是讓計算機能夠看、聽、學,能用自然語言與人類進行交流。他的話正逐步成為現(xiàn)實。
擺在眼前的問題
我們經(jīng)常會遇到這樣一些問題:QQ一下、短信一下,單純的文字交流已經(jīng)不能滿足需求,于是視頻聊天、攝像手機開始流行;面對著每天上G、上T字節(jié)的信息,如何快速搜索有用的信息?google一下、百度一下,幾萬甚至幾十萬條信息,通常能瀏覽的大概不到100條,于是人們希望精細查找;2008年奧運會即將到來,學英語的浪潮正在席卷,然而更多的語種就需要機器翻譯……
這些關乎中文語言理解技術應用的需求日趨高漲。
除了有關語言理解內(nèi)容方面的應用之外,在2005年國際中文語言資源聯(lián)盟年會上,清華大學信息技術研究院副院長、CCC理事長、北京得意音通技術有限責任公司董事長鄭方教授還提到關于內(nèi)容安全的問題。首先,內(nèi)容在傳播過程中,我們怎么保證有用的信息不被沒有授權的人獲。黄浯,一些有害的信息,甚至一些危險的信息,我們怎么能夠過濾掉。這是一個非常大的問題,F(xiàn)在,在網(wǎng)上傳播的一些信息讓用戶很煩,包括垃圾郵件。而我們用簡單的方法過濾出這些信息往往達不到一個有效的效果,有的時候把一些有用的email、有用的網(wǎng)頁都擋在門外,實際上這樣的結(jié)果是我們非常不希望的。為什么會這樣呢?是因為我們沒有真正理解這個email,也沒有真正理解這個網(wǎng)頁它所要表達的內(nèi)容,到底是反對某個事情,還是支持某個事情。如果我們通過語義的理解,知道這點,那就可以做到有的放矢,有用的、有利的、安全的我就讓它過;相反就把它阻止在外面。以上講到的是怎么去防止的問題;哪些人可以對這個信息進行存取,哪些人不能,這涉及生物認證技術。聲紋技術可以做到進行“真實自我和真實意思”的判斷。眾所周知,生物特征是不能被借走和偷走的,它展示的是“真實自我”,而利用語言中所包含的韻律等信息,就可以對“真實意思”做出判斷。
這些就是目前中文信息處理產(chǎn)業(yè)要解決的一些問題。這些問題來自產(chǎn)業(yè)界的一些需求,也來自國家戰(zhàn)略的一些需要,而這些需求的滿足,正是中文信息產(chǎn)業(yè)的機遇所在。
觸手可及的商機
鄭方教授在主題演講《發(fā)揮產(chǎn)學研通道優(yōu)勢,開展自主創(chuàng)新活動,推動中文信息產(chǎn)業(yè)發(fā)展》中充分論證了中文信息處理產(chǎn)業(yè)發(fā)展的商機。7億電話用戶的規(guī)模,2178億條的短信量和58.8%的增長率……這些數(shù)據(jù)的背后是龐大的市場機遇。
鄭方以兩個行業(yè)為例向與會者介紹了技術的增長趨勢。國際生物集團提供了一個未來生物識別市場的預測,2005年達到21億美元,2007年將達到40億美元。在這里面,各種不同的生物特征,分別占據(jù)不同的比例。其中,2003年聲紋識別應用占了4.1%的比例,這個比例不是很大,但是2004年就上升到了6%。IBG集團曾經(jīng)預測,到2007年,聲紋識別應用可以占到10%,可見數(shù)據(jù)增長速度還是比較快的。
再從商業(yè)模式的方面來看。在1980年到1995年之間,主要是門禁系統(tǒng)和PC的登錄方面應用比較多;從1995年到2005年,在信息系統(tǒng)的身份認證方面比例增加,增長速度也比較快;但從2005年開始,網(wǎng)絡用戶身份的驗證,就逐漸占據(jù)主要的、顯著的地位了。眾所周知,網(wǎng)絡用戶之間可以對話,可以就各種問題進行討論,但是,彼此之間卻不知道對方是誰。因此,“用聲音去判別身份”成為互聯(lián)網(wǎng)用戶驗證的手段,同時為中文語音的發(fā)展帶來很大的空間。
語言理解也是一樣。搜索引擎的企業(yè)數(shù)量和市場規(guī)?焖僭鲩L,到2006年,市場規(guī)?蛇_到24億元,增長速度很快。其中,面向行業(yè)的垂直搜索目前正在逐步引起業(yè)界的重視,相比而言,垂直搜索也更容易與中文語言處理技術互相促進,共同發(fā)展。因為垂直搜索,可以把中文語言理解技術限定到特定領域,有針對性地去理解用戶的需求。
產(chǎn)業(yè)發(fā)展的商機已經(jīng)勢不可擋,從國家戰(zhàn)略來看,中文信息處理產(chǎn)業(yè)也是符合國家中長期規(guī)劃提出的科技發(fā)展的指導方針“自主創(chuàng)新、重點跨越、支撐發(fā)展和引領未來”。正是在這樣天時、地利、人和的條件之下,中文信息產(chǎn)業(yè)作為“中國信息產(chǎn)業(yè)中為數(shù)不多的、跨國企業(yè)未能壟斷、而民族企業(yè)的技術水平與國際先進水平相當?shù)念I域之一”,發(fā)展適逢其時。
產(chǎn)、學、研通道建設
盡管產(chǎn)業(yè)機遇當前,但是問題不容忽視。鄭方教授指出,在一些科研活動和市場活動中我們發(fā)現(xiàn),中文信息處理面臨著自主創(chuàng)新成果和產(chǎn)業(yè)開發(fā)之間的嚴重脫節(jié)。一方面,一些科研成果缺少產(chǎn)業(yè)化的考慮,好多教授、專家在大學、研究所做的一些成果追求的是高、精、深,追求的是學術水平,但是往往脫離產(chǎn)業(yè)需求;另一個方面,企業(yè)缺乏創(chuàng)新能力。更重要的是,科研機構與企業(yè)之間缺乏溝通的渠道與機制。“國家在中長期規(guī)劃里面講的‘以企業(yè)為主體的自主創(chuàng)新’,這不應該僅僅停留在口號上,我們必須有一種機制有一種渠道來做保證。很顯然,產(chǎn)、學、研的通道就是最好的一個實現(xiàn)途徑!编嵎秸f。
國際中文語言資源聯(lián)盟的成立,就是為科研機構和企業(yè)之間提供一個無縫的交流和合作的平臺。作為聯(lián)盟理事長,鄭方始終強調(diào)產(chǎn)學研通道建設對于中文信息處理產(chǎn)業(yè)發(fā)展的重要性。通過聯(lián)盟內(nèi)成員的合作,目前,聯(lián)盟成員共同承擔公安與邊防領域的課題,應用于司法鑒定、技術偵查、2008年新版護照等重要領域;聯(lián)盟成員合作推出了多款聲紋認證加密鎖;聯(lián)盟成員通力合作推出了國際首創(chuàng)的中文互動短信服務、無線智能歌曲搜索業(yè)務、航班信息查詢,為手機用戶和互聯(lián)網(wǎng)用戶提供功能強大的智能信息服務,開創(chuàng)了智能互聯(lián)網(wǎng)的新領域,這些產(chǎn)品都是已經(jīng)在中國移動正式使用的。
聯(lián)盟從2004年3月成立,到2005年,數(shù)據(jù)庫規(guī)模翻了一番。雖然從絕對數(shù)字上看不是很多,但語音和語言數(shù)據(jù)庫的創(chuàng)建是非;〞r間,也非常花財力、物力的,因此,實現(xiàn)數(shù)據(jù)庫數(shù)量翻一番是得到很多聯(lián)盟成員支持的結(jié)果,也是得到海淀區(qū)支持的結(jié)果。另外,目前還有3個仍在開發(fā)的巨型說話人識別數(shù)據(jù)庫,這些數(shù)據(jù)庫都是萬人規(guī)模的。
“未來我們要以促進標準和產(chǎn)業(yè)的發(fā)展作為己任,首先是中文語音交互標準工作組。聯(lián)盟成員負責或參與起草的有三個標準:語音識別(參與起草)、數(shù)據(jù)庫及標注(負責起草)、聲紋識別(負責起草)。我們對標準的起草工作非常重視。另一方面,就是通過舉辦技術與應用培訓、與國內(nèi)及國際性的專業(yè)協(xié)會進行產(chǎn)業(yè)聯(lián)盟等多方面的接觸與交流;通過發(fā)布聯(lián)盟網(wǎng)站,提供了聯(lián)盟成員之間交流合作、資源共享、形象宣傳、成果推廣等,促進產(chǎn)業(yè)的發(fā)展!编嵎秸f。新的機遇等待著聯(lián)盟中產(chǎn)學研商各方的共同努力和推進。
得意音通公司供稿 原文刊登在科學網(wǎng)
相關鏈接: