首頁>>CT技術培訓>>應用篇-把網站內容發(fā)送到第三代視頻手機>>

把網站內容發(fā)送到第三代視頻手機

      一.概述

      二.一個有價值的建議――把視頻看作一個延伸層

      三.網關功能需求

        3.1 物理層
        3.2 媒體流層
        3.3 應用程序層

      四.網關結構

      五. 特別的挑戰(zhàn)

        5.1 流化的音頻
        5.2 流化的視頻
        5.3 圖像的視圖控制
        5.4 用戶輸入

      六.典型應用

        6.1 應用特征
        6.2 音頻/視頻通訊
        6.3 需要文本輸入的應用
        6.4 選擇的自由

      七.商業(yè)模式

      八.NMS能幫什么忙?

      術語表


一.概述                           

  基于3G團體開發(fā)的3G324M標準的無線視頻手機,現(xiàn)在已經被無線業(yè)務提供商用于動態(tài)圖像呼叫。把普通網站的內容發(fā)送到那些手機上的業(yè)務會很有價值。

  本文考究一個能把網站內容發(fā)送給視頻手機用戶的網關。評估了網關中各種必要組成部件的成就,并解決了一些特別困難的問題。用詳細精確的應用例子說明網關的工作原理,并評估了它在促進新業(yè)務方面的潛力。

  NMS通信公司為正在出現(xiàn)的3G無線視頻技術OEM廠商和開發(fā)商提供廣泛的業(yè)務支持和解決方案。特別關注為無線視頻手機用戶提供新業(yè)務的網關,這些網關允許從傳統(tǒng)電話網和IP網接入到呼叫對象和視頻內容。最初配備的3G324M無線視頻手機的使用情況,以及業(yè)務供應商盡可能補充舊2G設備的需求,都是在短期內指導網關設計的因素。本文所討論的網關就是NMS準備為客戶需求而開發(fā)的網關例子。
                                             TOP↑

二.一個有價值的建議――把視頻看作一個延伸層


  許多不同的無線設備正為把網站內容發(fā)給移動用戶這個有巨大潛力的市場而展開競爭。如果我們把這些無線設備按功能作一個條形分布圖,那么條的一端是:智能化、全功能的設備,比如膝上型電腦和PDA,如果提供有標準的因特網連接,它們都能以自己的方式呈現(xiàn)出網站的內容。而條的另一端是啞終端,它們幾乎需要全部由內建于網關的智能來呈現(xiàn)網站的內容。WAP設備處在條的中間位置,它只能呈現(xiàn)一些由網關提供的內容,但在設備內能處理某種形式的HTML。

  在不久的將來,象3G324M無線視頻手機(如圖1所示)那樣的啞終端,極具潛力占領最廣闊的市場。3G324M是由3G無線團體開發(fā)的標準,它定義了和簡單視頻手機的通信。在手機之間或手機與網關之間,全雙工的流承載著以下信息:以簡單輪廓MPEG-4格式編碼的H.263視頻、AMR編碼的音頻和H.245控制信息,每個方向的所有這些信息用H.223標準復用成為單個流。對于這些流的進一步傳送,可以由傳統(tǒng)2G設備提供的TDM電路來完成。
在很長一段時間以來,格言"網絡的智能會轉移到外圍設備上"很可能包含著真理。對于無線萬維網應用來說,一個緊湊、不貴又高度智能化的移動設備,再加上一條連接到因特網的普通寬帶IP路由,就是最理想的方案了。然而,多年來現(xiàn)實已證明,有許多限制因素使得這種想法無法實現(xiàn)。目前的智能移動設備笨重而又昂貴,而且使用現(xiàn)有的電池技術要存貯足夠的電力還有問題。在使用怎樣的鍵盤和顯示終端的問題上也有一個內在的沖突:用大一點易于使用的呢,還是用小一點的便于攜帶呢?另外,傳統(tǒng)的蜂窩網絡是設計用來承載64kbps 的語音電路的,而不是高速因特網接入所要求的寬帶包。

  然而,H.263協(xié)議和硅半導體技術使得生產一個緊湊的、相當便宜的視頻手機成為可能,并且這種手機在傳統(tǒng)的64kbps電路上工作得很好。用于下一代無線手機的3G324M標準可以作為一個"延伸層"(spanning layer)。"延伸層"是MIT的David Clark 使用的一個術語,它描述的是一個既簡單又可以廣泛使用的標準,這個標準允許相互競爭的設備提供商和應用開發(fā)商大團體能相互獨立地工作,卻又共同形成一個產業(yè)。3G324M標準可能允許無線業(yè)務提供商推出用于視頻呼叫的手機,而對將來的應用又沒有做出特別的規(guī)定,如萬維網內容的遞送。這樣,網關供應商就可以推動其它環(huán)境的應用開發(fā),以提供豐富的新業(yè)務,比如到商業(yè)視頻會議設備的連接業(yè)務、視頻郵件業(yè)務、網站內容遞送業(yè)務。3G324M無線視頻手機也要有比較好的配備才能處理一些極困難的網站內容接收,也就是視頻和音頻流。

  如果是在經濟高增長時期,可以說服無線業(yè)務提供商和他們的用戶去購買已可用的3G設備。但事實上是目前兩者都為超預算所困擾。這就意味著,只要有可能業(yè)務提供商就會盡量使用2G設備。這可以作為最接近公共電話網的系統(tǒng)的一部分來實現(xiàn),并且仍然支持3G324M手機的使用。對大部分潛在的用戶來說,當前他們不會選擇購買一個昂貴的無線PDA,因為習慣于蜂窩電話機是作為蜂窩業(yè)務的一部分免費提供的。然而,如果無線運營商配置的是一種相當便宜的視頻手機,并讓用戶預交一定量的新業(yè)務費用,就可以沿用這種商業(yè)模式了。網站內容網關的配置可以隨著使用用戶的增加而加大,這樣可以免除業(yè)務提供商任何不必要的前期費用。網關中為遞送網站內容作準備的智能設備越貴,在忙時就越要滿負荷使用,因為達到滿負荷使用是提供低成本效益比業(yè)務的關鍵。但是,即使是使用最頻繁的用戶,他的智能手機大部分時間也處于空閑之中。因此業(yè)務提供商在剛開展業(yè)務時會配置少數(shù)幾個智能設備,只有能達到滿負荷使用時,才作進一步的擴容。



圖1 無線視頻手機

                                                                                     TOP↑

三.網關功能需求

  對于處在兩個規(guī)范網絡間的網關,總的需求是很簡單的:在所有層上匹配兩個網絡間的功能,處理兩個網絡間的任何轉換需求。所有在這里描述的功能要求也可以應用到不是遵循3G324M標準的無線視頻手機,任何的不同都可以通過網關的輕微調整來適應。



圖2 3G324M-網站內容遞送網關網絡拓樸

 3.1 物理層

  從無線側看來,網關只是標準視頻呼叫中的一方。(如圖2所示)物理層很可能使用標準的T1或E1中繼連接到公網級電路交換機。假設每個視頻呼叫需要一個64kbps 的中繼通道(雖然也可使用多個通道)。無線側的呼叫建立會使用ISDN協(xié)議,這個協(xié)議支持多個通道的綁定。這個64kbps流的內容是以下信息的組合:H.263視頻、AMR編碼的音頻、H.245協(xié)商消息。組成的方法是按照H.223多路復用。H.245協(xié)議用于起動視頻和音頻流。

  在網關的因特網側,標準的網站瀏覽通過以太網物理層來完成,使用HTTP/TCP/IP協(xié)議來訪問網頁。內容遞送網關是以面向因特網的瀏覽器的角色出現(xiàn)的。
為了能提供這一新業(yè)務,不管是無線網還是因特網,都不需要調整。只有網關自己和無線用戶才需要知道:這兩個網已經接合起來了。

                                        TOP↑

 3.2 媒體流層

  給手機的視頻信號必須從當前網頁的內容生成。對于HTML或JPEG,可以形成一個靜態(tài)圖像,然后再轉換成簡單輪廓MPEG-4視頻幀,并簡單地重復這個幀就可以了。流化視頻需要從其它一些視頻格式實時轉換成簡單輪廓MPEG-4。任何從無線視頻手機發(fā)來的視頻都會被簡單丟棄。

  對于音頻,大部分的時間會產生AMR靜音信號,然后發(fā)送到手機。當接入的是流化音頻時,可能需要先從別的音頻格式解碼,再編碼成AMR。從手機發(fā)來的音頻通常會被丟棄,但是也有例外,象:用于語音識別的音頻輸入、用于DTMF檢測的音頻輸入和某些H.245消息,它們用于組成典型的用戶給瀏覽器的輸入,就象電腦中的鼠標和鍵盤。
                                        TOP↑

 3.3 應用程序層

  在應用程序層,從無線手機發(fā)起的呼叫建立狀態(tài)包括用ISDN得來的主叫標識去:形成計費話單、登錄到主頁、跳轉到書簽處和收發(fā)郵件業(yè)務――為用戶建立一系列的標準瀏覽器功能。有些附加的密碼輸入會用于額外的安全要求。連接一旦建立,以下各種鼠標操作對任何應用來說都是需要的:點擊一個新的鏈接、顯示一個新的網頁、跳到大量排序數(shù)據(jù)的某部分。然而,由于無線視頻手機的限制,這些都會遇上特別難于解決的問題。這些問題會在本文的"特別的挑戰(zhàn)"一節(jié)進行更詳細的討論。
                                        TOP↑

四.網關結構

  圖3所示為網關重要組成的分解圖。網關機箱很可能是一個Compact PCI機箱,機箱中包含了作為網絡中一個節(jié)點的所有組件。基本的視頻呼叫和瀏覽器應用可以運行在主處理器上,但T1或E1接口需要由附加模塊來支持。為了支持大量的端口,還需要附加的以太網接口和自定義的視頻處理模塊。T1/E1接口通過公共電話網接入無線交換中心,也可以直接接入到無線交換中心。以太網接口會通過標準IP路由器接入到因特網。

  圖3 強調的是3G324M網站內容遞送網關的組成。它支持網絡管理功能和用戶管理功能,同時通過附加的鏈路處理計費話單,這個附加鏈路很可能是這里沒畫出的另一個IP網。完成標準瀏覽器功能的模塊在圖3的最右邊,支持標準無線視頻呼叫的模塊在左邊。

  最粗的箭頭表示實時媒體流。稍小一點的箭頭表示控制消息和非實時媒體傳送。由于到手機的視頻流占用較窄的帶寬,音頻和視頻數(shù)據(jù)流可以做類似的處理。對于一個有大量端口的大規(guī)模系統(tǒng),設計時應該支持在以太網和T1/E1中繼間的實時媒體流,而不要讓它們通過主處理器或PCI總線。T1/E1中繼和以太網接口模塊可以合并,包括其中必須的視頻和音頻處理;蛘咴贑ompact PCI模塊之間用新的、高帶寬的交換結構來處理實時數(shù)據(jù)流。


                                        TOP↑

  對于HTML網頁,標準瀏覽器功能會建立一個類似于PC瀏覽窗口的內部圖象,然后由特定網關功能對圖像加工,形成一個適合于手機顯示的視頻流。網站中的其它靜態(tài)圖象,比如JPEG,不需要生成HTML網頁內部圖象,而是能直接加工成視頻流。第三種形式的內容及視頻剪輯,不會使用從靜態(tài)圖象到視頻流的加工過程,但需要從某種視頻格式(如MPEG-2)解碼,再編碼成為手機的簡單輪廓MPEG-4視頻格式。

  處于圖3中間的部分組件代表一些本文下一節(jié)將會詳細討論的具有挑戰(zhàn)性的領域。對任何類型的圖像都必須做一些視圖的編輯以補償由于轉換到簡單輪廓MPEG-4所造成的分辯率損失。由于無線手機沒有全功能鍵盤,所以用戶的文本字符串輸入需要做特別處理。為這些限制建立特別處理是提供的業(yè)務有沒有價值的關鍵,否則,可能由于業(yè)務的使用太麻煩,以至于推廣不開來。

                                        TOP↑

五.特別的挑戰(zhàn)

  建立一個有用網關時最難解決的問題是必須注重人類工程學方面的設計。雖然方案選擇也可能是一個特別的技術挑戰(zhàn),但最隹方案的決定根本不是技術上的運用,而問題正好出現(xiàn)在易于表述的技術問題上,例如:從網站送出的音頻可以達到CD般的質量,但是送給手機的AMR編碼音頻只能滿足僅可聽懂的話音質量。大部分網頁都是設計用于個人電腦屏幕的分辯率(1024x768)。而視頻手機大部分都受限于H.263 QCIF的分辯率(176x144),一條線上的分辯率差距高達6倍。而且,設計時用戶和網站服務器交互使用的是鼠標和全功能電腦鍵盤,而無線手機只有一個非常受限的小鍵盤。

  一個有利的情況是:大部分網站的設計都慮到了大多數(shù)的用戶仍然使用撥號上網,因此許多網站為有寬帶接入和無寬帶接入的用戶提供了并行的不同瀏覽途徑。撥號連接那有限的帶寬正好和無線視頻手機的收發(fā)帶寬具有可比性,因此,即使需要的信息表述和交互的方式相差很遠,無線用戶也可以選擇為撥號用戶設計的網頁,以便有信息遞送時獲得和撥號用戶差不多的響應時間。

  5.1 流化音頻


  流化音頻的應用很少,并且在應用中都處于不重要的地位,對信息的內容來說,它不是實質性的。對于一系列重要的小應用,如:新聞和體育評論、以及季度財務報告大會的收聽,話音的傳送就很關鍵。在所有這些情況下,AMR編碼的話音質量讓用戶聽懂是足夠的了,但如果要用這種AMR通道來傳送CD質量的音樂,就會明顯顯得不足。即使電腦用戶下載音樂片段的速度要比實時慢得多,但他下載回來后仍可以聽到高質量的回放。在一個非智能的無線手機上無法提供這種能力。AMR編碼的音樂也有一定的價值,但它不是以娛樂為目的的。把來自網站服務器的流化音頻轉換成手機需要的AMR編碼音頻是一個簡單的技術問題,但是需要大量的計算能力。明智的做法應該是在一個附屬的模塊上用DSP資源來做這種運算,而不要在網關的主處理器上做這種運算。
                                        TOP↑

  5.2 流化視頻

  同樣地,流化的視頻現(xiàn)在也不常用。在使用它的大部分應用中,視頻都是顯示在整個電腦屏幕內的一個小窗口之中。這個小窗口的分辨率近似于手機上的完全QCIF顯示。必須用一種方法把視頻縮放到容納它的屏幕窗口一般大,但在這兩種收看環(huán)境中其它的收看感覺是大致一樣的。在某些情況下,也許可以通過和流服務器協(xié)商,讓服務器直接送本來手機需要的簡單輪廓MPEG-4視頻流?墒,如果這種情況不可能,就需要配備高強度運算的轉換功能,來把視頻從一種格式轉換成另一種格式。這種高強度運算的轉換功能最好在一個附屬的模塊上用附加的硬件資源來完成,而不要由網關的主處理器來完成。
                                        TOP↑

  5.3 圖像的視圖控制

  所有網頁的原組件──JPEG、HTML或其它形式的組件── 一幅個人電腦屏幕上的完整圖像,要顯示在手機的小屏幕上,對大部分普通應用來說這個小屏幕的分辨率都是不夠的。適當剪裁應用程序的顯示介面,以適應小屏幕的顯示,會得到很好的使用效果。我們的目標是在網關支持視頻手機的這些獨特顯示,使得手機能訪問普通的網站?梢猿晒崿F(xiàn)這個目標的兩種技術是:
  ■ 通過屏幕的局部視圖進行用戶輸入的控制;
  ■ 用"動"來補嘗分辨率的低下──使用附加于視頻流中的連續(xù)幀。

  縮放和取景窗是廣泛使用的視頻控制技術,這些技術也適用于這里介紹的方案。各級縮放都只有一個方向的控制(只有放大或只有縮。┎粫忻黠@的麻煩,只要三級的縮放就能達到個人電腦全屏的分辨率(QCIF x 8=1408 x 1152),只有用到四級以上的縮放,才需要同時為每級提供放大和縮小兩個方向的控制。在普通瀏覽操作中,需要通過鼠標來控制光標的移動。在一個縮放和取景窗的系統(tǒng)中,光標控制(上、下、左、右四個鍵)同時也作取景窗控制用。畫面縮放后光標會保持在視窗的中央,移動窗口就可以看到圖像的其它內容,直到整幅圖像的邊為止。所以,一個標準的操作過程是這樣的:一個新的HTML頁面開始會以全屏的方式顯示,中間有光標用于放大,用戶可以把光標移動到自己感興趣的內容上,然后按下放大控制鍵。這一操作過程可以根據(jù)需要一直下去,直到能清晰地看清要看的內容。特別需要注意的是,在給出一個文本輸入框時,取景窗要放置在輸入光標位置的中間,而不是鼠標光標位置的中間。直接的取景窗控制也是允許的──上、下、左、右控制──類似于普通個人電腦屏幕上窗口邊或底部的滑動條。

  視頻中的幀流允許用戶控制的取景選擇。一旦達到想要的縮放級別,自動掃描方式會停下來,并以這個縮放級顯示整個頁面,不再需要用戶的干預。對于英文內容的頁面,掃描會從左到右,從上到下的進行。如果能控制在每個方向上的掃描速度會很有用,但從另一方面看,增加額外的控制又是很麻煩的。也許以一個預設的掃描速度來搜索整個頁面,而以另一個預設的較慢速度由上到下移動用于閱讀,會乎合最普遍的要求。

                                        TOP↑

  5.4 用戶輸入

  和圖像顯示相比,用戶輸入甚至是一個更大的挑戰(zhàn)。無線手機的小鍵盤和全功能電腦鍵盤及鼠標相比實在受到太多的限制。手機擊鍵可以轉換成音頻流中的音頻信號,比如DTMF信號。但由于DTMF信號具有持續(xù)時間短和占用頻帶窄的特點,造成AMR音頻編碼不能可靠地轉換這種信號。H.245協(xié)商通道可以用于傳送象擊鍵那樣的控制信息,但是由于沒有相關的標準,需要在手機上做特殊的處理。使用手機最通常的輸入方式是語音輸入(沒有音頻信號和H.245消息),這個時候就要用語音識別了。

  這些年來語音識別的準確率已有了很大提高,但是象AMR那樣有限的帶寬通道,以及一般移動呼叫都有比較大的背景噪聲,都會造成識別率的嚴重下降。這就要求對詞匯表做一些處理,最好使用盡量少的詞,表中的詞沒有二義,發(fā)音不能相同。為了提高識別的準確性,甚至要存貯用戶的特殊發(fā)音特征。最頻繁使用的鼠標控制和視圖控制輸入最好單獨形成一個子詞匯表,大約有10個詞:上、下、左、右、停、點擊、放大、縮小、掃描、閱讀。剩下的主要是文本輸入,可能需要幾個子詞匯表。用于輸入數(shù)字的子詞匯表自然也大約是10個詞。發(fā)音問題顯然也是一個很大的挑戰(zhàn),因為很多字母的組合發(fā)音相象。有一些可能的辦法,包括:用說出數(shù)字來代表電話小鍵盤上的字母;或者說出組成單詞的每一個字母來表示該詞(Alpha、Bravo、Charlie、….)。另外,還要包含各種標點符號。用于糾錯的編輯命令也是必須的。對用戶來說所有這些文本輸入技術都意味著一種負擔。能夠僅由鼠標來操控的網上應用似乎是易于訪問的,但是這樣的應用如果需要文本輸入就太難解決了。



                                             TOP↑


page1page2