Teradata CTO寶立明:CIO數據分析需勇于創(chuàng)新

2011/05/25

  第11屆Teradata數據中心峰會上,eNet硅谷動力對Teradata的首席技術官Stephen Brobst寶立明先生進行了專訪。了解到Teradata在數據分析和數據處理方面的優(yōu)勢以及CIO在需要數據分析與處理時需要注意的問題。
  

  Teradata數據分析與處理的優(yōu)勢

  記者:隨著數據量的飛速增長,大家面對更多的信息的時候會很迷茫。Teradata如何幫助處理這些海量的信息?

  寶立明:人們對于海量數據感到困惑是因為對于整個數據的全局沒有很好的把握,他們所看到的只是破碎的、零散的、局部的數據,就像你通常把一些數據做了一個總結一樣,而在這個總結的過程當中,你會丟失掉很多細節(jié),而有很多有價值的信息正隱藏在具體的細節(jié)當中。Teradata能幫助用戶深度了解這些數據的細節(jié),打個比方,幫助客戶了解數據每一個構成的原子或者是分子。要實現這樣的目標,需要有很強的可伸展性。這種可伸展性可以幫助用戶能夠去掉那些局部性的對于數據的了解,深入到數據的細節(jié),這樣就可以解開用戶對于整個大數據的困惑。

  記者:過去在技術上,要分析非結構性的信息的難處是什么?在買了Aster Data之后,可以解決這樣的問題嗎?

  寶立明:Teradata的數據庫主要用是來分析結構性的數據。當Teradata收購了第三方的工具之后,我們可以把一些非結構性數據轉化成結構型數據,再用Teradata的解決方案,或者產品進行相應的分析。收購Aster Data之后,其實我們可以直接地把一些非結構性的數據存儲到我們這里,然后可以直接對非結構性的數據進行相應的分析。

  如果你問我是不是通過Aster Data,就完全解決了分析非結構性數據的問題,我的答案是我們永遠不可能完全把某些問題都解決。只不過是現在通過收購Aster Data之后,這項工作變的更加容易一些了。

  Teradata客戶數據保護的優(yōu)勢

  記者:前一陣子大家都知道索尼在網上數據泄露那個事情,我想知道一下(50:45)在于保護用戶數據這方面有沒有一些相應的措施?

  寶立明:我們有一些非常先進的加密技術,實際上所有的設計都是加密的,都是來自數據庫加密,所以除此以外我們有完全并行的內部的數據庫加密能力,也就是說在表格等等都可以。從安全角度來說可以把所有的數據進行編加密、保存還有儲存。即使有一些也進入了我們的系統,他們也無法了解這個數據,而且這些數據都必須加密這是客戶的選擇,最好的做法就是由客戶來進行加密。

  記者:在處理海量信息的時候,怎么保護用戶的隱私?

  寶立明:關于隱私的保護的問題,我們可以提供某些層次上的用戶隱私的保護,如:通過對一些數據進行加密,或者只讓需要知道數據的人了解、接觸或者訪問到這些數據,比如說需要做決策的人,這只是一種層次上的隱私保護。但是更為重要的是,現在人們都非常擔心自己的數據或者信息會被別人看到,而Teradata可以通過數據挖掘的軟件解決這些問題。通過數據挖掘軟件,實際上看到用戶的數據或者信息的并不是某個具體的人,而是一個軟件。這個軟件用來處理這些數據,并且判斷這個數據應該被什么樣的人所使用或者用于什么樣的目的。

  就我個人而言也是數據的消費者,我一旦收到比較有用的、有意思的廣告,盡管我知道這只是隨著郵件而附帶來的廣告,但是我仍然愿意收到它。所以說作為一個消費者,對于這樣有用的信息數據,我還是能夠接受的。另外我覺得我作為一個消費者,我也有權利做出一些決定,我要用哪些數據和信息,不用哪些類型的數據或者信息。因此消費者實際上可以對此有一定的控制能力,同時也可以來決定哪些最符合他的利益的數據。

  很多國家的立法者或者政府希望通過建立或者制定一些保護隱私的法律來實現對用戶信息的保護。但是這些立法者,對于數據相應的分析是非常的不了解。最后導致的結果可能就是這種出于隱私保護目的的法律,最終產生不理想的結果。舉個例子,在某些國家對于一些電話用戶的呼叫記錄,最多只能保持90天,而且這樣的一種呼叫記錄只能夠用于計費的目的。這樣就限制了電信運營公司對數據的保存,不能夠很好地來設計符合消費者或者用戶需求的電信產品;同時在定價方面也受到了很大的限制,進而影響了市場的競爭。

  所以這個例子說明,雖然立法者的初衷是想要保護用戶的隱私,但是由于他缺乏對數據分析的了解,最終可能限制了用戶真正對信息和數據的使用。電信運營商如果要保留用戶電話通信的記錄,也有責任對記錄或者信息、數據進行保護,以免未經授權的人來使用這些信息和數據。在這樣一個過程當中,當然就要用到加密的軟件或者是用到其他數據保護的方法。我們在全球范圍內是和一個叫做Protegrity公司來進行很好的合作,他們有非常出色的加密的能力和技術,所以我們就把他們加密的技術嵌入到了我們Teradata公司的產品和解決方案當中,來為我們的用戶提供相應的保護。

  記者:最近日本發(fā)生的地震以及一些云供應商的宕機情況讓我們對企業(yè)數據的災難恢復得到了更大程度上的重視,Teradata是如何進行數據災難恢復的。

  寶立明:每一個分支機構當中都會有一定的數據的存在,關鍵之處就是在創(chuàng)建這些數據的伊始,你就必須要對這些數據實現集中化,這樣做的好處就是這些數據不再是像孤島式的一個一個存在,而是被集中在一起,這樣你就有一個單一的數據來源。你可以通過使用數據集成的技術,或者是使用Teradata公司所提供的這些技術和解決方案,深入到每一個數據的細節(jié)進行了解。所以實現這樣一個數據的集中化之后,隨之而來的就是它可能也會出現這種單點的故障,這時候出現了單點的故障,就必須具備災難恢復的能力。我們經常采用的是多系統管理的能力,而且也能夠提供一些多個負載的能力。如果說一旦某一個系統,由于自然的災害出現了故障,比如說由于地震、颶風出現了中斷,它就會自動地來轉到其他的系統進行相應的一些數據處理和分析的能力。

  有很多執(zhí)行這些關鍵任務的機構,或者是公司,都在采用這種方式來對自己的數據進行管理。比如說像沃爾瑪、e-bay、AT&T和世界銀行。另外中國現在也有很多客戶在完成或者執(zhí)行一些關鍵任務的時候,他們也會采用這樣的方式來做。

  另外我還想強調一下,我們的災難恢復的系統實際上是一個雙有源系統,或者是一個雙活躍的系統。Teradata產品跟其他的產品不一樣,其他人員在做災難恢復的時候,通常會有兩套系統,一套只是備用的,也就是說只有出現了災難的時候,才會啟動這樣的系統來做。但是我們的不同之處在于我們有兩套系統,這兩套系統都是在有源狀態(tài)下進行工作的,也就是都處于活躍的狀態(tài),我們會在這兩套系統之間,實現非常好的負載均衡。這兩套系統,都在行之有效地工作,因此也帶來了非常高的成本的效率。而其他的公司的產品只有一套系統一直在動,而另外一套系統一直處在無源的狀態(tài)之下,或者說一直不去積極地在工作,這時候相應的成本也是非常高的。

  CIO進行數據分析需勇于創(chuàng)新

  記者:商業(yè)智能現在正在演變成一種商業(yè)分析的趨勢,傳統的數據分析方法已經不太適合新的發(fā)展。對于這種新的發(fā)展趨勢,Teradata怎么來迎合這種新的趨勢跟態(tài)度的?

  寶立明:如果談到商業(yè)智能分析,能夠給人們帶來什么樣更多的價值,它最主要的一個價值就在于它能夠讓這些知識型的工作人員,更好地對數據進行控制。就像剛才我們所提到的,我們提供了一種非常凝結的、云的環(huán)境,讓這些知識性的工作人員,能夠很好地來控制自己的數據,也能夠控制對于數據的分析。比如說像Teradata公司所提供的數據視覺化技術,就可以使得知識型的工作人員,不需要有IT人員的介入,就可以把自己相應的一些數據進行分析和處理。

  記者:在大數據時代,您也提到有很多技術在產生,您覺得這些技術對于數據倉庫原有的一些技術只是功能上的擴展還是說意味著數據倉庫和商業(yè)智能原有的技術正在過時。

  寶立明:我覺得新技術或者說具有突破性意義的技術是非常必要的。所以這也就是我們?yōu)槭裁词召廇ster Data這家公司,因為它所提供的就是具有突破性意義的新的技術。我們認為在一段時間內,新舊技術之間是有一個共存的關系,但是最終新的技術還是會合并成為一體,新技術要花一定的時間要不斷演進,最終慢慢地來形成對舊技術的包圍,以及最后把它融為一體。

  記者:您作為數據分析與處理這方面的技術專家,能不能為我們展望一下您現在正在思考的沒有成型的未來的技術趨勢?
  寶立明:我有四點跟你介紹一下,首先第一點,就是剛才在新聞發(fā)布會的現場也提到的一點,我們會看到傳感器將會是無處不在的,物聯網的不斷發(fā)展,也給我們帶來了海量的數據,讓我們進行分析。

  第二點,我們要實現規(guī);芏喾治鲂缘囊(guī)模要進入數據庫當中。我們不能只是做數據的拷貝,而更多地要把分析性的功能納入到數據庫當中,比如說像現在SAS和Teradata之間的一個合作,我們可以把SAS公司的數據挖掘的能力納入到我們數據庫當中,另外還有Informix與我們的合作,我們要把它的數據集成功能納入到數據庫當中。

  第三點,無處不在的或者普遍存在的商業(yè)智能。商業(yè)智能在將來會發(fā)展成為消費者智能,所以“智能”以及“分析”這兩個詞應該說是未來非常關鍵的兩個要素。而且隨著移動終端不斷地普及,我們看到越來越多的智能和分析的能力,會被終端用戶通過移動的終端來實現。所以移動終端對于未來也是非常重要的。

  第四點,這些非傳統性的數據分析,比如說像社交媒體,像視頻或者像一些話音方面的數據,從傳統意義上來說,我們是不需要對這些數據進行分析的,但是這些數據也成為一個需要分析的數據。

  記者:現在數據社會化的趨勢,讓數據分析獲取比較困難。您認為CIO應該如何應對這些數據的獲得與分析?

  寶立明:數據社會化需要捕捉一些社交媒體所產生的用戶感覺,這個時候我們就必須對這些社交媒體整個的網絡有一個非常清楚的了解和認知,才可以從這個社交媒體網絡上提取相應的數據和信息來近些分析,以此來得出對用戶的感覺、了解和捕捉。這時候所做的分析就包括,對社交媒體上的用戶的一些自然語言的處理,以及對他們的行為或者是一些相應的活動的分析和處理,這也就是我們收購了Aster Data公司的原因。這個公司的技術可以幫助我們處理非結構性的數據,對它們進行很好的分析。因此我對于CIO們的建議就是,應該考慮做一些相應的投資,也就是說不要再僅僅局限于對傳統性的數據來進行一些分析和處理,而現在需要來投入一些力量,來對非結構性的數據進行很好的分析。所以他們在相應的策略和考慮的時候,要進行重新的思索和定位。

eNet硅谷動力



相關閱讀:
Radware:IDC云化漸熱 應用交付虛擬化正逢時 2011-05-23
數據中心虛擬化不斷深入 網絡則“方向未明” 2011-05-23
構建電信運營網絡數據中心 應對數據難題 2011-05-17
數據中心效率(PUE)計算指南 2011-05-17
中國將是云計算未來發(fā)展的中心 2011-04-29

熱點專題:  數據中心
分類信息:  數據中心_與_企業(yè)