亚洲人成免费,国产精品色在线网站,亚洲精品久久久一线二线三线,国产欧美久久久,中文字幕av一区二区三区人,三级国产毛片,美女被麻豆免费网站

首頁 > 專題 > 文思海輝-乘數據之舟-達價值彼岸 > 數據建設之道--企業(yè)級基礎數據平臺(西安站)

數據建設之道--企業(yè)級基礎數據平臺(西安站)
2014-11-28 11:38:53   評論:0 點擊:

  隨著中國金融市場的快速發(fā)展,互聯網金融對傳統(tǒng)金融行業(yè)的競爭,以及監(jiān)管力度的不斷加強,IT咨詢服務公司對金融企業(yè)的商業(yè)智能方案也面臨不斷創(chuàng)新。如何提升金融機構在管理、盈利、風險控等多方位的能力?如何將國際經驗更好的為中國市場服務?如何通過解決方案將海量數據轉化為對經營決策有價值的信息之路?如何將客戶智能分析成果行之有效地運用于服務渠道,并最終轉換為銷售業(yè)績?為解決中國金融機構在發(fā)展中所面臨的新問題,文思海輝在西安、蘇州、北京、成都、深圳五地舉辦了6場“乘數據之舟,達價值彼岸”系列活動。

  在主題為“乘數據之舟,達價值彼岸”的文思海輝商業(yè)智能解決方案系列研討會西安站現場,文思海輝商業(yè)智能事業(yè)部總監(jiān)杜嘯爭做了“數據建設之道--企業(yè)級基礎數據平臺”主題演講。



文思海輝商業(yè)智能事業(yè)部總監(jiān) 杜嘯爭

  以下為演講實錄:

  大家好,我叫杜嘯爭我在文思海輝是負責華北的股份制銀行和城商行這一塊的交付總監(jiān),今天很高興有這個機會代表文思海輝商業(yè)智能事業(yè)部將我們之前對于數據平臺這一塊的經驗或者說想法跟大家做分享。這個題目其實是很大的題目,在大數據時代整個企業(yè)及平臺很大,在這樣一個情況下我們今天更想看的是之前各大行已經做過什么,之后對于城商行來講我們能夠借鑒的是什么,在講這個之前,我們首先看一下國內的數據平臺整個的建設歷程。我們把國內數據平臺從大的方面分成兩塊,上面是整個平臺的建設,下面是整個管控的建設,文思海輝是整個國內業(yè)內最早從事平臺建設的企業(yè),1999年上交所也是我們當時做的主要業(yè)務之一。之后,銀行業(yè)間進行探討,第一階段更多叫摸索和基礎建設階段,為什么這樣講?因為數據倉庫當時在國外是非常成熟的體系,但是引到國內之后,不管從架構體系還是數據模型上來說,對于國內的銀行來講有很多不適應的地方,這在第一個階段,也就是很多銀行包括民生、光大、工商、建行都進行了大量的摸索,在這樣一個摸索階段形成了國內數據倉庫的建設方法,在第一階段我們也可以看到應用相對來說很有限,重要做的更多是客戶單一視圖以及一些簡單報表的應用,這一部分主要是幾家股份制銀行和大行做試點。

  經過這樣一些實驗之后,對于數據倉庫的方法和摸索來講,相對來說形成了一些成型的建設方法,這就到了第二階段,我們把它總結為大規(guī)模應用建設和管控階段,在這個階段它有一些明顯的特點,第一個特點是隨著基礎建設的完成,到底數據平臺能發(fā)揮哪些價值,能夠幫助業(yè)務做什么,之前已經建了倉庫的銀行,越來越受到業(yè)務部門的質疑和詢問,在這種情況下一方面很多行開始反思在倉庫建設的原因和目的,另一方面很多行也在大規(guī)模推動應用,包含相關的CRM,風險類的簡單應用,都在大規(guī)模的推動,這是我們說的第二階段特點。

  另外一個特點水隨著數據平臺的建設數據大規(guī)模的入倉,我們可以看到經常面臨的問題是數據質量的問題,其實數據倉庫另外一個說法是“進垃圾處理垃圾”,你的數據質量如果不好的話,造成的結果是你對業(yè)務的分析不但起不到好的效果,相反還有誤導的作用。所以在2008年各個行逐漸開始探討數據管控相關的內容,尤其是數據質量以及原數據相關的內容,這是我們說的第二個階段,第三個階段我們可以歸納成風險和大數據時代的數據平臺建設,這一階段特征比較明顯,隨著新巴塞爾協議,要求各個行逐漸達標的情況下,各個行對于數據的需求,尤其是歷史類的整合類的數據需求,要求越來越嚴格,甚至對五年七年的數據整合都有要求,這就要求各個行對于倉庫本身的建設更加重視,同時基于倉庫風險數據集市建設也越來越多。這是第三階段的第一個特點。

  第二個特點是隨著銀行傳統(tǒng)平臺類的建設,互聯網對銀行的沖擊越來越大,不管是淘寶還是阿里,他們其實也做了很多之前類似銀行這樣的業(yè)務,而這樣的類似業(yè)務對銀行來說,有沖擊很大,銀行也在問,我能不能用他的技術,能不能也學他那樣做我們的業(yè)務。

  我們看整個的發(fā)展階段,其實可以看到整個經歷的從摸索到應用實踐到大規(guī)模推廣階段,這是我們說的國內大行的數據平臺整合建設過程,我們我看國內的大行數據平臺建設,對于我們城商行來講有什么借鑒意義?我們說數據平臺越早建設,應用收益越大,其實這個大家都知道,但是真正做到的并不多,我們可以看隨著現在風險類的應用,很多要求數據是五年七年,如果說你的平臺越早建設,這樣的數據要求越高,這樣的數據要求你對那個數據的追加難度越大,這是第一。第二我們說數據平臺和管控結合的內容,我們可以講在整個平臺建設過程中,初期的時候大行只重視了平臺建設,只重視了數據如何存儲,如何調度,如何監(jiān)控,但是對于數據質量初期重視并不是很高,但是隨著數據越來越多之后,大家慢慢發(fā)現在數據質量問題越來越明顯,這個回過頭來又做調整,如果對于我們城商行來講,我們已經看到了調整過程,我們做的過程中完全沒必要走他們的彎路,我們在初期建設數據平臺的時候,就搭著管控一塊兒做,這樣不管對數據質量,還是對以后支持應用來講,都有很大的作用,這是第二個借鑒點。

  第三個借鑒點,不能為了建平臺而建平臺,一定要和應用結合,這句話我們也是看了大量的案例,我們現在看國內的平臺里頭其實有兩家我們比較推崇,一家是工行,一家是民生,工行在數據平臺建設之后,大規(guī)模的推它的應用,尤其是查詢這一塊,最后工行這個業(yè)務支持力度很大,而民生從2003年開始做平臺,一直到2013年新核心改造之前,民生的整個平臺上搭了2600個應用,而這些應用我們可以看整個過程中行里對倉庫的認可度非常高,我們說倉庫的真正存活或者真正發(fā)揮價值的原始驅動力一定是業(yè)務部門的使用,所以我們在做整個數據平臺的時候,特別是初期的時候,一定要考慮應用,不能單純是技術,不能為了建平臺而建平臺,這是第三個可以借鑒的點。

  第四個點,隨著應用的要求越來越高,平臺的整合性越來越強,這樣的整合性其實也要求我們城商行在建這樣的數據平臺時,在初期的時候,對于數據整合一定也要考慮這方面的因素,一定要注意我們說的實體記錄相關客戶整合等等方面的內容,這樣對于后面我們支持風險類的應用有很大的作用。

  我們看一下城商行自己也有很多特點,我們這個團隊做倉庫做了十多年,我們之前做城商行并不是很多,我們2010年是第一家城商行北京銀行是最大的,但我們陸續(xù)后面幾年發(fā)展很快,目前已經做了幾十家城商行的數據平臺建設。我們在這個過程中,我們也走過一些曲折的路,因為最開始的時候,大行里頭做倉庫,投入很大,不管人還是硬件軟件都投入很大,在投入的過程中,如果把這樣的模式復制到城商行來講可能是致命的,不管是科技部門還是業(yè)務部門,都根本無法承擔這樣一個投資。

  我們可以看城商行里頭有幾個特點,第一個是投資小,見效快,我們在城商行的整個架構模式中一定要考慮在盡可能滿足他需求的情況下,投資盡量的小,而且一定要有相應的應用搭著做,能夠快速的起到效果,這是第一個,第二個城商行之前對于應用這一塊,很多也是監(jiān)管報送的需求,對于這樣的需求,以前都是分層級,或者分系統(tǒng)單獨建設,但是隨著現在銀監(jiān)會人民銀行需求進一步細化,特別去年我們報送提出要求各個行報相應的明晰數據,這樣的明晰數據需要和匯總數據核對,這要求我們不管從數據整合都提出了更高的要求,這也是經常各個城商行建平臺的驅動力。

  第三個特點數據質量差,這塊可能不太好聽,但實際情況我們之前做過大行之后,回過頭來做城商行,我們同來沒有想象到會遇到那么多數據質量,而這直接影響到業(yè)務使用,試想一下出了一張報表,報表里頭有50%的字段是沒有數的,或者它的數是錯的,這個業(yè)務根本就沒有辦法確診出這樣一個情況,所以我們說這個數據質量差,也是城商行的特點,這就要求我們在建數據平臺時,一定要考慮相應的質量檢查規(guī)則,考慮后續(xù)的調整測試,能夠盡量的貼近業(yè)務的使用。

  最后一個總體架構考慮不周的,之前我們碰到幾家城商行做交流,大家經常提的問題是能不能三個月給我把倉庫上線,先不要考慮那么大的架構,先應用來做,這一塊必須要強調,總體架構真的非常重要,因為對于一個BI類的項目,從開始到結束周期,或者見效可能需要三到五年時間,基礎平臺的搭建需要一到兩年的時間,在這樣的情況下,如果開始架構考慮不是很清楚,如果開始沒有想好未來三到五年架構里頭的原則,可能越做越迷盲,甚至做到一定程度你可能會反思我為什么做倉庫,所以在后續(xù)整個城商行平臺建設的時候,我們對于總體架構的考慮一定要在一期提出明確的架構規(guī)劃,這是城商行的特點。

  我們看倉庫的驅動力,我們無非從監(jiān)管系統(tǒng)要求,內部分析要求系統(tǒng)建設要求,其中特別是對于監(jiān)管系統(tǒng)要求,我們可以看在銀監(jiān)會發(fā)布的新資本協議管理辦法里頭,其實提了明確的需求,就是建立數據倉庫,來達到數據的轉換清晰目的,在這個基礎上建立數據集市,此外央行也提出了統(tǒng)一數據集中的要求,可以說這個數據倉庫的建設不管內外來講,都需要我們盡快去實施的項目,我們剛才提到了規(guī)劃的重要性,我們可以看一下,這是我們之前做的初步的規(guī)劃,我們對于一個平臺來講需要三到五年,一定要規(guī)劃清楚階段,我們一般分成這么幾個階段,一定是對于平臺的策略,這個平臺策略以及整個規(guī)劃方式包含了軟件硬件EIT工具調度工具,這個都是在這個平臺之前應該做的。

  在正式選定的基礎上,把整個平臺建設可以分為三個階段,第一階段我們叫做基礎建設階段,這個階段重點是搭架子支持一個重點應用,大家也可以看到,我們在規(guī)劃整個架構的時候,我們都是把它分了三塊,平臺建設,管控和應用,這個其實也是剛才我們看到的目前之前各個大行走過的一些彎路,讓我們得到的借鑒,我們希望在整個規(guī)劃過程中,我們既能考慮到平臺建設的完整性,又能考慮到整個數據管控和應用。

  第二階段需要逐漸發(fā)揮它更大的業(yè)務價值,包含需要支持更多應用,風險應用,在管控層面,數據分析可以做。

  第三階段是全面推廣階段,在這個階段我們在這一塊做的內容,其實是在各個平臺都已經相對完善的情況下,我們這時候需要把我們的數據推給業(yè)務用戶,我們希望我們的業(yè)務用戶能夠從傳統(tǒng)推送的方式到拉動的轉換。

  結合這三個階段,對于城商行來講,我們希望能夠做到長期規(guī)劃,但是同時小步快跑,逐步見效,我們不要一下子有一個大而全的,我們更多希望每做一步踏踏實實的發(fā)揮它的價值。其實剛才說的三期,我們重點看一期有哪些內容,我們總結下來分成這四分析內容。第一是數據平臺建設,這是最基礎的,它包含了統(tǒng)一的存儲結構,統(tǒng)一的角度結構,統(tǒng)一的監(jiān)控結構,數據交換結構,我們都會在這個基礎平臺建設里頭,我們可以講搭建基礎平臺是根本,因為只有有了這個平臺,我們才能談得上用處和后續(xù)的應用,這是第一塊。第二塊我們說的重點內容是模型建設,其實大家應該之前聽過倉庫方面的交流,我們對于數據架構有完整的架構,我們認為在數據架構里面最重要是兩塊,整合層和匯總層,這就是我們在數據模型的建設,其實對于之前大行的做法,最早是拿國外的模型產品對大行進行客戶化,其實對于城商行來講,我們的方式跟它類似,只不過我們參考模型不是國外的,而是之前大行的,但是有一個問題,之前大行做的時候,是根據它的業(yè)務特點,比如整合層有一些更加徹底,但是對于城商行來講在投資有限,時間要求比較緊的情況下,并不一定這樣的模型建設一定要嚴格按照大行的模式,我們需要在我們存儲效率和訪問效率之間做一個權衡,我們希望能夠在成本和效率之間做權衡,這個就是我們模型要做的工作,我們面向應用的模型設立的權衡點是我們后續(xù)應用擴展的基礎,這是第二塊。

  第三塊是應用類,應用類一般建議監(jiān)管報送,因為這樣的報送應用具有強制性,后續(xù)在業(yè)務使用上更好推進,最后一塊是管控建設內容,大行數據管控建設其實很多時候單獨成立項目,對于城商行來講,我們不是很建議,對城商行來講更希望能夠借鑒其它行的管控經驗,直接在我們的項目實施過程中進行相關落地,這個后面具體講。

  前面講到了整個平臺規(guī)劃,第一期的內容,對于平臺的實施,其實這一塊我們認為這個團隊在方法論上非常成熟,我們把整個數據倉庫平臺實施,可以歸結為二四論理論,什么叫二四論呢?解釋一席,重點是四種架構分析,我們要做好這個平臺,要對系統(tǒng)架構、數據架構、物理架構、運維架構一定要在初期有一個清晰的定義。

  第二是兩層的模型重點,一個是基礎層模型,一個是匯總層模型,尤其是匯總層模型它是更貼近業(yè)務使用的,我們在設計過程中一定要借鑒一些已有的經驗進行相關復制和擴展。

  此外說實施的關鍵點,整個倉庫實施過程中有兩點比較重要,第一如何把模型內容落地成腳本內容,在以前的方式下這兩種經常是脫節(jié)的,模型人員做模型,EQ人員做EQ,實際在現在情況下,我們更多是通過自動化工具,將整個模型完善落到腳本上,這個就是由自動化工業(yè)可以做。另外一個實施關鍵是數據標準的落地,我們剛才提到數據管控在城商行做的時候,不做大而全,做小而精,對于標準落地在一期時,一般建議是客戶整合落地,機構的落地以及指標落地,有些落地其實對對于城商行初期應用來講,就已經做的非常好。這一點也不太容易,后面會講到。

  另外六個基礎模塊,這個就偏技術一點,包括ETL、交換的,調度的,數據安全和管控等等,此外是管控策略和方法問題,我如何管理我的需求,如何能夠在每一步有什么樣的輸出,這個都是整個過程中會涉及的,其實我們看整個過程已經涉及了整個倉庫設計方法中所有一切關鍵點。

  我們接下來看整個設計過程中關鍵的內容,第一我們一直強調架構重要、規(guī)劃很重要,我們看一下一個企業(yè)基礎平臺的架構到底是什么,合理的架構是什么樣。講這個之前先講原則,我們在以前行業(yè)做的時候,很少講這個,為什么現在講的越來越多?我們現在看的不管在城商行還是股份制銀行,經常做了一段時間之后,大家會反問一些問題,我的數據集市和平臺的關系,數據集市存儲力度是怎樣的,我的應用和平臺里頭切分是什么,其實這個都是架構應該解決的問題,所以我們經過這么多項目的總結,包括我們之前在中信做新一代的企業(yè)數據平臺架構咨詢規(guī)劃時,我們進行了細致的梳理。

  我們認為在整個整理架構里頭,一定要考慮六個原則,第一我們說的數據集中和共享原則,我們做的企業(yè)及基礎數據平臺,它是公共的,是中性的,它的數據一定要做到集中和共享,否則就失去了它的意義。第二數據標準統(tǒng)一的原則,我們之前的時候各個集市做自己的,每個集市有自己的一套標準,到我們基礎數據平臺之后,我們在能統(tǒng)一的地方一定要進行統(tǒng)一,比如我們的機構這個要求一定要統(tǒng)一的,我們盡量的少開這樣的口子給特殊的應用做一套特殊的東西,因為這種口子一旦開了之后,你的架構會越來越亂。第三塊數據管理策略統(tǒng)一原則。我們說的數據管理策略包含出局存儲周期,存放策略,比如我們偏應用的特性的數據如何存放,共性的數據如何存放,這個原則其實我們一定要明確,我們大的方向是共性的數據一定要下沉,個性的數據逐漸上浮,也就是說共性數據都盡量落在基礎數據平臺上,個性數據可以逐漸落在各個集市上處理,此外還有減少數據復制的原則,這個很明顯,還有充分有限資源,這一塊比較重要的經常我們做一些平臺時,大家都問,我們現在怎么辦,大家經常觀點是推導重來,其實我們不是很建議這種方式,我們的原則是盡量利用現有的,現有的內容盡量的吸取把它集中到我們平臺去,讓它發(fā)揮價值。

  此外就是長期和短期相結合的原則,在這樣的原則下,我們看一看一個完整的企業(yè)級基礎數據平臺是什么樣,這個圖看起來很復雜,我們分解一下,分了幾個部分,第一個部分叫數據存儲平臺,這一部分主要解決的是數據的存儲問題,它包含了相應的數據架構,數據存儲策略以及應用切分點,這是第一塊,第二塊是應用,這實際是在平臺上的應用,大家都知道我們在倉庫上的應用分了幾種模式,我們的報表,數據挖掘,系統(tǒng)應用,這一塊應用是基于整個平臺建設的內容,這是第二塊內容。第三塊是數據管控,我們的數據倉庫質量管理辦法,比如數據標準等等,第四塊是數據交換采集調度平臺,這四塊其實是我們傳統(tǒng)情況下的數據平臺的點評架構,經過我們這兩年進一步的完善,特別是隨著我們對數據的需求,我們現在又擴展了一塊,這塊包含了實施數據區(qū)、大數據處理去,歷史數據存儲區(qū),在這個架構下,我們經常叫混合架構,因為它既考慮了傳統(tǒng)的結構性數據的處理方法,也考慮了非結構化數據處理方法。

  對于我們城商行來講,并不是一上來把所有內容全實施完,但是我們需要強調的是在開始時,一定要有這么一張圖,能夠清晰的看到我們后續(xù)要發(fā)展成什么樣,我們不一定開始就去建設這樣一個實施數據區(qū)或者大數據處理區(qū),但是我們相應的數據項目考慮,包括以后擴展接口,在架構里一定要考慮到。

  接下來談一下管控和數據平臺的關系,我們剛才講到對于城商行來講,在建設數據平臺時,千萬不要鼓勵建平臺,一定要和管控結合,我們提到數據管控,比如數據質量,數據標準內容,從我們這么多年的經驗,我們認為在城商行初級實施時,更容易落地的是數據標準和數據質量的內容。首先看數據標準,數據標準的落地大家都知道,我們整個數據從業(yè)務系統(tǒng)產生到后臺分析系統(tǒng),標準最好的地方一定是源頭落地,對于后續(xù)整個數據問題是最好的解決,但是同時大家也知道,這是最難的,你要在整個業(yè)務系統(tǒng)里頭讓它改動做調整,其實這個推進力度太大了,我們之前早年的時候在廣大改一個性別代碼花了四十多個人員做這件事,其實重點都是溝通協調工作,我們看到這樣一個情況后,現在越來越多的模式,把整個數據標準落地往后移,這樣推動更容易,當然也有它的問題,源頭問題可能仍然沒有解決,但是從管理型應用的方向來講,還是解決了很大一部分問題。

  對于數據標準來講,對于城商行來講,最容易落地而且最具有應用價值的是客戶整合的落地,機構代碼功能代碼的落地以及指標體系的落地,這幾個都可以作為我們在城商行推時數據標準的落地點。這是我們說的標準,我們有了標準才有數據質量,因為沒有標準談不上質量,質量無非是數據滿足業(yè)務需求使用的程度,我們有了這樣的標準之后,我們能夠用這樣的標準衡量數據怎樣,這樣不管從技術上的校驗還是業(yè)務上的校驗,在整個平臺每一層可以做校驗規(guī)則,在數據平臺里把數據質量規(guī)則做到自動化的配置和相應的校驗,生成報告來幫助我們解決問題。這是我們說的數據管控和平臺的關系。

  再看一下應用,我們說有了平臺之后,我們最終的目的一定是支持業(yè)務應用,業(yè)務應用是平臺最大的生命力,經過這么多年的積累之后,其實我們可以看,數據平臺的整個應用,我們會把它分成四個大的模塊,第一個是營銷和客戶關系管理模塊,這個簡單講,更多的CRM相關的一些內容,主要是從客戶的獲取管理細分價值提升等等部分的內容,這是第一塊。第二塊是合規(guī)風險管理,包含市場風險,操作風險,監(jiān)管報送體系內容都在里頭。第三塊是財務績效,管理會計,FTP等等內容都在這里,還有一塊是運營管理,這樣一個平臺里最終希望支持的應用包括四大塊內容。

  但是現在很多行,包括已經建了倉庫的銀行,比如廣大、民生,工行,其實很多應用在之前倉庫上建了,但是現在很多系統(tǒng)都在重構,重構的原因是什么,是因為在一些地方做的還不夠完善,如果后續(xù)做這樣應用時,我們希望在我們點上更加注意,第一我們更加關注數據整合,之前看到很多大行做時,做著做著數據最后又分散,隨著數據的分散,后續(xù)的維護包括數據標準的統(tǒng)一會越來越困難,所以我們說關注數據的整合,實際在后期應用里一定要特別注意。第二數據質量的有效提升,有這么多應用,應用里一定要特別重視數據質量,一旦發(fā)現數據質量問題,特別是影響到業(yè)務使用時,一定要第一時間跟業(yè)務部門溝通做相關的解決辦法,這個是讓業(yè)務人員能夠持續(xù)性的倉庫,讓倉庫發(fā)揮價值的很重要一步。

  第三第四都是應用之間的關聯關系,也就是說我們在建設應用時,要考慮應用之間的關系,比如說你要做產品定價,你要算產品的貢獻度,你要知道它的管理會計,FTP,這些應用之間的關系,在初期一定要有清晰的梳理,否則一開始什么都沒有,就要算貢獻度,可能你的成本是沒有的,你的內部專機價是沒有的,最后算出來的數只能是相對數,這樣的數其實就業(yè)務來講意義并不是很大。應用層面對于我們來講,希望在這幾點進行有效的關注。

  從應用模式上來講,我們有報表,應用系統(tǒng),靈活查詢數據挖掘,這個實際是傳統(tǒng)的數據倉庫使用的四種模式,這個可能講了至少有五六年以上的時間。我們今天想說的是這四種模式,其實后續(xù)還仍然是使用的主要模式,但是我們作為數據倉庫后續(xù)主要的責任方,我們現在做倉庫,一定要把傳統(tǒng)的推式服務往拉式服務走,也就是說要把報表和應用系統(tǒng)的支持,他數推給他使用的模式,逐漸的讓業(yè)務人員能夠主動喜歡用我們的平臺,能夠讓他自己有一個相應空間或者模式,能夠主動使用這樣的平臺,有了這樣的模式之后,我們的倉庫價值可能才能發(fā)揮的更好,這個其實就是我們需要強調的,我們一定要在任何時候,要注重業(yè)務人員主動使用數據倉庫的模式。

  接下來簡單看一下大數據這塊,我們之前跟各行談的也比較多,也很熱,我們可以看各個行現在都在做這一塊的試點,唯一能看到落地的廣大做了歷史數據查詢系統(tǒng),其它行更多是基于試點模式,對于我們城商行來講應該如何應對,我們之前銀行最多使用數據是結構化數據,對于非結構化數據,銀行之前并不是很多,無非是一些影像或者一些文本和語音,這樣的內容很多時候我們要發(fā)掘出來花的成本很高,而對于傳統(tǒng)結構性的數據,我們又有很多沒發(fā)揮出來的地方,所以這些銀行更多關注是結構化這塊,對于非結構化內容的出現,應該如何對待呢?我們認為非結構化數據,只是拓展了數據范圍而已,我們可以把它作為我們結構化數據的有效補充,所以當面對這樣的大數據來臨時,我們先要反思結構化數據是不是已經用好了,是不是已經用結構化數據讓業(yè)務感覺到它的價值,所以對大數據這塊,我們理解成數據源的補充就可以。

  我們再看一下在大數據情況下的架構趨勢,剛才講到混合架構的模式,我們說這個在往后走,可能就是集團制混合架構的模式,什么叫集團制?除了傳統(tǒng)的銀行業(yè)務之外,以后還有其它一體化的,非結構化電子渠道互聯網信息,當然這個是我們以后長久來說的發(fā)展模式,我們可以作為參考來講,我們可以講在這樣情況下,第一步搭建企業(yè)級基礎數據平臺,處理結構化的數據,才是我們的重中之重,只要有了這樣的架構之后,我們后續(xù)的拓展才能在架構上拓展。

  最后就基礎數據平臺,我們之前的經驗包括剛才講的內容,做幾點分享。第一不要因為大數據擾亂我們建設的節(jié)奏原則,這個很重要,大家都對外談大數據,但是一定要清晰認識一點,它只是一種數據模式,只是現在數據的補充,而不是把原有的推翻,我們說金融的本質沒有改變,我們傳統(tǒng)的銀行業(yè)務也不會因為阿里巴巴的出現完全顛覆掉,這個我們其實之前在很多場合還是研討會都可能聽到過,第二基礎平臺現在不是關注的重點,我覺得我們這個團隊,是沒有什么問題,因為剛才賈總也講到,目前凡是涉及到數據平臺的我們這個團隊都做過,而且都有相關的成熟案例,而且對于技術這一塊比較成熟,不管數據庫還是ETL、調度還是數據交換,來回無非就那一種工具,所以對于這塊的情況,我們認為不管選哪平臺還是工具,都不重要,重要的是最后數據能不能合理的存放,最后是數據能不能合理應用。

  第三點原則和架構是不變應萬變的原則,前面我們已經提到,在任何時候都不要放棄我們的原則和架構,在判斷數據是不是應該在平臺來提供,是不是應該做這樣的應用時,都可以拿我們的原則和架構做梳理,就能在任何時候讓我們清醒意識到,我現在的位置是什么,我以后往哪個方向發(fā)展,我之前做了什么,其實這幾點了解之后,我們在任何時候都能夠有信心知道,我們平臺的價值在哪里。

  第四個正確存儲的方法論決定了項目的質量,剛才我們提到二四六理論里頭的實施方法論,對于每一步來講,不管是輸入輸出,還是中間貫穿的內容包括模板,這些都有成熟案例,我們希望通過跟城商行一塊兒建數據平臺,不只是搭建一個平臺我們希望這套管理辦法,相關的模板流程能夠同時被城商行使用,建立一套他們對數據的管理體系。

  最后一點我們一定要有意識的逐步引導業(yè)務主動進行數據分析和探索,在任何時候千萬不要把數據平臺定義成儲存,一定要有意識的告訴業(yè)務,我有什么樣的數據,你能夠發(fā)揮什么樣的業(yè)務價值,因為只有在這樣的情況下,你倉庫的生命力才會越來越強,我今天講的內容就這些,謝謝大家。

錯誤報告  分享到: