誰都不可否認,社交、移動、云和大數據這四大發(fā)展趨勢,加快了大數據時代的到來。數據作為企業(yè)一種“無形資產”的重要性變得比以往更加明顯了,這也催生了“數據經濟”的概念。而作為承載和處理大數據的底層平臺,存儲系統(tǒng)對企業(yè)掌控“數據經濟”起著關鍵的影響作用,正如大家所知,大數據日益增長以及大數據多樣化的特點,也對存儲系統(tǒng)提出了前所未有的挑戰(zhàn),尤其是在多供應商設備“同處一室”的環(huán)境下。從某種角度上說,存儲系統(tǒng)有著服務器系統(tǒng)架構相似的演變過程——虛擬化,而大數據時代的來臨也必將加快這一進程,并對其帶來新的需求。
數據“分立”之苦將隨數據積累而增加
國內某冷藏設備制造商企業(yè)CIO在采訪中表示,這家企業(yè)從6、7年前開始做虛擬化,部署了虛擬化之后,他們從原來的采購到安裝系統(tǒng)、應用程序再到測試的3到10天,到現(xiàn)在僅僅不到30分鐘就可以完成,當遇到服務器宕機等問題,利用自動備份也不會影響業(yè)務的連續(xù)性,單臺服務器的利用效率從原來的7%提高到60%~80%。這位負責人表示:“虛擬化技術在很大程度上促進了整個數據資源的整合,最后也形成我們的統(tǒng)一的IT服務平臺,連帶著資源精簡和成本節(jié)約的效果,都是非常明顯的。”
由此案例可以看出,部署虛擬化的最初目的不是直觀的降低成本,而是使原本相對獨立的服務器架構比過去任何時候更為整合,使原有的IT架構可以支撐更多的應用,提升總體應用率,而成本的降低則是這一調整后的必然體現(xiàn)。
隨著應用的不斷增多與持續(xù)的工作,數據也在不斷的積累,而互聯(lián)網商業(yè)模式的爆發(fā)與移動互聯(lián)網的興起,也讓數據的類型也在極大的豐富。但與之相對應的,則就像以往各自為戰(zhàn)的服務器一樣,是各自為戰(zhàn)的存儲——它們品牌不同、訪問界面迥異、數據難以共享聯(lián)動,從而讓豐富的數據積累在為企業(yè)帶來新的商機的同時,也因數據“分立”帶來了更多的痛苦。
現(xiàn)在我們來看一組IDC的數據:從2005到2020年,數據將增長300倍,其中80%是非結構化數據。而與形成鮮明對比的,則是只有1/5的客戶擁有高效的IT基礎架構,Storagenewsletter網站調查顯示,雖然有63%在用戶已經采用了服務器虛擬化,但只有16%的人擁有虛擬化的存儲平臺。
這里傳遞了一個潛在的信息:相互獨立的存儲平臺將成為企業(yè)把握數據經濟、利用數據價值的最大阻力,而隨著數據的不斷積累,當人們越來越覺得數據重要,成為新的應用與商業(yè)決策根基,并因此誕生大數據商業(yè)理念之后,就會發(fā)現(xiàn)這種傳統(tǒng)的存儲架構,必將企業(yè)的業(yè)務效率與經濟效益——可以說這是忽視存儲虛擬化“積勞成疾”的最終代價。
存儲虛擬化:給系統(tǒng)以新的生命給數據以更高的自由
現(xiàn)在大多數企業(yè)用戶的IT環(huán)境都在使用不止一家廠商的存儲設備,他們在沒有實施存儲虛擬化之前,不同的磁盤陣列“各自為政”,有的陣列空間消耗迅速,性能跟不上應用需要,而另一臺陣列卻在空間及性能方面都很充裕,無法將其資源支援到其他陣列中,這恐怕是企業(yè)基礎架構在存儲方面最大的絆腳石之一了,很多企業(yè)深受其苦。
更加糟糕的是,市場中的存儲設備品牌和類型繁雜多樣,而且每一家廠商的存儲設備都有自己單獨的管理界面,更不用說這些界面和功能較為復雜,需要一個培訓和熟練掌握的時間了,所有這些都在無形中增加了存儲管理的難度,對于集中存儲和簡化管理的需求就更加迫切了。隨著業(yè)務發(fā)展,存儲虛擬化必然會不斷增加,這時候,導致存儲環(huán)境分散化和異構化的問題更加凸顯,這對于提高利用率、為新用戶和新應用分配存儲空間是非常不利的。
部署存儲虛擬化之后,企業(yè)環(huán)境中可以支持包括EMC、NetApp、HP和Oracle等多品牌的異構存儲設備,在統(tǒng)一的資源池中集中管理和調度,以IBM的Storwize產品家族為例,通過其自身的存儲虛擬化功能,使得基礎設施中的資源利用率提高近100%,實現(xiàn)零應用故障停機,節(jié)省大約66%的運營成本
存儲虛擬化將在這里發(fā)揮異構存儲整合的獨有優(yōu)勢,將環(huán)境中異構磁盤陣列進行虛擬化,不僅可以提高老舊設備的利用率,使其充分發(fā)揮“余熱”,而且能使大部分管理工作集中在一臺設備上執(zhí)行,避免管理和操作多個系統(tǒng)的繁重工作,同時也降低管理出錯的概率。我們可以按照具體需求將存儲資源動態(tài)地分配給應用,從而降低系統(tǒng)管理難度和成本,提高整體系統(tǒng)效率;讓數據能夠在不同平臺間透明地存儲和遷移,提高管理員的工作效率,充分調動整個環(huán)境下的資源,迅速解決容量或性能問題。
不過,就存儲虛擬化本身來說,其誕生要追溯到很多年前,就如服務器虛擬化也是在其獲得業(yè)界廣泛認可之前已經存在了幾十年一樣,存儲虛擬化也已經誕生了很長時間,說其為存儲領域的“陳年老酒”并不為過。
縱觀整個市場,目前主流廠商的解決方案中大多具備存儲虛擬化技術與產品,如EMC VPLEX、HDS VSP以及IBM SVC,在經過多年的打磨之后,存儲虛擬化這一“陳釀”注入了什么新鮮的元素呢?
IBM SVC(SAN Volume Controller)最早于2004年推向市場,距今已有10年歷史,其采用Linux內核和基于x86標準服務器,作為虛擬化的管家。虛擬引擎是一種帶內技術,它的模塊化結構可以有多個集群節(jié)點組成,每個節(jié)點配置有大容量緩存和高性能處理器,位于存儲和主機之間,可以把不同存儲設備組成一個大型存儲池,其中若干存儲設備以一個統(tǒng)一邏輯設備存在,被系統(tǒng)中所有服務器訪問,防止出現(xiàn)存儲設備的信息孤島。
SVC通常與IBM Storwize V7000底層存儲陣列搭配,可以將SAN環(huán)境下所有異構磁盤陣列虛擬化成一個融合的、統(tǒng)一的存儲池,數據可以跨不同陣列透明地存儲、轉移。在這之中,SVC起類似“網關”的作用,而V7000則提供存儲陣列。
在技術規(guī)格上,新一代SVC也體現(xiàn)出了自己的新意——核心控制器平臺獲得兩倍性能提升至128核心,連接性也擴展了50%,擁有96個FC端口,緩存容量提升2.5倍擴展至512GB,并配置了6倍于以往的集成閃存存儲容量(達192塊盤,采用IBM FlashSystem)。這一系列硬指標的顯著提升,也將讓SVC可以更為從容的應對大數據所帶來的新一輪挑戰(zhàn),確保存儲虛擬化效率不會因數據的密集提升而有降低,并為軟件定義存儲的發(fā)展提升了堅實的硬件平臺。
IBM SVC+IBM FlashSystem組合而成的存儲平臺,將存儲虛擬化的靈活性、可管理性、高級軟件特性與全閃存存儲的頂尖性能融合在一起,為用戶提供了新一代面向大數據時代的高級聚合存儲平臺
可以看到,經過上面這一系列更新之后,存儲虛擬化這項老技術,成為IBM產品家族在軟件功能上的一個“基石”,并且在針對實現(xiàn)高效率存儲和應對大數據挑戰(zhàn)上,有了更進一步的打磨,其配合相應的存儲系統(tǒng),為全面的再造存儲提供了可能。
面對大數據時代存儲需求的另一個重點,則在于對數據的實時壓縮,與存儲虛擬化一樣,實時數據壓縮也并非新的技術,但對于大數據時代,則顯然有了更為重要的意義。從表面上看,這與存儲虛擬化似乎并沒有太大的關系,但從整體的經濟性考慮,則與存儲虛擬化相輔相成——存儲虛擬化讓數據平臺融為一體,提高了整體存儲平臺各組成設備的利用率,而數據壓縮則在此基礎上進一步提升了存儲平臺的經濟性,這方面(存儲虛擬化+實時數據壓縮)的典型代表就是IBM Storwize系列,它們體現(xiàn)出了當前存儲系統(tǒng)的發(fā)展的主流趨勢。
小結:存儲虛擬化是大數據時代下一款必備武器
總的來看,對于企業(yè)來說,虛擬化已經成為十分有必要實施的一項技術,給企業(yè)帶來的積極影響不言而喻。虛擬化將帶動著IT產業(yè)格局的改變。無論是IT廠商還是企業(yè)用戶,在虛擬化演進過程中逐步將虛擬化作為業(yè)務的核心戰(zhàn)略之一,服務器、存儲,甚至網絡均是如此。
當落后的存儲技術成為企業(yè)把握數據經濟、利用數據價值的最大阻力時,存儲虛擬化作為一種能夠有效改善效率和資源利用率的手段,為數據平臺帶來更高的靈活性與投資回報率,所以存儲虛擬化在企業(yè)IT架構中的普及是必然的,對于大數據時代下的現(xiàn)代企業(yè)來說也是必要的。