EMC毛文波:我亦云雲也談雲端計算

軒墨發表於2017-09-08

本文講的是EMC毛文波:我亦云雲 也談雲端計算,【IT168 評論】在結繩記事的年代,最好的計算機就是人,繩子當然就是最好的儲存裝置。後來計算機和儲存裝置被封裝成大大小小的金屬盒子。大的可以有一整個房間那麼大(所以IBM曾經預言全世界只要5到6臺計算機就夠了),小的變得越來越小,也越來越無所不在。如今好,計算機和儲存裝置開始“蒸發”了,變成“雲”的形態從而可以非常容易地在任何地方獲取到!從繩子到盒子到資料中心再到雲,從稀缺資源到無所不在再到非常容易可隨時隨地隨意獲得。技術的進步不僅使計算、儲存的形式發生了鉅變,也使人們在如何獲取計算、儲存資源的方式上正在發生著變化。其實這句話說反了:正是由於人們在資料、資訊處理的要求上、對於計算、儲存資源獲取的方式上不斷提出新的需求才促使和催生了新的技術進步、發展以滿足之。

    我們可以先用一種簡單的方法對雲作一番解釋:雲端計算、雲端儲存實現了讓人們用獲得服務的方式隨時隨地獲得計算、儲存的資源而無需自己購置、管理這些裝置。這個簡單的說法著重並且狹義地反映了雲技術的出現是為滿足人們在獲取計算、儲存資源的方式上出現的新需求:象獲得如水、電、氣等通常的基礎設施服務那樣來獲得計算、儲存服務。從需求推動技術進步發展的角度來講,雲端計算、雲端儲存技術的出現很自然。人類活動凡涉及資訊方面正在全方位網路化、互聯化,所以資訊處理向基礎設施服務轉化也是理所當然,並沒有什麼特別深奧的道理(或者象筆者常聽到的,是炒作IT新概念的“陰謀”,為了掀起新一輪銷售熱潮 )。當然,把計算、儲存這種相當高階的東西歸類到通常基礎設施服務似乎有點“矮化”雲技術之嫌,事實上這樣的說法也有侷限性。傳統基礎設施服務的消費使用都是發生在使用者端(所謂前端),而云計算、雲端儲存的最顯著特點是服務的消費使用主要發生在遠離使用者的服務端(所謂後端)。既然資訊處理要遠比發電、水處理等複雜得多,雲端計算、雲端儲存即便按如上簡單狹義理解為一種基礎設施服務,則在服務需求、種類及複雜度上也應該遠比傳統的基礎設施服務要有名堂得多。本文試圖從幾方面把這些名堂做一番梳理。

 1 下一代資料中心的需求

    後端資料中心是雲技術的一個核心部分。據估計迄今僅在全美國已有7,000多個資料中心。其中絕大多數是在多年前的設計基礎上不斷新增伺服器發展起來的。所以在一個老的資料中心可以看到很有意思的歷史痕跡:伺服器硬體的技術更新以及不同年代開始跑在不同伺服器上的應用軟體。如此構造起來的資料中心是非常低效的。通常一個伺服器上只跑一個應用。根據McKinsey和Uptime Institute調查,伺服器的平均利用率在6%。更有甚者,大約30%的伺服器更本就不在提供任何服務!原因是無人知道哪臺伺服器正在跑哪個應用。若真想要知道,常用的方法是:“把插頭拔了,看看誰會打電話進來!” 現在的資料中心已經發展為超大規模。如微軟在芝加哥郊外Northlake新建的一個,也許是迄今為止最現代化、最大、最昂貴的資料中心吧:佔地4萬6千平方米,清一色毛坯簡易房,一層樓可以放200個標準貨運集裝箱,每個集裝箱裡可以塞進兩千五百臺PC伺服器!

    絕大多數的資料中心使用Windows作業系統,也就具有一個共同的缺點:應用與伺服器之間存在緊偶和關係,一個伺服器跑一個應用。這樣做也許是為了避免萬一由一個應用崩潰造成的當機而拖累了別的服務吧。所以長期以來在資料中心存在著一個叫做伺服器蔓生(Server Sprawl)的現象:每來一個新的服務應用需求就增加一臺伺服器。如果說伺服器越來越便宜這不是個問題,那麼為運轉大量伺服器以及為冷卻它們所需耗費的電能呢?維持如此低的伺服器利用率當然是不可持續的。

    下一代資料中心要採用硬體虛擬化技術。在一個伺服器上可以虛擬出若干個虛擬機器,每一臺虛擬機器上可以跑獨立的作業系統和應用。不同虛擬機器之間有很好的隔離,互不干擾。應用是跑在虛擬機器上的。如果一個虛擬機器被應用給搞崩潰了,其他的虛擬機器不會受到影響。更重要的是虛擬化技術打破了應用與伺服器之間的緊偶和關係。因為一個虛擬機器實際上是一個軟體,可以象檔案拷貝一樣從一臺伺服器遷移到另一臺。這樣的遷移甚至可以在虛擬機器不間斷服務的情況下進行。通過虛擬機器遷移可以大大提高伺服器的利用率。虛擬化技術的核心軟體叫做虛擬機器監控器(Virtual Machine Monitor, VMM)。你可以把VMM看作是伺服器上的電子交警,管理伺服器上所有的虛擬機器,監控它們使用硬體的情況,確保它們互不干擾。VMWare是一家專門從事虛擬技術的軟體提供商。VMWare的CEO Paul Maritz(曾經是微軟資深人士)這樣評價虛擬化技術:“我們把計算作業載荷與硬體分開,這樣做從某種意義上我們是在彌補微軟所犯下的罪過。” (In a way, we’re cleaning up Microsoft’s sins, and in doing so we’re separating the computing workload from the hardware)。 VMWare已經在2008年9月推出一款全新的“虛擬資料中心作業系統”(Virtual data-center operating system)。VMWare期望用這一技術使硬體資源的虛擬化不必侷限於單個獨立的硬體,從而可以把整個或若干個資料中心按需求整合為一個計算、儲存、網路的資源池。


2 雲服務前端的需求

    現在讓我們再來看看雲服務的前端發展狀態及其本質。

    目前用個人電腦桌面瀏覽器是人們接入雲端的主要前端工具。但其它形式工具正在層出不窮。雲既然具有無所不在的特點,接入點的前端工具就也應該是無所不在。首先是個人電腦正在越變越小、輕、薄、可移動,從而使在隨時隨地接觸雲變得越來越方便。請注意,究竟是前端接入工具的輕薄化、可移動化造成了雲服務的無所不在,還是雲服務這一需求催生了前端接入工具的這些變化?筆者願意作出如下的說法:從技術發展過程上來說,雲技術的發展是與資訊科技的發展互為因果的。然而從雲的本質上來分析(見下文馬上給出),雲是本而硬體裝置是末。筆者還認為這個說法同樣適用於本文所有其他部分對最新呈現技術的介紹。

    或許在前端接入工具的輕薄化、可移動化的方面最具有示意性作用的標誌是Intel於2008年6月推出的新款處理器Atom晶片。這款處理器是專門為裝入所謂的“網路本”(Netbooks)、“網上”(Nettop)電腦與“移動網際網路機器”(Mobile Internet Devices, MIDS),主要為網路瀏覽之用而設計的。超小、省電是其主要特點(比如在低負荷時能主動降低CPU頻率以減低能耗)。Atom處理器技術與無線寬頻技術結合,輕薄便攜的網路本、各種專門化的電腦如電子書(如Amazon的Kindle)、智慧手機,等等將使得接入雲端之埠正在變得名副其實的無所不在。

    然而云服務帶來的一個重大變革是從以裝置為中心轉向以資訊為中心。裝置包括應用程式只是來去匆匆的過客(現在還有誰能讀出軟盤?),而資訊及人們在資訊中的投資則是必須要長期保留的資產(一年換兩個手機的人多了去了,而手機丟失的最重大損失恐怕是沒有做備份的通訊錄吧)。所以如上所述的無論多麼新穎的,目前甚至可以是相當昂貴的前端硬體裝置都會過時,有的甚至會很快過時,變為一文不值!雲上什麼不容易過時?資訊!不僅不過時,許多資訊必須長期儲存,而且越久越有價值。VMWare的CEO Paul Maritz解釋道:今後在雲上每個人都將會有一個伴隨終生的個人資料體,這樣的個人資料體不會被捆綁到任何一種機器上,雖著機器的過期失效而失效。如何實現這樣一種屬性呢?虛擬化技術再一次發揮作用(虛擬化技術在下文中還要發揮重要作用)!注意,在這一節裡虛擬化是針對前段技術而言的。VMWare的虛擬工作站大概是一個眾所周知的前端虛擬技術應用的成功例子。然而更酷的是VMWare已經為本公司員工實現了虛擬桌面計算機,可以由中央集中管理。作業系統及應用都不是跑在員工面前的PC上,而是跑在資料中心的虛擬機器上。這樣的虛擬機器理論上可以被任何一種前端PC硬體所使用。所以早晚各種前端硬體工具都會被同樣的技術虛擬化。硬體的過時,應用軟體的過時,在雲上都不再是一個問題!


3 資訊管理的需求

    雲服務即便被“矮化”敘述為一種通常基礎設施服務,其海量資料、高效能/高訪問量以及低成本也是一個不可忽視的特性。每年全球新產生的資料急劇增長,然而只有當這些資料被有效地組織和管理後,它們才具有真正的價值。這是非常簡單的道理,EMC 內容管理與歸檔(CMA)部門主管Mark Lewis有個形象的比方。我們每個人都希望擁有一個大車庫,但是如果車庫裡東西太多又雜亂無章地放置,要找某個工具偏偏找不著,不得不去超市買個新的,那麼這個車庫的價值就大打折扣了。資訊同樣如此,如果我們能對儲存在資料中心的資訊進行有效的組織和管理,提供對資訊的無遠弗屆的訪問能力,那麼這些資訊的價值將大大增加。

    雲中資訊管理第一個要求就是確定哪些資訊是需要儲存的。Mark Lewis認為,如果資料本身價值超過了儲存它們所需要的代價,那麼留下它們就是划算的。蘋果的iTune就是一個合適的例子,那些一年只有一次下載量的歌曲都值得被儲存在伺服器上。每首這樣的歌曲能夠提供98美分的利潤。當然儲存資料有不同的代價,通過分層的資料儲存架構,那些價值較低,需要儲存多年的資料可以被轉移到相對便宜的儲存當中。

    顯然,要解決的第二個問題就是資訊的價值評估,即如何將需要儲存的資料按照其價值分級。價值評估通常要受到公司政策和國家法規的影響,需要提供基於策略的資訊管理。對於資訊的重要性和價值,公司通常有很多複雜的策略。有些公司認為訪問頻繁的資料更有價值,有些公司認為資料的創造者表明了其價值,比如技術公司的CTO建立的文件就可能要比其他人的文件更重要一些。不同的公司往往根據其業務性質而採用不同的策略。類似的,有些國家對企業資料有嚴格的法律規定。比如美國規定如果消費者訂閱了某種服務,相應的記錄必須儲存多年,北歐的國家規定如果客戶取消了他在某家企業的賬戶,那麼企業必須保證刪除他的個人資料。又比如Data Islandia,冰島的一家資料儲存服務商用物理隔離的方法來保證來自不同國家的資料不被混在一起。該公司業務是保留使用者硬碟,分部於全球使用者的磁碟在被空運到冰島的路上就被裝入不同的集裝箱,有美國集裝箱,歐洲集裝箱等等。種種規定不一而足。除此以外,如果資料在多個應用之間共享,那麼在不同應用中其價值可能差別很大。因此,資料本身和它的價值評估策略必須區分開來,資料本身必須是自描述的(self-descriptive),除了安全上的考慮,資料本身不能強加任何限制策略。只有這樣,整個資料儲存架構才能適應多方面的需求。這個過程可能是長期的,公司的利益考慮和國家法律都會成為設計靈活資料儲存架構的動力。

    雲服務提供資訊管理服務的另一個問題就是如何找到需要的資訊。要高效的找到某條記錄,必須依靠它的後設資料。使用XML等格式來標註資訊是非常必要的。要標註大量已有資料通常需要大量的人力物力投入,有些資料甚至都不是電子版的。在那些跨國企業中,後設資料很可能需要用多種語言標註。一種簡單的策略是隻標註那些被用到的資料,至於其他的資料,還是讓它們過期吧。有了後設資料,使用者就可以對資料進行多維的檢索。在藥品行業,你可以通過藥品名稱,適應症等多種維度來檢索需要的藥品,這往往比傳統的關鍵詞檢索更有效率。後設資料相比資料本身的另一個優勢是,後設資料是可以移動的。根據某些國家的規定,資料本身不能轉移,而在某些情況下,企業需要對資料進行全盤的管理。這時候後設資料就可以代替資料,被移動到需要的位置。

    上述問題是雲環境下,企業進行使用者資訊管理所需要解決的一般性問題。但是如果這些使用者本身就是企業的職員,那麼問題就更加複雜了。因為在這種情況下,企業不僅需要為管理使用者的資訊,還需要提供一個幫助使用者分享資源,協同工作的環境。一個簡單的例子就是公司內部的維基百科(Wikipedia)。在這種“內雲環境”下,資源的共享程度比“外雲環境”更高,對資訊許可權的控制也更為嚴格。任何一個使用者都可以在自己許可權範圍內對公有資訊進行有效地管理,而且資訊的更新需要及時通知那些相關的使用者。一般意義上的雲資訊管理不能完全滿足這種附加需求。EMC的Documentum推出了轉為企業使用者定製的具有云特性的資訊管理平臺。它提供了一系列措施,來幫助使用者既高效,又安全地管理他們需要知道的資訊。


4 雲服務與低成本

    雲服務是把企業IT裝置及專業管理人員的長期大筆資本開銷(CapEx)轉為以按需租賃為形式的運營開銷(OpEx)。前面我們討論過IT硬體裝置更新過期速度越來越快,專業IT管理人員更是越來越稀缺資源。所以雲服務的低成本特性從使用者的角度來講不言自明。這一節我們主要從後端資料中心的角度來講雲服務的低成本特性。

    當我們考慮成本的時候,需要考慮硬體成本,管理成本和使用成本。硬體成本主要是指購置硬體所需要的費用,包括伺服器,儲存系統,網路裝置,等等。人們往往會很直觀地考慮硬體成本而忽視管理成本和使用成本。其實在大型資料中心,儲存系統的管理、使用成本遠遠超過(可以數十倍於)硬體成本。

    先來看管理成本方面。資訊生命週期管理認為資訊存在生命週期的不同階段,包括產生、讀取、更改、遷移、存檔、回收等等。通過實現資訊生命週期管理來幫助使用者在資訊的各個不同階段以最低的成本獲得最大的價值一直是工業界關注的一個問題。EMC是工業界重要的推動力量之一。CEO Joe Tucci早在2003年就認為資訊生命週期管理是儲存界的一次重要革新。實際上,將資訊生命週期管理和雲端計算結合起來也能有效地降低管理成本。比如,在資訊產生的初期,資訊的價值相對較高。一個典型的例子是使用者一般會頻繁地訪問最近收到的電子郵件。隨著時間的流逝,該資訊的價值越來越低。此時可以將該資訊遷移到低速、低成本、低能耗的儲存系統中以節約成本。當該資訊需要後續服務時,將其重新遷移到高效能裝置中以保證服務質量。重複資料刪除技術(deduplication)主要用於備份系統中。它通過剔除冗餘的資料,從而使用更少的儲存資源(意味著更少的費用)來儲存更多的資料。當該技術用於遠端備份時,在源端進行重複資料刪除還可以有效地減少網路流量。EMC通過收購Avamar,將重複資料刪除技術納入其備份軟體,從而實現其備份軟體的綠色化。基於以上技術,EMC 先後推出了Disk Library 3D 1500/3000,EMC Disk Library 4000, EMC Avamar Data Store二代 和EMC Avamar 4.0。這些技術使得EMC成為業界唯一能提供從軟體到硬體整體解決方案的綠色儲存供應商。

    使用成本則主要包括運營大型資料中心所帶來的電力的消耗,以及日常維護所需要的費用。以資料中心為例,資料中心不僅僅是一堆伺服器和網路裝置,還包括各種空調,和各種冷卻裝置。雖然由於計算機技術的發展,單位計算能力或者單位儲存空間的能耗在逐年降低。但由於資料的爆炸性增長,其整體能耗是在逐年升高的。資料中心不僅是“吃的是電,擠出的是位元”,還同時產生了大量熱量。所有的資料中心都要用冷卻裝置以保證裝置的正常執行。前面我們提到過現代資料中心的極低利用率。儘管大量的資源被閒置,但仍舊需要消耗能量以應對隨時可能達到的資源需求,因而仍舊需要冷卻。由於計算機的絕大部分元件,包括CPU, 磁碟,記憶體顯示器,甚至網路卡都支援不同的工作狀態,不同的工作狀態消耗不同的能量。比如,完全可以在低負載情況下降低CPU的頻率以降低能耗。作為儲存領域的領軍,EMC一直致力於降低其儲存系統的能耗,從低端到高階,從而實現綠色數字化,並且降低使用者的使用成本。EMC於2008年4月在中國首先推出的新產品儲存寶箱(StorageCredenza)內就使用了硬碟spindown技術,通過在低負載時將磁碟轉入低能耗狀態而節省能量。CEO Joe Tucci在2007年就曾表示要將該節能技術逐步應用到所有的EMC磁碟陣列產品中去,從而實現EMC產品的綠色化。EMC系列產品,Celerra 系列,CLARiiON 系列,EMC Centera 內容定址儲存 (CAS)系統,高階儲存系統DMX-4系列的入門級產品—DMX-4 950磁碟陣列,都支援新的 750 GB SATA II 磁碟。對於相同的儲存容量,單個大容量的磁碟比多個小容量的磁碟要消耗相對較少的能量。這一舉措可使EMC的相關係列產品降低大約33% 的裝置能耗。另外,由於固態磁碟(Solid State Drive,SSD)具有運轉溫度低、讀取速度快、體積小以及耗電量少等特性,EMC也在其高階Symmetrix DMX-4當中搭載SSD。雖然SSD存在壽命問題,比如單塊的擦除壽命大約在1,000,000次, 但EMC通過均勻磨損演算法,採用大量的SSD儘量將要擦除的塊均布在所有的SSD中來很好地解決了這個問題。

    由於資料的爆炸性增長,大量的資料中心紛紛被建立起來以應對資訊數字化的需求。然而,由於所有的資料中心都各自為陣,造成了兩方面的後果。一是資料中心的大量有價值的資訊形成了資訊孤島,無法被有需求的使用者有效使用。二是由於所有的資料中心在建立的時候都會考慮在未來幾年資料增長的需求,因此造成大量閒置的資源。雲端計算或者說雲端儲存試圖在這些孤立的資訊孤島之間通過提供靈活,安全,協同的資源共享來構造一個大規模的,地理上分佈的,異構的資源池。從而充分提高系統的資源利用率,包括資訊資源和硬體資源。再結合採用有效的資訊生命週期管理技術、節能技術,雲服務可以極大地降低IT的總體成本。


5 雲服務、軟體即服務和Web 2.0

    雲服務也與軟體即服務(SaaS),Web 2.0等其它較新的技術趨勢和概念有交集。

    先來看SaaS。傳統上軟體盈利模式是靠賣終端使用者使用版權(又叫做“按座位使用版權”per-seat license,當然是對非移動電腦而言)。舉個簡單例子,如果你回家後還要在家庭電腦上繼續處理一個白天在辦公室裡未完成的檔案,那麼儘管你使用同一軟體,如Microsoft Word,但由於是在兩臺不同的終端上使用,你(或你公司)就必須為此而購買兩份Word使用版權。哪怕你分身乏術永遠不會有機會同時使用這兩臺電腦!SaaS模式認為這是一種資源浪費。軟體可以也應該按需(使用時間、次數)消費。我記得有個Wave Systems Corp在上世紀90年代就推出一個EMASSY晶片技術,可以對使用者所租用軟體的使用次數進行記數,當某租用軟體被用到一定次數後,該軟體的使用版權便歸使用者所有。這是一個早期比較初級的軟體按需消費方法。Wave後來通過EMBASSY技術來順應可信計算集團(TCG)技術。我們在以後一章中會討論TCG技術在雲端計算中的應用。

    我們前面多次說道雲端計算是將IT變為由後端資料中心提供服務。雲前端的接入裝置越來越的輕薄化、可移動化(即所謂的“瘦客戶端”,thin clients),越來越注重突出上網功能(所謂上網本netbook),而消弱本機計算處理能力。所以在“瘦客戶端”機器上安裝重部頭的,完全使用本機資源進行計算處理的應用軟體,這種做法在雲端計算理念上正日漸式微。許多應用軟體(包括作業系統)正在往雲的後端資料中心伺服器上轉移。第一章中提到的“VMware虛擬資料中心作業系統”(Virtual data-center OS)將會變為行業標準。由此不難看出雲端計算與SaaS的交集正在增大。如果在Amazon Web Services(AWS)Elastic Compute Cloud(彈性計算雲EC2)上使用過Microsoft SQL Server,Windows OS,你也許會注意到這些軟體在雲上的使用其實就是租用。比如帶有SQL Server的AMI虛擬機器要比不帶有該軟體的貴1美元每小時。這就是SQL Server在EC2上的租金。

     許多專門用於企業管理的軟體具有廣泛的通用性。這些軟體包含:企業資源計劃(Enterprise Resource Planning, ERP),客戶關係管理(Customer Relation Management, CRM),員工管理系統(Human Resource Management System),還有生產、供應鏈、財務、倉儲、等等管理資訊系統(Management Information System, MIS)。這些軟體除了具有跨企業、跨行業的廣泛通用性外,還具有如下重要共性:後端(共享)使用資料(庫),前端可以通過網路瀏覽器以Web Services的方式來操作使用,或者說前端如何使用與客戶端作業系統無關。使用者完全可以認為這些軟體包括作業系統本身都不是什麼重要資源,而它們所處理的資料才是企業的極其重要的資源。既然如此,企業為何還要花錢購買並維護這些軟體呢?不如將它們外包給軟體提供商,讓其來提供安裝、使用、維護、升級、等等一攬子服務。所以這一類軟體自然成為第一批SaaS引領提供商(如SAP)瞄準的物件。通常的辦公用桌面軟體(電子郵件、文書處理、幻燈片製作等,包括作業系統)也具有通用性和非資源性的特點。所以它們也應是進入SaaS首選的類別。既然這些軟體都可以通過網路瀏覽器作為Web Services來使用,它們自然也就成為雲服務的首選。所以上面提到的在辦公室和在家裡必須購買兩份按座位使用版權卻只不過做文件處理的例子,就完全可以轉變為使用雲上的同一個軟體來享受雲與SaaS服務。當然在雲上資料安全是一個重要課題。我們將在後面一章討論雲安全問題。

    總之,客戶端資源消耗重量級軟體(包括那樣的作業系統)、硬體,尤其是所謂的“厚,重客戶端”(thick client,如厚重的尤其是高階筆記本、桌面電腦便是),都將逐漸被消費者看作是一種非資源、非重要、越來越廉價的、大宗的東西。由於這些東西在價值上不被消費者看好,難怪目前在厚,重客戶端硬體,高階筆記本行業競爭越來越激烈,也難怪客戶端資源消耗重量級作業系統也越來越難推出新版本了。而服務、資料則被認為是越來越重要的資源。當然 雲 + SaaS +“瘦客戶端”也許會在一個相當長的時期內與“厚,重客戶端”計算 + 軟體按座賣使用版權共存。但根據如上分析,大量企業使用者應該會更早、更徹底地轉變到 雲 + SaaS +“瘦客戶端”的IT模式。另外值得一提的是,由於客戶前端裝置輕薄化,重量級作業系統的價值邊緣化,使得開源軟體,free軟體(注意:free不僅是免費,更重要的是可以自由開發)如Linux迎來了良好的發展契機。

    與雲端計算相交的另外一個重要概念是Web 2.0。Web 2.0 的一個重要特徵是:資訊及知識(包括軟體、資料)的發現、創立、維護、完善、使用等等都是在具有參與、共享和互動等功能的社群平臺上進行的。這樣的平臺顯然正在以各種各樣的形式滲透到雲的各種前端裝置與後端服務。現在一些重大事件發生的現場情景經常會被一個在場的智慧手機錄下,並實時上傳到社群網站上在第一時間傳遍全球任何角落。我們還可以設想今後購物時要貨比三家,消費者完全不必去跑三家商店:只要在一家店裡用智慧手機錄掃描了一個產品的條形碼後,資料中心立刻會告訴使用者該產品在其它(也許是全球分佈的)商家的價錢!又以聚合(Mash-up)為例,當很多應用以服務的形式提供的時候,聚合可以組合多種服務形成一種新的服務。聚合的產品形式有很多種,既可以是一家服務商把自己的多個產品或多個功能模組,通過各自的API介面,在其自己的平臺實現統一的服務整合。 

圖1. Atmos 面向服務的軟體技術體系結構
 


6 使用者對易用性與服務質量的需求

    行文至此我們著重討論了雲服務對企業使用者的價值。個人使用者也可以通過雲服務更加容易和方便地管理其個人資訊。

    由於資訊化產品的多樣性,人們使用不同的裝置和技術管理著自己的個人資訊。目前,大部分的個人資訊可能儲存在使用者的電腦、手持裝置、智慧電話或不同的網站上。由於這些資訊的雜亂和分散,這使個人資訊管理變得非常複雜。比如,很多人使用作業系統(如Windows)的桌面資料夾來存放文件和照片,但使用者對檔案搜尋可能遇到困難。而有些人甚至懶得費力用資料夾來管理自己的文件,而完全依賴記憶或低效笨拙的檔案查詢功能來定位這些檔案。如果考慮到個人資訊通常分散在不同的裝置和網站上,用普通桌面資料夾來管理檔案的方式根本不能完全滿足使用者對服務質量的新需求。隨著個人數字資訊的自動線上儲存和備份,隨時隨地訪問以及安全共享和釋出的巨大需求,個人資訊管理也不可避免的轉移到“雲”計算的環境中。雲個人資訊管理的目標是安全可靠地訪問和組織所有你的資訊,並保證你可以在任何時間任何地點,使用任何裝置訪問到這些資訊,且從不會丟失。而且今後連線前段裝置與後端資料中心的通訊的主幹部分是光纖,所以通訊頻寬與速度都不會構成雲服務質量和可靠度的瓶頸。

    Decho公司是一家新成立的雲端計算公司。Decho的含義是“數字的回聲(Digital echo)”,其含義是使用者在個人數字空間中來回存取資訊。Decho的目標是幫助個人和商務人士儲存和管理位於雲端的所有數字資訊。Decho的服務如同一個“天空中”的Windows檔案管理系統——當然只是更好、更易於使用。Decho技術能將不同的個人裝置上的所有資訊自動化地組織在一起。使用者能更加容易地使用資訊瀏覽、精確搜尋、文件或圖片共享等功能。使用人工智慧技術,軟體將會自動檢測到新內容並建立包含新內容條目的虛擬資料夾。Decho公司的Mozy產品是一個雲服務式的自動資料備份系統。Mozy的使用者可以對Mozy指定其擁有的各種儲存裝置,使這些裝置上的資料能夠被自動備份到Mozy的服務端。《商業週刊》雜誌在2008年12月16日有這樣一個有趣的報導。一個小偷去年5月份闖入一位叫做Zikakis先生位於伯明翰的辦公室而偷走了他的膝上型電腦。那時,Z先生可能永遠也不會想到他丟失的電腦有一天還會被找回來,於是他很快就買了一臺新電腦。謝天謝地,Z先生是Mozy的使用者,所以他用新電腦連線到網路很容易便恢復了他所有丟失的筆記本中的資料。在嚐到了Mozy備份服務甜頭的同時,Z先生還奇怪地發現從備份服務恢復出來的資料中多出一些不屬於他的照片和其它檔案。這時他意識到這些新檔案正是屬於他被盜的電腦的現有主人。於是他對照片和檔案進行調查,終於發現了一份含有姓名、地址和手機號碼的文件。在警方的幫助下,Z先生終於意想不到地重獲他丟失的電腦。這則故事說明了Mozy的可用性以及可靠的服務質量,使得其使用者能獲得超乎尋常滿意的體驗。

    雲端計算和雲端儲存服務可以對個人使用者零亂的數字生活引入秩序。個人資訊的管理是雲服務為個人使用者提供的核心。使用雲服務個人使用者能更加容易地管理自己的資訊,不會因為裝置的故障而中斷或丟失珍貴的數字生活。在雲服務中提供容易使用和便於管理的個人資訊整合技術,將是雲服務商為大量個人使用者提供優質服務而追求的一個重要目標。
 


7 使用者對安全的需求

    由於雲端計算為使用者帶來的資訊科技服務成本的顯著降低和資訊管理的極大便利,所以推動雲端計算前進的力量將勢不可擋。在推動雲端計算的程式中,另一個廣為關注並讓客戶擔憂的問題是雲端計算的安全風險問題。由於雲端計算存在的一些新的特徵——特別是計算過程發生在“雲”端,所以其安全風險涉及到諸多方面,比如資料隔離、資料隱私、使用者特權訪問、資料恢復能力、服務商的生存能力等等。服務商的服務轉包也可能會導致IT風險、法律問題和一致性風險等新的雲端計算所特有的問題。

    當使用者(企業或個人)的敏感資料在雲端處理的時候,由於處理過程並不在使用者本地進行,所以使用者無法對風險進行直接的控制。儘管有些雲服務商具有很高的知名度和可信度,但也有可能由於疏忽而僱用了一個惡意的雲資料中心管理員,而這個管理員將有能力控制使用者的敏感資料。在不同的國家和地區,企業或個人的資訊可能還需要符合該國家或地區規定的隱私法規。而在雲端計算環境下,使用者根本無法知道其資料儲存在何處,甚至不知道是在哪個國家或地區。雲服務商如何擔保其資料儲存和處理是符合該國家和地區的隱私需求將是一個新的問題。

    目前所有云服務商在資訊保安上至多使用了通常的網路安全技術如SSL安全通訊協議保護端與雲之間的資料傳輸,SSH安全隧道協議讓使用者安全登陸在雲上的平臺,並使用加密技術來保護外存磁碟上的資料。但是當使用者資料在後端伺服器的記憶體(RAM)中計算處理時,則必須是以明文的形式才能進行處理的。由於現有云計算服務解決方案几乎都使用商用作業系統,這是雲端計算中一個重大的安全隱患——大量的黑客技術正是通過商用作業系統存在的漏洞來攻擊它所服務的應用程式載入記憶體中的資料。提供記憶體資料的保護和隔離將是雲端計算的重要安全需求之一。雲服務商不僅需要新的安全技術來提供滿足使用者需求的安全服務,而且還需要向使用者作出擔保:服務級別協議(Service Level Agreement, SLA)要求對各種服務(計算、儲存、網路和安全服務等)承諾服務質量進行定義並能履行其違約責任。就安全需求而言,雲服務商僅僅依靠良好的聲譽、違約責任賠償等通常的商務標準是不夠的,這並不能減輕使用者對其雲端數字財產安全風險的擔憂。原因是資訊保安的損失往往很難量化。如何保護使用者的數字財產免受黑客(包括來自雲服務商本身)的攻擊,如何做到安全服務SLA的可審計性,這是雲端計算安全問題必須面臨一個的挑戰。

    EMC中國實驗室參與的“道里”研究專案(http://www.daoliproject.org)便是迎接雲端計算的這個安全挑戰。該專案致力於雲端計算環境下關於信任和可靠度保證的全球研究協作,道里研究團隊包括復旦大學、武漢大學、華中科技大學和清華大學這四所中國頂尖技術高校。道里專案結合可信計算技術和硬體虛擬化技術實現使用者可驗證的安全應用隔離和行為規範,加強對雲端計算和雲端儲存服務中的使用者數字財產的保護。可信計算技術通過增強體系結構的安全來提高計算平臺的安全性。可信計算聯盟TCG (Trusted Computing Group)是行業中的一個標準組織。TCG技術使用一個稱為TPM的安全晶片和一套可信軟體棧來實現可信計算平臺。在X86平臺中,TPM被安裝在輸入/輸出控制器(I/O Controller)匯流排上,那麼它可以“監聽”到每一個從外存裝載入記憶體的軟體。在平臺的啟動過程中,TPM能夠記錄整個啟動過程中按序裝載的所有軟體。TPM記錄軟體載入過程是為了向關心該平臺軟體狀況的人進行報告,比如該平臺是一臺雲伺服器,而關心者是雲服務的使用者。可信計算技術的主要優勢是能夠對平臺的啟動過程進行度量,將資料保護與平臺的身份特徵進行繫結,並能實現計算平臺的相互認證。這裡所說的度量,就是一個可以被審計的證據。因為TPM中使用了公鑰密碼技術,度量的結果是可以被第三方檢查的。

    硬體虛擬化技術是用一個直接跑在“金屬”硬體計算平臺上的叫做“虛擬機器監控器”Virtual Machine Monitor, VMM的軟體(這是我們在本文中第三次遇到虛擬化技術,可見其與雲的密切相關性)來模擬“金屬”硬體的指令。VMM執行在系統軟體棧的最底端,具有最高的執行特權,能主動管理CPU、記憶體、輸入/輸出等物理硬體裝置。所以VMM在執行時不僅可以抵制其它軟體的攻擊,實現自身的執行時完整性保護,而且可以管理其他程式的記憶體空間,防止記憶體中使用者程式碼資料被未授權篡改或訪問。另外,與典型的商用作業系統相比,VMM只需要不到1%的程式碼量,其提供的功能介面和實現機制也相對簡單,所有也有理由認為VMM相對於作業系統可以被更正確地實現。因此,一個正確定製的安全VMM可以作為主動可信計算基(Active Trusted Computing Base, ATCB)對重要服務軟體提供主動的保護,對應用程式提供細粒度的安全隔離。

    道里研究專案結合可信計算和虛擬化技術來加強計算平臺的安全,使得雲服務商能夠在公共雲端計算平臺中提供虛擬私有云計算服務(Virtual Private Cloud, VPC),這將是雲端計算安全技術發展的一個重要方向。簡單的說,虛擬私有云之於公共雲端計算有如虛擬私有網路(Virtual Private Network, VPN)之於公共網路。無容置疑,虛擬私有云相比公共雲將提供更多的增值服務。但就實現方法而言,虛擬私有云與虛擬私有網路在技術上有很大的差異。我們可以用密碼和身份認證技術在公共網路中實現虛擬私有網路。然而,對於虛擬私有云來說,僅僅依賴加密解密和身份認證技術並不能在公共的“雲”中虛擬出一片私有的“雲”,這是因為雲端計算服務中計算過程發生在遠端,在接受計算服務時資料不能加密,信任問題要比虛擬私有網路複雜得多。虛擬私有云的實現需要對雲服務提供者的記憶體儲器和CPU暫存器作一種非加密方式的保護,使得租客的程式碼和資料在雲服務提供者的記憶體和CPU暫存器中以明文形式被處理時仍然得到私密性及完整性的保護,避免被其它租客或攻擊者竊取。道里專案提供的虛擬私有云計算服務為雲使用者提供應用程式級別的安全隔離,並保證使用者程式碼和資料的私密性和完整性,是從真正意義上降低了雲端計算的安全風險。

 


8 有關雲的懷疑論

    雲端計算作為一個概念從一出現就引起許多疑問。它到底是個什麼新東西?一個特別標準的問題是:雲是網格的新名字嗎?它與網格計算的差別究竟在那裡?另一個標準的“懷疑論者”問題是:雲是否是新一輪的IT概念炒作?筆者也的確為這幾個問題琢磨了好久一段時間。正是因為找不到非常簡單幹脆的回答,才決定寫下這篇“我亦云雲”,或許可以作為對雲服務的一番梳理,希望能夠幫助自己理清思路,看看是否能對如上問題的回答起到一點幫助作用。

    筆者最近看到一篇對於雲的系統性否定論述“Don`t buy cloud computing hype: Business model will evaporate”,Chuck Goolsbee 2008年12月31日發表於SearchDataCenter.com 博文網址如下
http://searchdatacenter.techtarget.com/news/article/0,289142,sid80_gci1343864,00.html?track=NL-456&ad=682470&asrc=EM_USC_5480225&uid=7781411#

    該文從使用者角度和資料中心角度兩方面進行論證,得出結論:雲概念必然在數年內死去。從使用者角度論證,是因為雲服務不可靠而且在安全上不具有可審計性,所以使用者不會把重要應用放到雲端。其結果雲端計算只能為一些非認真的應用提供服務,所以必將缺乏賴以持久生存的商業運營模型。從資料中心角度論證,資料中心的建造和運營維護如此昂貴,雲端計算僅僅為非認真應用提供服務,怎麼可能長得了!

    至於擔心雲服務在今天較低的可靠性,同樣的擔心也在中央市政供電發展的早期出現過。早期市政供電的主要消費者是家庭和商鋪為照明所用。大工廠、大製造商都採用私人發電裝置以防市政供電故障而造成停產,生產比照明可是要認真得多的事!直到20世紀初,全美國有5萬個私人發電裝置,而中央電廠只有3600座(Nicholas Carr: The Big Switch, Rewiring the World, 中譯本:IT不再重要,網際網路大轉換的制高點—雲端計算,閆鮮寧譯,中信出版社2008)。今後的雲是否會仍然會不可靠,是否在安全上仍然不具有可審計性從而只能偏安於“非認真應用”一隅?目前的資料中心僅僅為“認真應用”提供服務可卻是使用率極低,那麼含有正在飛速發展壯大的空轉部分的資料中心今後是否反而倒會具有持久生存的商業運營模型?這些也都是筆者亦云了的話題,僅供參考。

9 結語

    雲端計算、雲端儲存作為一種基於服務的資訊處理、管理模式,為使用者帶來了使用資訊科技的良好增值體驗,提供了資訊管理的便利,並可顯著降低IT軟硬體維護成本。雲服務的出現有其必然道理。雲的強勁生命力是人們對資訊科技無窮無盡的新需求所賦予的。雲也產生了許多新東西、新事物、新問題和新挑戰。這些問題需要我們突破思維的框框去研究、探索和解決。

原文釋出時間為:2009-08-12
本文作者:EMC 毛文波 
本文來自雲棲社群合作伙伴IT168,瞭解相關資訊可以關注IT168。
原文標題:EMC毛文波:我亦云雲 也談雲端計算


相關文章