DW2.0下一代資料倉儲架構_第17章 成本驗證和DW2.0(讀書筆記)

thamsyangsw發表於2014-10-25

版權宣告:
該系列文章(DW2.0下一代資料倉儲架構)內容系作者學習用筆記,
歡迎共同學習,所載內容版權歸原書作(譯)者所有,請勿轉載商用。

    毫無疑問,DW2.0的基礎設施需要很大的成本。建立它、運維它都需要成本,所使用的裝置也有成本。然而,大部分公司都是反對較大支
出。會很自然的被問到“這個新的裝置需要大量的成本,你確定它值這些成本嗎?為什麼我要做一個這麼大的投資?”,這是高層管理人員
最容易問到的問題,那作為DW2.0資料倉儲的提倡者,該如何作答?

宏觀層次的價值驗證

    回答管理層的一種方法是在宏觀層次進行回答。宏觀層次是指你看到一些大的因素,並且可以講DW2.0的價值聯絡到這些大的因素上。你
可以說某公司引進的DW2.0,然後他們的股票漲了,也可以說某公司引進了DW2.0,然後利潤增加了。雖然DW2.0對股票價格或者是利潤很可能
是有利的,但如上所說還是缺乏可信度,因為有很多種因素影響到一個公司的股票價格和利潤,而DW2.0只是許多因素中的一個。所以,在宏
觀上很難證明DW2.0的價值。

微觀層次的價值驗證

    在微觀層次上解決DW2.0環境的價值驗證問題是一種更為可信的方法。在微觀層次上可以對DW2.0環境的建立和操作形成更令人信服的理
由。比如有兩個公司A和B,兩個公司都存在過時的系統,這些系統執行了一段時間,並且兩個公司都需要新的分析。A公司沒有DW2.0設施,
而B公司建立了自己的DW2.0資料倉儲,A公司在建立一個新的分析時,只能回到它的遺留應用程式庫。那些遺留的資料是A公司唯一要操作的
資料,沒有其他的資料。A公司需要進入遺留的環境,1、查詢到需要的資料2、收集資料3、整合資料4、演繹資料5、建立一個新的報表和分
析。A公司為得到資料,舊的遺留資料就必須有文件記錄,然而許多較舊的遺留系統並沒有文件。其次,當找到文件後,這些文件還沒有更新
至最新。另外,在檢查舊的遺留系統時還會發現很多混亂的地方,沒有命名標準,運算方法不同還有許多不同的編碼標準等等。更為糟糕的
是根本沒有文件。已經沒有太多的程式設計師或者分析員能夠理解當時的技術。所以,尋找和理解舊的遺留系統環境產生的資料是非常重要的任
務。假設能夠找到並解釋舊的遺留程式碼,下一步便是從遺留環境中收集資料。這需要已經消失很久的定位技術,找到這些技術才能從遺留系
統中得到大量的資料。整合資料也不那麼容易,如果資料來自多個不同系統,那麼整合更加困難。關鍵字不同,資料格式不同,一些資料丟
失並且必須採用預設值,相同的屬性有不同的名字,資料定義不同等等。面臨挑戰多多,A公司生成一個新的分析需要多少成本?這全部取決
於遺留環境以及分析的要求。有些遺留系統過於混亂有些比較好處理,有些報表和分析非常簡單,也有非常困難的。根據生成過程的細節,
建立一個新的分析大概需要100 000美元大10 000 000美元,時間大概需要3個月到3年。受制於其他多種因素,成本往往會發成較大變化。如
:遺留程式的個數;遺留程式的複雜性;遺留應用程式的文件;遺留環境的技術架構;新資料需求的複雜度;需要分析的資料量;新資訊所
需要的資料元素的個數;遺留資料庫與當前最新版本的匹配程度;遺留環境的作業系統等等。那麼B公司有怎樣呢?利用DW2.0設施建立一個
新的分析需要多少成本?1000到10 000美元和1小時到5天就夠了。由此可見,DW2.0極大地降低了一個公司的資訊成本,DW2.0開啟了通往之
前本來已經存在卻不能訪問的資訊的大門。

考慮DW2.0的成本
    但是建立DW2.0設施也是需要成本的。構造和操作DW2.0設施並不廉價。當然大部分成本取決於資料量、使用者量、遺留系統的數目、資料
儲存的時間長度以及分析的型別等等。但是針對此次分析的目的,我們假設一個DW2.0設施需要花費5000 000美元。假設A公司新生成一個報
表的成本是700 000美元。B公司在DW2.0基礎上10 000美元完成。那B公司則要花費5010 000美元,這樣DW2.0的成本令人望而卻步。

資訊的現實情況
    現實情況如何呢,任何一家公司無論規模大小和複雜程度如何,都不會僅僅在一個報表上運作其所有的業務。一箇中等規模的公司至少
也要有100個報表,大公司甚至可以達到上千份報表。假設按照100個報表來算,A公司需要70 000 000美元,而B公司6 000 000美元。那樣比
較會選擇哪個呢?

資訊的時間價值
    DW2.0能極大地加快資訊獲取的速度。想想一下,boss向你要一份報表,你在一系列舊的遺留系統中尋找,6個月後終於找到了那份分析
報表,這時boss可能已經忘記以前讓你做過這件事情了。the other way,如果可以在第二天完成這份分析,第二天早上8點帶著這份報表走
進老闆的辦公室,你的資訊對老闆來說會有多重要?資訊的時間價值是缺失存在的,DW2.0環境可以大大加快資訊訪問的速度。

整合的價值
    對許多企業來說,僅僅是整合,DW2.0環境的成本就是值得的,透過整合,來自一個位置和一個應用的資訊可以與另外不同的位置和應用
的資訊連線起來並相關聯。這種連通性的結果就是整合,有了整合,就可以完成一些有價值的東西。例如使用者可以對資料建立一個真正的360
度的視角。

歷史資訊
    DW2.0環境還有一個無形的利益,就是從時間的角度來檢視資料的能力。在DW2.0出現之前有許多遺留系統,這些系統大部分都是面向事
務的,因此哪裡存在事務,哪裡就需要提高效能。當提高效能是,可能會移除一些不必要的資料。在遺留環境中的趨勢是儘可能地丟掉歷史
資料,系統中的歷史資料越多,系統執行就越慢,最終的結果是在遺留系統中只有少量的歷史資料。但是這些歷史資料是有實際價值的。如
果事務處理環境不是儲存歷史資料的位置,那麼DW2.0環境就是儲存歷史資料的好地方。

第一代DW和DW2.0在經濟效益上的比較
    第一代資料倉儲有將大量資料儲存在磁碟儲存上的習慣。實際上許多第一代資料倉儲只是把資料儲存在磁碟儲存器上。
    但是DW2.0認為除了磁碟儲存器外,還至少要有兩個地方儲存資料。DW2.0認為,當資料還會被訪問但是訪問機率較低時應該儲存在近線
儲存中,而且歸檔資料通常也不儲存在磁碟管理器上。DW2.0的成本也明顯的少於傳統的第一代資料倉儲的成本。


總結:
   在宏觀上對DW2.0進行成本分析是一件很難的事情,在許多宏觀因素下,DW2.0環境所帶來的好處不能體現出來,微觀方面卻能證明DW2.0
較為低廉測成本。對於很多報表和分析時,DW2.0環境的成本要比沒有DW2.0環境低很多。還要考慮其他一些非經濟因素:資料的時間價值、
資料整合價值以及已經可用的歷史資料。DW2.0環境開啟了一扇大門,使得組織能夠去檢視資料並做資料分析,這是都是以前做不到的。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26613085/viewspace-1309772/,如需轉載,請註明出處,否則將追究法律責任。

相關文章