BI、OLAP、多維分析、CUBE 這幾個詞是什麼關係?

xiaohuihui發表於2020-07-01

這些詞我們在建設分析型應用時經常會聽到,這幾個詞也經常被弄混,這裡來梳理一下。

BI
BI 是 Business Intelligence(商業智慧)的縮寫,是指企業利用已有資料進行資料分析從而指導商業決策的過程。BI 有廣義和狹義之分,廣義上的 BI 是指只要涉及利用資料及其分析結果進行商業決策的行為都屬於 BI 的範疇;而狹義上的 BI 則主要多維分析,在實際工作中,狹義 BI 也更流行一些。

著名的啤酒和尿布的故事曾一度在 BI 領域廣泛傳唱,據說沃爾瑪透過資料分析發現了在某一時間段啤酒和尿片的銷量大增,原因是爸爸給孩子購買尿片的同時還會給自己買幾罐啤酒,於是沃爾瑪調整了啤酒和尿片的擺放位置(也有說法是進行了捆綁銷售)獲得了巨大成功。

故事的真實性有待考證,據說這家連鎖店並不是沃爾瑪,而是 Osco Drugs,一家主要在美國中西部經營的藥房和便利店。該公司於 1992 年就著手進行資料探勘專案,算是資料探勘的先驅者。當時的專案收集了來自 25 家分店、一千兩百多萬個購物車的資訊。資料的確發現:下午 5 點到 7 點之間,客戶購買了啤酒和尿片。商店管理層的確對此發現表示興趣。但現實中,並沒有重新設計商品的擺放,沒有把啤酒和尿布進行捆綁銷售。不過,公司保守地對銷售流程進行了改造,即在正確的時間放正確數量的正確商品。

我們不對故事的真實性做過深評判,但故事中使用的資料分析手段其實並不屬於 BI 的範疇,而是資料探勘了,資料探勘更多的是被劃分到 AI 的範疇。


OLAP
OLAP 是 On-Line analytical processing(聯機分析處理)的縮寫,廣義的 OLAP 泛指資料查詢分析,像報表、即席查詢、多維分析都屬於 OLAP 的範疇。

與 OLAP 相對的一個概念是 OLTP(On-Line Transaction Processing)線上事務處理,就是我們平常說的的交易系統,像 OA、ERP、CRM、銀行的核心交易系統都屬於 OLTP 的範疇。OLTP 和 OLAP 最大區別在於前者會產生資料,而後者只利用前者生產的資料進行資料分析為企業經營提供決策支援。

從廣義來看,OLAP 更像一個邏輯概念,用來特指線上查詢分析,顯然 OLAP 屬於 BI 的範疇。有時我們會把 OLAP 和多維分析劃等號,在系統建設中經常會說使用“OLAP 產品”其實就是指的多維分析了。

多維分析是什麼?


多維分析
多維分析是指在分析型系統中,使用者可以透過拖拽維度(Dimension)來彙總度量(Measure)以方便使用者可以從不同角度觀察資料。如果從報表的角度來看,多維分析類似自助報表,業務人員基於一個事先準備的結果集進行動態報表查詢,可以進行切片、鑽取、旋轉(行列變換)等操作。

現在很多時候 BI、OLAP 和多維分析被狹義地叫成一樣的東西,其實是特指實現了多維分析的產品,比如我們說 BI 產品、OLAP 產品都是在指多維分析。

CUBE
CUBE 也叫資料立方體,可以理解成是一個資料集,在多維分析中使用者需要基於一個結果集進行拖拽分析,這個結果集就是 CUBE 了,多維分析針對 CUBE 進行查詢、切片、鑽取等操作。

imagepng

從上面的描述來看,BI、OLAP、多維分析從狹義上來講基本可以畫等號,但從廣義上來看 BI 的範疇顯然更大一些,其次是 OLAP,然後是多維分析,而 CUBE 屬於多維分析的範疇,所以 CUBE 的範圍最小,用圖形表述一下四者之間的關係可以這樣:

imagepng

我們在實際工作中如果提到這些詞,最好彼此確認一下表述的是同一範圍,否則可能會導致溝通偏差,影響系統建設。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69900830/viewspace-2701494/,如需轉載,請註明出處,否則將追究法律責任。

相關文章