狂甩vlookup幾條街,這3種EXCEL多表關聯的方法瞭解一下

hxc979891發表於2021-06-01

EXCEL是我們工作中經常用到的工具,雖然功能很強大,但是缺點也不少,最讓人苦惱的莫過於它的效能問題了,只要資料量一大,便跑不動了,讓我們這些打工人苦不堪言。在討論如何解決這個問題之前,我們先來看一個真實的案例:

一、案例:

小王是一家醫藥公司的銷售助理,平時主要的工作是協助銷售負責人整理公司的銷售報表,然後定時把資料推送給公司的管理層。小王所需要的資料來源主要來自於ERP系統,匯出資料後,然後再利用EXCEL對資料來源進行加工和分析。資料來源裡大概有400多個產品品類,其中包含了1500多個客戶和150多個業務員,每個月的資料量接近一百萬行。小王還需從部門的維度對資料進行整理,公司主要有3個大的銷售部,但是又包含2個小部,17個大區,30多個小區,除此之外,還要區分連鎖、鄉鎮等等。先不說這樣的報表有多複雜,光是這資料量就已經讓EXCEL難以負荷了,而且這些表格還要利用公式進行彼此關聯,只要一開啟就會卡死,讓小王苦不堪言。

二、業務場景

1、痛點/需求

為了對上述的案例進行場景模擬,並找到最優的解決方案,我找來了3個資料來源檔案,先看一下在EXCEL裡做多表關聯會遇到什麼問題:

第一個是汽車銷售資料來源,資料量是100萬行:

第二個是產品的維度表:

第三個是地區的維度表:

在開啟這個EXCEL檔案的時候,就已經表現的特別明顯了,由於汽車銷售資料來源的行數是100萬行,EXCEL開啟的速度非常慢:

我們再嘗試一下對這幾個報表進行關聯,EXCEL的多表關聯最常用的方法是利用vlookup把兩個表格連線起來,每關聯一個欄位,就要多寫一次公式,特別麻煩,如果資料大的時候,就會變得非常卡,有時候根本就跑不動,讓人崩潰。嘗試了一會之後,資料君最後還是放棄了,因為這太不科學了,還是找其他更好的方法吧。

2、解決過程

透過這個案例,資料君認為要解決上述的痛點問題,至少要面臨兩個問題,第一個是資料量的問題,第二個是多表關聯的問題。透過對目前所有市面上的工具進行比較,資料君找到了三種比較適用的方法,至於哪種方法更適合自己,這個答案就交給明智的你自己去選擇吧。

 

1)    資料庫

運用資料庫的語句做多表關聯是一種不錯的方式,學過資料庫的人都知道,sql語句中提供了多種連線的方式,包括左連線(left join )、右連線(right join)、外連線(full join)和內連線(inner join)。我們利用資料庫軟體嘗試做一下多表關聯,首先在資料庫中設計好表結構,並把3個表格導進資料庫中:

然後新建一個查詢,寫好語句,把這三個表格進行關聯,最後點選執行,便可以得到一個新的關聯表:

但這種方法僅適用於熟悉資料庫語句的人,如果您對資料庫語句瞭解的不多,此方法可以略過。

2)power pivot

是EXCEL裡一個非常厲害的建模元件,透過這個功能,您也可以快速完成多個報表關聯的操作,您可以在EXCEL的工具欄上快速找到power pivot的選單介面(我的EXCEL是2019版本):

進入到power pivot的介面後,點選“從其他源”,選擇EXCEL匯入,分別把3個資料來源匯入到power pivot裡:

資料來源成功匯入後,點選“關係圖檢視”,這時可以看到3個表格是沒有作任何關聯的,但是我們可以透過連線的方式對這幾個表格進行關聯:

完成關聯後,點選透視表,可以發現這三個表格已經是可以自由進行關聯查詢的了:

但是用power pivot也有一個很大的缺點,那就是資料效能太差勁,如果資料量太大,很容易會被卡死。

3)智分析

智分析是一款雲端saas大資料分析工具,具有非常強悍的資料處理能力,無論是做資料清洗,還是做資料視覺化,智分析都能輕鬆應付。智分析處理EXCEL檔案非常方便,可以說就是專門為EXCEL使用者打造的,只要你會使用EXCEL,就能輕鬆上手。針對前面介紹的兩種多表關聯方法,我更傾向於建議大家使用智分析去做多表關聯,因為無論從處理效能,還是從操作上來說,智分析都更勝一籌。下面給大家介紹一下如何透過智分析做多表關聯:

資料匯入

首先把3個需要關聯的EXCEL檔案匯入到智分析的系統裡,匯入成功之後,可以在資料連線的介面裡找到這3個檔案:

然後開啟資料準備裡的自助資料集:

進入到自助資料集的介面後,在資料連線裡找到您的資料來源,點選資料來源後,便可以重新整理出明細資料:

雙擊維度表後,兩份資料來源便會自動進行關聯,這時可以對關聯關係進行設定,例如左連線、右連線等等,這裡我們設定為左連線:

同樣的操作,點選另外一份維度表,並與資料來源進行關聯,這時便把3個資料來源關聯好了:

由於關聯後的報表存在重複的欄位,我們可以對這些重複的欄位進行可見性的設定:

設定完成後,我們可以對資料進行預覽,這時可以看到3個檔案已經被整合成1個檔案了,透過這個資料集,你便可以繼續去做其他的資料分析了:

三、總結

透過上述介紹的案例,我們可以看出這幾個方法都是解決多表關聯很好的方法,前兩種方法都在一定程度上解決了EXCEL的缺點問題,但是也會存在一定的技術性門檻,小白不是那麼容易掌握。第三個方法的解決過程最為徹底,即使你是一個資料小白,也能快速掌握並且操作完成整個過程,因為所有步驟都是在視覺化介面進行操作的,無需任何程式設計語句,而且資料量也不會受到限制,是目前解決多表關聯的最好方法了。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69980489/viewspace-2774898/,如需轉載,請註明出處,否則將追究法律責任。

相關文章