尷尬!EXCEL百萬行資料量就歇菜了,還是這個方法實用

hxc979891發表於2020-12-14

       前段時間發生了一個尷尬的新聞,據英國媒體報導,英國的衛生部門公開承認由於“技術故障”問題導致新冠病例的統計資料出現了失誤,遺漏了將近16000個病例,英國公共衛生部臨時執行長邁克爾·布羅迪表示,一部分陽性測試結果的檔案大小超出了系統限制,導致了這幾天檢測資料的丟失。據英國媒體猜測,這是由於EXCEL的“bug”導致的,因為EXCEL有1048576行的最大行數限制,超出這個行數的資料沒有辦法統計進去。

       由於及時發現了這個“技術故障”,英國衛生部門隨後對資料進行了更正,所以在之後的幾天裡出現了暴增22961名新冠病例的情況,這包括了前面積壓遺漏的資料。此事立馬在英國國內引起了軒然大波,很多政要紛紛指責英國政府對待工作不負責任,給民眾造成了極大的恐慌,並要求英國衛生部門作出合理的解釋,公佈彌補的措施。

      我們把這個事情捋一捋,造成這個失誤的真正原因真的是EXCEL嗎,讓EXCEL背這個鍋是否合理?我們都知道,EXCEL的最大行數是1048576,但很多人不知道為什麼是這個數字,按照通用的說法,那就是EXCEL運用的是一種記憶體演算法,是一個使用行、列進行索引的樹形儲存演算法,對新增刪除還是稀疏矩陣都有很高的效率,支援1048576行和16384列,如果再多層級加多那效率將會指數級別降低。所以超過這個行數的話,EXCEL便沒有辦法進行記錄。

       如果硬說這個是EXCEL的鍋,恐怕EXCEL也是不服的,畢竟微軟研發EXCEL的初衷並不是要讓它去處理大資料,而是讓要它成為大眾化的資料處理軟體。就好比說,你要讓摩托車去跑出飛機的速度那是不可能的,EXCEL的適用場景更多在於輕量級的資料裡。那麼EXCEL如何處理超過100萬行的資料量呢?目前來說只有一個比較土的辦法,就是利用工具把EXCEL檔案分成幾段去處理,但是這個方法非常麻煩,而且效率不高。

 除了把檔案進行分割的方法之外,還有一個更加給力的辦法,那就是安裝一個智分析外掛,這個外掛的厲害之處在於可以讓EXCEL去連線外部的資料庫,然後在EXCEL裡呼叫資料庫中的欄位進行分析,下面給大家介紹一下詳細的操作步驟。

1、 安裝外掛

 在EXCEL中安裝好外掛,工具欄中會出現一個新的操作介面:

2、 匯入檔案

 在EXCEL的工具欄中可以看到匯入檔案的按鈕,你可以把本地的資料來源檔案導進雲端的資料庫中,也可以在網頁端連線你的外部資料庫(musql、oracle等):

3、 拖拽資料

 在EXCEL的資料集皮膚裡找到你的資料來源檔案,並把欄位拉拽到EXCEL中進行分析,可以選擇全部欄位,也可以選擇其中的幾個欄位,透過滑鼠操作拖拽即可:

 

4、 重新整理資料

 把資料欄位拖拽好之後,然後在EXCEL裡點選重新整理,這時EXCEL會把資料庫中的欄位重新整理出來。這個方法的好處就是無需開啟龐大的資料來源檔案,只需要把EXCEL與資料庫建立連線之後,在EXCEL裡便可以呼叫資料庫中的欄位,不僅突破了EXCEL百萬行數的限制,而且操作起來非常方便。

       我們在用EXCEL處理資料時,總是會遇到超過百萬行資料量的報表,往往會力不從心,現在終於遇到了一個比較靠譜的解決方法,那就是利用外掛的形式,輕鬆處理超過百萬行的資料,對於經常要使用EXCEL的使用者來說,真是一大福音。如果你還想了解EXCEL更多實用的功能,歡迎查閱我的其他文章,如果你有更加實用的方法,也歡迎你在文章下方留言。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69980489/viewspace-2742124/,如需轉載,請註明出處,否則將追究法律責任。

相關文章