匯入網頁資料到 Google Sheet

劉哇勇發表於2017-06-17

資料沒有用,我們需要的是資料所反映出來的東西。增長率,排名,佔比等。而這些結果是通過分析資料得到的。
從網上搜集到資料後,匯入到表格程式中便可以進行方便地分析處理了。下面介紹將網頁中的表格資料匯入到 Google Sheet 中的操作。

當我嘗試去 Google 相關方法的時候,對於這個搜尋結果相當的滿意。不僅給出了來自 Youtube 的視訊教程,還給出了建議觀看的位置。這樣的產品細節讓很多競品難以匹敵。

Goolge 搜尋結果

Import HTML in Google Docs,你可以自行觀看也可以繼續閱讀本文。

利用 importHTML 公式可以輕鬆實現將網頁中的資料匯入到我們的工作表當中。

importHTML 公式

該公式需要三個入參,分別是:

  • url 匯入資料的網頁地址
  • query 指定資料的型別,是頁面中的列表(ul,ol)還是表格(table)
  • index 指定需要匯入的索引,如果頁面中不止一個資料來源,則可以通過這個來指明匯入第幾個

我們以 [List of countries by GDP](https://en.wikipedia.org/wiki/List_of_countries_by_population_(United_Nations)這個來自 Wikipedia 的國家 GDP 排名頁面為列,將其中的表格資料進行匯入。

![來自 Wikipedia 的國家 GDP 排名

在需要匯入的單元格里輸入以下公式:

=importHTML("https://en.wikipedia.org/wiki/List_of_countries_by_GDP_(nominal)","table",3)

然後執行。資料載入完成後,頁面中第三個 table 的資料就被匯入了。

匯入成功後的資料

回顧上面的引數,第一個 url 沒問題,就是瀏覽器位址列裡的,直接複製貼上。
第二個引數自不必多說,我們需要匯入的不是列表,而是table
而最後個引數為什麼是3?因為如果是1的話匯入的資料並不正常,所以頁面的 HTML 程式碼中有隱藏的用於佈局的 table,我們需要跳過,嘗試到3的時候有資料了。

對於沒有網頁程式設計相關經驗的人來說,總之可以從1開始試,通過匯入的結果便可知道是否是想要的資料。

當資料在專業的表格程式中的時候,分析處理起來就很得心應手了。譬如我們覺得表格資料不夠直觀,可以快速簡單點兩下就能插入一個地區圖。

假設我們想要觀察 GDP 排名前20的國家在地圖上的分佈。首先選中所需資料。
選擇Insert->Chart...

插入圖表

在彈出的圖表編輯框中,指定圖表型別為Geo chart

插入地理圖表

資料一下子就直觀起來了!

但通過圖片看出問題來了,也就是少了些很重要的經濟體,譬如兔子,戰鬥民族。
回頭看錶格中的資料,China 的名字似乎不對,將資料複製一分出來到 Sheet2,將名字更正一下,再重複上面的步驟。

修正後的圖表資料

這是完工後的工作表,前往參觀

相關文章