資料沒有用,我們需要的是資料所反映出來的東西。增長率,排名,佔比等。而這些結果是通過分析資料得到的。
從網上搜集到資料後,匯入到表格程式中便可以進行方便地分析處理了。下面介紹將網頁中的表格資料匯入到 Google Sheet 中的操作。
當我嘗試去 Google 相關方法的時候,對於這個搜尋結果相當的滿意。不僅給出了來自 Youtube 的視訊教程,還給出了建議觀看的位置。這樣的產品細節讓很多競品難以匹敵。
Import HTML in Google Docs,你可以自行觀看也可以繼續閱讀本文。
利用 importHTML
公式可以輕鬆實現將網頁中的資料匯入到我們的工作表當中。
該公式需要三個入參,分別是:
url
匯入資料的網頁地址query
指定資料的型別,是頁面中的列表(ul,ol)還是表格(table)index
指定需要匯入的索引,如果頁面中不止一個資料來源,則可以通過這個來指明匯入第幾個
我們以 [List of countries by GDP](https://en.wikipedia.org/wiki/List_of_countries_by_population_(United_Nations)這個來自 Wikipedia 的國家 GDP 排名頁面為列,將其中的表格資料進行匯入。
在需要匯入的單元格里輸入以下公式:
=importHTML("https://en.wikipedia.org/wiki/List_of_countries_by_GDP_(nominal)","table",3)
然後執行。資料載入完成後,頁面中第三個 table 的資料就被匯入了。
回顧上面的引數,第一個 url 沒問題,就是瀏覽器位址列裡的,直接複製貼上。
第二個引數自不必多說,我們需要匯入的不是列表,而是table
。
而最後個引數為什麼是3?因為如果是1的話匯入的資料並不正常,所以頁面的 HTML 程式碼中有隱藏的用於佈局的 table
,我們需要跳過,嘗試到3的時候有資料了。
對於沒有網頁程式設計相關經驗的人來說,總之可以從1開始試,通過匯入的結果便可知道是否是想要的資料。
當資料在專業的表格程式中的時候,分析處理起來就很得心應手了。譬如我們覺得表格資料不夠直觀,可以快速簡單點兩下就能插入一個地區圖。
假設我們想要觀察 GDP 排名前20的國家在地圖上的分佈。首先選中所需資料。
選擇Insert->Chart...
在彈出的圖表編輯框中,指定圖表型別為Geo chart
。
資料一下子就直觀起來了!
但通過圖片看出問題來了,也就是少了些很重要的經濟體,譬如兔子,戰鬥民族。
回頭看錶格中的資料,China 的名字似乎不對,將資料複製一分出來到 Sheet2
,將名字更正一下,再重複上面的步驟。
這是完工後的工作表,前往參觀。