不會程式設計?來用Excel抓取網路資料
Excel到底有多強大?
能用來畫畫,Excel畫高達
可以賽車遊戲,怎麼用Excel2000玩賽車遊戲
今天我們來介紹用Excel這個人人都有的工具抓取網路資料。
一、抓取一般網頁(以簡書為例)
1. 匯入資料
等待網頁載入完畢之後,點選匯入
匯入之後刪除沒用的資料之後是這樣的
2. 處理資料
這個是重點步驟,需要對Excel公式有一定了解。
將行資料批量複製到列
所有資料均在第A列,所以我們現在的工作是將每一篇文章資訊放到同一行,這裡我們是每隔6行(因為抓取的每篇文章資訊佔據了6行)提取一次。
這樣除了最後一列,其他的都整理好了。
數值分列
接下來我們來處理最後一列:
(1)因為有些文章沒有專題資訊,為了精準分列,需在純數字單元格前加空格。公式如下圖所示:
(2)按分隔符分列(這裡選擇的分隔符是空格)
不能對含有公式的單元格進行分列,需將公式去掉(複製→選擇性貼上→值和數字格式),點選“資料”→“分列”
點選“分隔符號”→”下一步“→“空格”→“下一步”→“完成”
最後插入標題行,整理如下:
這樣就可以開始做資料分析了~~~~~~~~~~~
二、抓取特殊網頁(以房產資訊網站為例)
現在的網頁越來越華麗,導致Excel抓取網頁資料的適用範圍越來越窄,那麼我們來介紹一下最適合用Excel抓取的網頁長啥樣呢?往下看
像網頁中有這種表格形式的,匯入到Excel之後就不需要做資料處理了,把格式稍微調整一下就可以了。
相關文章
- 學會XPath,輕鬆抓取網頁資料網頁
- 不會程式設計也是文盲?程式設計
- 不會git的程式設計師,會不會被鄙視?Git程式設計師
- EXCEL竟靠這招碾壓大資料,網友:以前不會用真是瞎了眼了Excel大資料
- 為什麼有的程式設計師不會程式設計?程式設計師
- 超級實用的Excel技巧,不會的趕緊get起來Excel
- node 抓取api資料匯出為excel表格APIExcel
- 用rvest包來抓取Google學術搜尋資料Go
- 程式設計師被懟!HR:對不起,我們不招“精通Excel”的程式設計師程式設計師Excel
- PHP多程式程式設計(3):多程式抓取網頁的演示PHP程式設計網頁
- "無程式碼開發"會不會是未來程式設計的一大趨勢?程式設計
- 為什麼新人不會程式設計程式設計
- 網際網路資料庫架構設計資料庫架構
- [網路爬蟲]使用node.js cheerio抓取網頁資料爬蟲Node.js網頁
- Python 網路資料傳輸協議 TCP 程式設計Python協議TCP程式設計
- 爬取網頁後的抓取資料_3種抓取網頁資料方法網頁
- 教你不程式設計快速解析 JSON 資料程式設計JSON
- 網頁資料抓取之噹噹網網頁
- 程式設計師來做設計,世界會怎樣?程式設計師
- 未來網路安全重塑,保障安全的會不會只有四五家?
- 不黑程式設計師會死星人程式設計師
- 網路爬蟲如何獲取IP進行資料抓取爬蟲
- 從網頁上抓取資料網頁
- 網路安全可程式設計性的資料日誌管理分析程式設計
- 2016中國網際網路大會——全域大資料應用論壇震撼來襲!大資料
- 還怕Web 安全程式設計學不會?來這裡,準沒錯!Web程式設計
- 程式設計師的這一天:也許永遠不會到來程式設計師
- Delphi程式設計:用流來讀取TXT檔案中的資料程式設計
- 程式設計師如何實現“網際網路+”10-如何分析網站資料程式設計師網站
- Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQLPython爬蟲網頁資料庫MySql
- 我來談談網路設計,程式設計,網管設計三者群體的差異 (轉)程式設計
- 網路通訊程式設計程式設計
- 網路協程程式設計程式設計
- Socket 程式設計 (網路篇)程式設計
- py網路工具程式設計程式設計
- 不會填坑的程式設計師不是一個好程式設計師!程式設計師
- 學習風變程式設計,學會的不僅僅是程式設計程式設計
- 你還敢說不會做資料分析?做程式設計師必須掌握的資料分析思維!程式設計師