爬蟲入門經典(五) | 簡單一文教你如何爬取高德地圖
一、 分析網頁結構
以往幾篇都是介紹的傳統的靜態介面的爬取,這次博主介紹一個爬取動態網頁的超簡單的一個小
demo
。
說到動態網頁,你對它瞭解多少呢?
如果對動態網頁不認識的童鞋,博主在此給出連結,可以看百度百科的詳細解析 動態網頁_百度百科以及小馬伕的 靜態頁面和動態頁面的區別
不要怪博主沒有進行講解,因為博主本人對與動態網頁的概念也不是太過了解。等到博主整理好思緒的時候,博主會專門寫一篇博文的
簡單來說,要獲取靜態網頁的網頁資料只需要給伺服器傳送該網頁
url
地址就行,而動態網頁的資料因為是儲存在後端的資料庫裡。所以要獲取動態網頁的網頁資料,我們需要向伺服器傳送請求檔案的
url
地址,而不是該網頁的
url
地址。
?,下面開始進入正題。
本篇博文就以高德地圖展開:
在開啟後,我們發現有一堆
div標籤
,但是並沒有我們需要的資料,這個時候就可以判定其為動態網頁,這個時候,我們就需要找介面
點選網路標籤,我們可以看到網頁向伺服器傳送了很多請求,資料很多,找起來太費時間
我們點選
XHR
分類,可以減少很多不必要的檔案,省下很多時間。
XHR型別即透過XMLHttpRequest方法傳送的請求,它可以在後臺與伺服器交換資料,這意味著可以在不載入整個網頁的情況下,對網頁某部分的內容進行更新。也就是說,向資料庫請求然後得到響應的資料是XHR型別的
然後我們就可以在
XHR
型別下開始一個個找,找到了如下的資料
透過檢視
Headers
獲得
URL
開啟之後,我們發現其為近兩天的天氣情況。
開啟後我們可以看到上面的情況,這是個
json
格式的檔案。然後,它的資料資訊是以字典的形式來儲存的,而資料是都儲存在
“data”
這個鍵值裡面。
?,找到了
json
資料,我們來對比下看是否是我們找的東西
透過對比,資料正好對應,那就說明我們們已經拿到資料了。
二、拿到相關網址
?,相關網址我們已經拿到了,下面就是具體的程式碼實現了。至於怎麼實現,
我們知道json資料可以使用
response.json()
轉字典,然後操作字典。
三、程式碼實現
知道了資料的位置後,我們開始來寫程式碼。
3.1 查詢所有城市名稱和編號
先抓取網頁,透過新增
headers
來偽裝成瀏覽器來對資料庫地址進行訪問,防止被識別後攔截。
得到我們想要的資料之後,我們透過查詢可以發現
cityByLetter
裡的編號和名稱是我們需要的,那麼我們就可以盤它了。
3.2 根據編號查詢天氣
得到了編號和名稱,下面肯定就是查詢天氣呀!
先來看介面
透過上圖,可以確定最高溫度,最低溫度等內容。那麼就以此來進行資料爬取。
?,我們的設想已經實現了。
四、完整程式碼 xian/
五、儲存結果 /chongqing/
美好的日子總是短暫的,雖然還想繼續與大家暢談,但是本篇博文到此已經結束了,如果還嫌不夠過癮,不用擔心,我們下篇見!
好書不厭讀百回,熟讀課思子自知。而我想要成為全場最靚的仔,就必須堅持透過學習來獲取更多知識,用知識改變命運,用部落格見證成長,用行動證明我在努力。
如果我的部落格對你有幫助、如果你喜歡我的部落格內容,請“點贊” “評論”“收藏”
一鍵三連哦!聽說點讚的人運氣不會太差,每一天都會元氣滿滿呦!如果實在要白嫖的話,那祝你開心每一天,歡迎常來我部落格看看。
碼字不易,大家的支援就是我堅持下去的動力。點贊後不要忘了關注
我哦!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30239065/viewspace-2729024/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 爬蟲入門經典 | 一文帶你爬取傳統古詩詞!爬蟲
- Python爬蟲入門【5】:27270圖片爬取Python爬蟲
- Python爬蟲入門【9】:圖蟲網多執行緒爬取Python爬蟲執行緒
- Python爬蟲入門【11】:半次元COS圖爬取Python爬蟲
- Python爬蟲入門【4】:美空網未登入圖片爬取Python爬蟲
- 簡單的爬蟲:爬取網站內容正文與圖片爬蟲網站
- 教你用Python爬取圖蟲網Python
- Python爬蟲入門教程 2-100 妹子圖網站爬取Python爬蟲網站
- 教你如何編寫第一個簡單的爬蟲爬蟲
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲
- 爬蟲入門爬蟲
- Java爬蟲批量爬取圖片Java爬蟲
- Python爬蟲入門教程 4-100 美空網未登入圖片爬取Python爬蟲
- Python爬蟲入門【3】:美空網資料爬取Python爬蟲
- 爬蟲入門經典(六) | 一文帶你深入瞭解為什麼使用代理IP及其如何使用爬蟲
- Python爬蟲入門教程 50-100 Python3爬蟲爬取VIP視訊-Python爬蟲6操作Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 使用正則編寫簡單的爬蟲爬取某網站的圖片爬蟲網站
- 爬蟲工程師的入門簡介爬蟲工程師
- 爬蟲 Scrapy框架 爬取圖蟲圖片並下載爬蟲框架
- Python爬蟲入門Python爬蟲
- 如何合理控制爬蟲爬取速度?爬蟲
- 爬蟲---xpath解析(爬取美女圖片)爬蟲
- node:爬蟲爬取網頁圖片爬蟲網頁
- python 爬蟲 mc 皮膚站 little skin 的簡單爬取Python爬蟲
- 【爬蟲】python爬蟲從入門到放棄爬蟲Python
- 最簡單的網路圖片的爬取 --Pyhon網路爬蟲與資訊獲取爬蟲
- Python超簡單超基礎的免費小說爬蟲!爬蟲入門從這開始!Python爬蟲
- Python 從入門到爬蟲極簡教程Python爬蟲
- Python爬蟲—爬取某網站圖片Python爬蟲網站
- Python爬蟲入門【10】:電子書多執行緒爬取Python爬蟲執行緒
- 爬蟲(1) - 爬蟲基礎入門理論篇爬蟲
- 簡單的爬蟲程式爬蟲
- python簡單爬蟲(二)Python爬蟲
- 新手爬蟲,教你爬掘金(二)爬蟲
- python-爬蟲入門Python爬蟲
- 爬蟲--Scrapy簡易爬蟲爬蟲
- Python爬蟲入門教程 13-100 鬥圖啦表情包多執行緒爬取Python爬蟲執行緒