酷狗音樂的爬取,基於python,從無到有完整教程-上:搭建環境及爬取原理講解
所需的庫:
配置interpreter(編譯器):
1、 構建編譯器
進入軟體,左上角File > settings,進入到下圖介面
2、 下載庫
還是剛剛那個settings視窗
獲取網頁資料:
建立webdriver,此處使用微軟的edge瀏覽器
需要下載edge的
webdriver
然後還要將此webdriver的目錄加到selenium的webdriver目錄中,為什麼呢,因為selenium庫要使用他,為什麼要用selenium,因為我們要用它來解碼html(當然它還可以幹很多活,比如根據特徵定位某個元素並執行動作,比如滑鼠點選或鍵盤輸入)
此處選擇-
酷狗音樂排行榜-作為爬取的網頁,如下圖
按F12可開啟開發者工具檢視當前網頁的構成,也就是一個html程式碼
經過分析,每個榜單的定位元素為li,其中的href屬性值即為每個
榜單的歌曲頁面url,即上圖中的右側
而每首歌曲的播放頁面在一個id為rankwrap的div裡面,裡面也有一長串li列表元素,其中也就是包含每個
歌曲播放頁面連結的元素,如下圖
到此,我們分析這些分別包含了
榜單連結,歌曲播放頁面連結的元素,然後使用beautifulsoup庫所提供給我們的find方法來寫一個自動化爬取流程,如下,爬取的目標為歌曲播放頁連結
find和findall方法都是基於給定特徵來運作,如id,class等等
像特殊的屬性,如data-active引數項,要使用attrs=" “關鍵字來包含
其他的可直接寫入括號中,如class,而標籤直接寫在開頭,如"a”,“div”,“li”
獲取歌曲的下載url:
上一步驟中,我們已經獲取了每個歌曲的
播放頁面連結
我們手動跳轉到其中一首歌曲的播放頁面連結,如下圖
我們F12開啟開發者工具,轉到network來檢視在在載入當前頁面時,瀏覽器後臺所發生的網路請求
其中有一條請求就包含了歌曲下載url,我已經幫大家找出來了
該請求字首名為
index.php?r=play/getdata&callback,該請求包含了作者名,歌曲名,歌曲播放連結,封面等等,是一個json格式檔案,如下圖
/oldage/
那麼我們看看如何讓我們的虛擬瀏覽器自動去得到這個包含了如此多資訊的連結?
我們回到這個地方
可以看到,這是由大大小小的引數項拼接而成的一條請求
裡面分別有hash,dfid,mid,platid,albumid這些引數項,經過分析,除了hash和platid指定之外,其他都是隨機數就行(是不是很好操作了<_>)
hash呢,細心的小夥伴應該有發現,他就包含在
歌曲播放頁面的連結裡面,然後platid固定為4就ok了,其他的我們就需要用萬能的random來實現了。
接下來就是寫程式碼了,程式碼部分分在下一章,不然加起來太長了,怕你們不看||_||
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30239065/viewspace-2749630/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- python 爬蟲 1 爬取酷狗音樂Python爬蟲
- 如何使用 python 爬取酷我線上音樂Python
- Java爬蟲系列之實戰:爬取酷狗音樂網 TOP500 的歌曲Java爬蟲
- python爬蟲:瞭解JS加密爬取網易雲音樂Python爬蟲JS加密
- Python爬蟲實踐--爬取網易雲音樂Python爬蟲
- 【Python爬蟲實戰】使用Selenium爬取QQ音樂歌曲及評論資訊Python爬蟲
- python爬取_網易雲音樂_你的姑娘 _MP3_獲取無損音源Python
- Python爬取網易雲音樂歌單歌曲Python
- 如何用Python網路爬蟲爬取網易雲音樂歌曲Python爬蟲
- Java爬取並下載酷狗TOP500歌曲Java
- 百度VIP音樂爬取
- python爬取_網易雲音樂_ 姬和不如_MP3_獲取無損音源Python
- python爬取qq音樂歌手排行熱度資料Python
- python3.基礎爬取網易雲音樂【超詳細版】Python
- Python爬蟲:通過做專案,小編了解了酷狗音樂的加密過程Python爬蟲加密
- Python 爬蟲獲取網易雲音樂歌手歌詞Python爬蟲
- Python 爬蟲獲取網易雲音樂歌手資訊Python爬蟲
- Python爬蟲訓練:爬取酷燃網視訊資料Python爬蟲
- 房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取Python爬蟲
- Python新書上市,強烈推薦!《Python網路資料爬取及分析從入門到精通(爬取篇)》導讀Python新書
- 關於python爬取網頁Python網頁
- 一篇文章教會你使用Python網路爬蟲下載酷狗音樂Python爬蟲
- python爬取網頁詳細教程Python網頁
- Python爬蟲教程-12-爬蟲使用cookie爬取登入後的頁面(人人網)(上)Python爬蟲Cookie
- Python從網易雲音樂、QQ 音樂、酷狗音樂等搜尋和下載歌曲Python
- Python爬蟲——批次爬取douyin影片,下載到本地Python爬蟲
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- python3.x爬取網易雲音樂,超詳細版Python
- Python 爬取網易雲音樂 自動安裝所需模組Python
- python 突破酷狗收費音樂下載Python
- Python爬蟲新手教程: 知乎文章圖片爬取器Python爬蟲
- 爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例爬蟲網站
- Python爬蟲實戰詳解:爬取圖片之家Python爬蟲
- 網路爬蟲---從千圖網爬取圖片到本地爬蟲
- python爬取網圖Python
- Python爬蟲教程-17-ajax爬取例項(豆瓣電影)Python爬蟲
- Python爬取免費IP代理時,無法解析到資料Python
- Python爬蟲入門教程 50-100 Python3爬蟲爬取VIP視訊-Python爬蟲6操作Python爬蟲