通過Python對網易雲音樂華語歌單資料的獲取,對華語歌單資料進行視覺化分析。
視覺化庫不採用pyecharts,來點新東西。
使用matplotlib視覺化庫,利用這個底層庫來進行視覺化展示。
推薦下我自己建立的Python學習交流群960410445,這是Python學習交流的地方,不管你是小白還是大牛,小編都歡迎,不定期分享乾貨,包括我整理的一份適合零基礎學習Python的資料和入門教程。
一、網頁分析
01 歌單索引頁

選取華語熱門歌單頁面。
獲取歌單播放量,名稱,及作者,還有歌單詳情頁連結。
本次一共獲取了1302張華語歌單。
02 歌單詳情頁

獲取歌單詳情頁資訊,資訊比較多。
有歌單名,收藏量,評論數,標籤,介紹,歌曲總數,播放量,收錄的歌名。
這裡歌曲的時長、歌手、專輯資訊在網頁的iframe中。
需要用selenium去獲取資訊,鑑於耗時過長,小F選擇放棄...
有興趣的小夥伴,可以試一下哈...
二、資料獲取
01 歌單索引頁

獲取歌單索引頁資訊如下,共1302張華語歌單。

02、歌單詳情頁

獲取的1302張華語歌單的詳情。

1302張歌單裡的121118首歌。

三、資料視覺化
01 歌曲出現次數 TOP10

榜上的十首歌,除了「水星記」,小F聽得次數都不少。
那麼你又是如何的呢?
在小F的印象裡,這些歌都曾在網易雲音樂熱歌榜的榜首出現過。
02 歌單貢獻UP主 TOP10

10大歌單貢獻UP主,感謝這些辛勤的“搬運工”,給大家帶來優質的歌單。
給廣大懶人癌患者,亦或選擇困難症患者,帶來福利。
03 歌單播放量 TOP10

歌單播放量前十名單,第一名7000多萬播放量。
其實matplotlib生成的圖是挺清楚的,只不過一上傳就變模糊了。
所以這裡你可能會覺得圖片質量不行...
其實並不是,為此小F做了相應的圖表,具體見文末~
04 歌單收藏量 TOP10

同樣是好東西,收藏收藏!!!
有一些歌單和播放量TOP10裡歌單有重複。
05 歌單評論數 TOP10

歌單「再見大俠:武俠小說泰斗金庸逝世」評論數最多。
相信不少人的閱讀時光,就是與金庸前輩的武俠小說一起度過。
飛雪連天射白鹿,笑書神俠倚碧鴛。
還有由小說改編成的電視劇,都是經典!!!
小F武俠小說看的少,武俠電視劇看的多...
06 歌單收藏數量分佈情況

將收藏數做對數處理,使得能直觀看出歌單收藏數的分佈。
主要分佈在0-15萬之間(ln(150000)=12)。
07 歌單播放數量分佈情況

歌單播放數主要分佈在0-1000萬。
其中ln(10000000)=16。
08 歌單標籤圖

既然選取的是華語歌單,那麼華語這二字必不可少,而且還佔大頭。
那麼就看看除了華語,還有什麼其他標籤。
「流行」沒啥好說的。
「古風」「說唱」「民謠」近些年來熱度是越來越高,不過也有玩壞的時候。
比如「離人愁」、「一人我飲酒醉」,小F作為吃瓜群眾,只能說且行且珍惜...
09 歌單介紹詞雲圖

歌單介紹詞雲圖,希望你能找到你喜歡某首歌的原因!!!
到底是希望,還是青春,亦或是回憶呢?
四、總結
最後,把本次搜刮的乾貨,分享給大家。


