Python爬取貓眼評分9.5的《海王》的3萬條評論

嬌兮心有之發表於2018-12-14


前言

2018年12月7日,本年度最後一部壓軸大片《海王》如期上映,目前貓眼評分達到9.5分,靠著1.5億美金的製作成本,以小博大,目前票房接近9億,本文爬取了貓眼3w+條評論,多方位帶你解讀是否值得一看!!其實(yin)我(wei)也(mei)沒(qian)看!

想要學習Python?Python學習交流群:984632579滿足你的需求,資料都已經上傳群檔案,可以自行下載!

資料爬取

現在貓眼電影網頁似乎已經全部服務端渲染了,沒有發現相應的評論介面,參考了之前其他文章中對於貓眼資料的爬取方法,找到了評論介面!

http://m.maoyan.com/mmdb/comments/movie/249342.json?v=yes&offset=15&startTime=2018-1208%2019%3A17%3A16%E3%80%82

介面有了,但是沒有對應的電影id,不過這難不倒我們,使用貓眼app+charles,我們成功找到海王對應的電影ID;

接下來爬取評論:

解析介面返回資料

處理連結及儲存資料


最終我們獲取到了大約33000條資料

資料分析

資料分析我們使用了百度的pyecharts、excel以及使用wordcloud生成詞雲

首先看一下,評論分佈熱力圖:

觀眾分佈熱力圖

京津冀、長三角、珠三角等在各種榜單長期霸榜單的區域,在熱力圖中,依然佔據著重要地位。而新一線的川渝、鄭州武漢緊隨其後!

下面是評論數前20的城市

評論數主要分佈城市

評論全國分佈圖:

評論分佈城市

由圖中可以看出基本與熱力圖相似,主要分佈在各大一線、新一線城市,對於杭州為何會排在第17的位置,我覺得可能是阿里大本營,大家都用淘票票的緣故吧!:smile::smile:

接下來是評分佔比情況

評分佔比.png

由圖中可以看出,評分在4以上的佔比達到了94%,而平均評分也達到4.68分!!!

再來看一下各城市評分情況:

各城市評分

看了評分再來看看評論的詞雲情況:

哈哈哈

 

詞雲出現較多的是好看、特效、劇情、震撼等,可以看出大家對此電影對特效和劇情還是十分認同的,畢竟爛番茄新鮮度73%,1.5億美元對製作能做到如此實屬不易,我還是決定這週末去影院刷一下的!

詞雲程式碼


綜上,我覺得沒看的小夥伴可以跟我一樣一起週末去貢獻一下票房了!哈哈哈哈

相關文章