資料分析之《我不是藥神》

NGU發表於2018-08-12

前言

作為暑期最受歡迎的電影之一,《我不是藥神》在上映之前就被刷屏,它不僅是豆瓣16年來第9部評分超過9.0的華語影片,也是第5部票房超過20億的影片。記得小編當時還在學校未放假時,藥神就在朋友圈被好友頻頻安利,於是一放假就迫不及待的去看了。看完給我的感覺就是中國這樣的電影真的太少了,毫無疑問,它的成功是必然的。於是在其上映一個月後,小編想看看全國網友對藥神的評價究竟如何,就做了關於藥神的影評分析。


資料抓取

此次資料爬取我們參考了之前其他文章中對於貓眼資料的爬取方法,呼叫其介面,每次取出1000頁的資料並進行去重,為了使最終的資料可靠性更高,小編抓取了多次當日的資料,程式碼如下:


資料分析之《我不是藥神》



資料分析之《我不是藥神》



資料分析

我們先來看下所得到的資料


資料分析之《我不是藥神》


這個資料是小編去重後所得的,並且按照了城市進行排序,後面的部分主要圍繞評分、城市、評論展開。


首先看一下評分熱力圖



資料分析之《我不是藥神》


京津翼、江浙滬、珠三角等在各種榜單長期霸榜單的區域,在熱力圖中,依然佔據著重要地位。同時,我們看到東三省和四川、重慶所在區域也有著十分高的熱度,這表明藥神的熱度即使到現在也還是特別高的。


下面我們要看的是主要城市的評論數量與打分情況



資料分析之《我不是藥神》



打出最高分4.86的城市是無錫市,而最低分4.46是東莞市,而徐崢的家鄉上海打分在4.6左右。綜合各個城市的打分來看藥神的評分還是比較高的。


我們按照打分從高到底對城市進行排序



資料分析之《我不是藥神》



在評論數量最多的二十個城市中,評論數量最高的是深圳,北京,其次是成都。而後15名的評論數量和評分都差不多。說明藥神的口碑沒有出現兩極分化的現象。這也跟藥神一直以來的評價所對應。


我們把城市打分情況投射到地圖中:(紅色表示打分較高,藍色表示較低)



資料分析之《我不是藥神》



可以看出南北方對這部電影的評價都很高。這也是藥神的票房之高的原因。


看過了評分,我們看一下評論生成的詞雲圖,以下分別是原圖和據此繪製的詞雲圖



資料分析之《我不是藥神》



資料分析之《我不是藥神》



從生成的詞雲中可看出網友對藥神的評價最多的是好看,現實,感人,真實,良心。這與小編在朋友圈中看好友所發的對藥神的評價都是一致的。正如戰狼2一樣,把錢花在製作上,用心拍攝的良心大作,相信還是會有回報,國產電影是可以兼顧社會責任和商業利潤的!用心做電影,時代不會辜負你,觀眾不會辜負你!正如一些網友評論所說,這是中國電影人的良知覺醒,應該多些現實題材的呼籲,反映民眾的心聲,告訴政府和社會我們需要做什麼。


部分程式碼展示


熱力圖



資料分析之《我不是藥神》



折線圖+柱形圖組合



資料分析之《我不是藥神》



資料分析之《我不是藥神》



詞雲



資料分析之《我不是藥神》



本篇程式碼:

github.com/NGUWQ/yaosh…


此文思路來源於:資料森麟 “3天破9億!上萬條評論解讀《西虹市首富》是否值得一看” 一文。


對爬蟲,資料分析,演算法感興趣的朋友們,可以加微信公眾號 TWcoding,我們一起玩轉Python。


If it works for you.Please,star.


自助者,天助之



資料分析之《我不是藥神》

相關文章