視覺化分析2015年中國內地電影總票房Top25

子華發表於2016-01-21

enter image description here

注:本文案例資料來自於藝恩電影營銷智庫

從網頁抓取資料

方法一:使用XML包中的readHTMLTable函式抓取網頁表格資料。

方法二:如果用的是chrome瀏覽器,可以安裝一個名叫Table Capture的外掛,自動抓取網頁表格資料。通過貼上板或者匯入到google的電子表格並下載到本地後,將資料載入到R

本文使用方法一。在windows中,得到的資料會出現中文列變數名亂碼(對列變數重新命名就好了,linux不會)。 enter image description here 清洗並整理資料 enter image description here 視覺化結果

現在,我們得到了一個25行8列的電影票房資料框。先檢視下結構: enter image description here 下面用ggplot2來視覺化電影票房情況 enter image description here enter image description here 從下面的條形圖可以看到觀眾最喜歡的三大電影型別依次是動作、科幻、喜劇。 enter image description here enter image description here 本文為雪晴資料網原創內容,作者溫水根。轉載請註明本文連結http://www.xueqing.cc/cms/article/115

相關文章