資料分析之全國熱門景點分析

NGU發表於2018-08-16

前言

暑假景區人山人海,許多人都不知道應該去哪裡旅遊。而小編最近也剛好想分析下熱門景點的人數分佈情況。從而來為自己的景區出行給出一些建議。


資料爬取

此次資料爬取我們選擇了去哪兒網站熱門景點地理位置,銷量等資訊。將結果去重後,有用的資訊為2300餘條。程式碼如下。


資料分析之全國熱門景點分析

資料分析之全國熱門景點分析

資料分析之全國熱門景點分析


因為此次我們是利用百度地圖API來生成熱力圖的,所以還需獲取景點位置的經緯度。程式碼如下。


資料分析之全國熱門景點分析

資料分析之全國熱門景點分析


資料分析


我們先來看一下所得到的資料


資料分析之全國熱門景點分析

可以看到有景區的地址,名稱,熱度等值,後面的熱力圖分析主要圍繞經緯度和銷量展開。


我們來看一下由經緯度和銷量而生成的景點人氣熱力圖


資料分析之全國熱門景點分析

從圖中可以看到京津翼,珠三角,長三角,江浙滬,華中,新疆,東北等地是遊客扎堆的地方。

放大地圖後,可以觀察到具體某個省份或某個城市的景區分佈,作者以所在的城市武漢為例,如下圖所示。


資料分析之全國熱門景點分析

可以看到圖中的熱門景點(顏色越紅,代表所去的人越多)與平常所見所聞基本一致,如戶部巷,楚河漢街,武漢大學等一系列地方。

即如果我們出行的話,可以選擇圖中景點熱度稍微低一點的地方(即顏色稍微淺一些的地方)。


最後本例只採集了一個平臺的資料,如果想獲得更準確的出行建議的話,我們可以採集更多線上旅行電商的資料。然後再畫出出行熱力圖。


程式碼地址:

https://github.com/NGUWQ/Python3Spider/tree/master/dataanalysis



對爬蟲,資料分析,演算法感興趣的朋友們,可以加微信公眾號 TWcoding,我們一起玩轉Python。

If it works for you.Please,star.

自助者,天助之

資料分析之全國熱門景點分析



相關文章