Python資料分析入門(四)

NGU發表於2018-08-25

前言

上期給大家分享了關於豆瓣5500部電視劇的分析,那麼這次我們就給吃貨們帶來一些福利,此次我們的主題為“尋找最好吃的火鍋”。進入主題之前,先給所有的吃貨們帶來一桌美味的火鍋,作為各位看官的前菜。

Python資料分析入門(四)


資料採集

此次我們採集的是移動端大眾點評上所有帶有火鍋標籤的餐廳,如下圖所示。

Python資料分析入門(四)

選擇一個火鍋店點選頁面詳細資訊

Python資料分析入門(四)

此次需要採集的資訊是餐廳名稱,人均價格、點評人數以及餐廳的評分(口味。環境,服務),用於後文的分析。


資料分析

此次一共採集了100個城市,22554家火鍋店,1597萬條評論來做為我們分析的基礎。先來看看火鍋的全國熱力圖。

Python資料分析入門(四)

是不是跟大家想得有點不一樣,的確,小編也沒有想到。火鍋店數量較多的還是在華東和華北區域。我們再來看看TOP20城市的火鍋店數量。

Python資料分析入門(四)

可以看出前10的城市火鍋數量相隔不大,後10位的城市火鍋數量也相差不大,這說明從全國來看火鍋的受眾群體和需要量還是比較大的,吃火鍋也是一件很“流行”的事。
再來看看TOP20城市的評論數量。

Python資料分析入門(四)

可以看出上海的評論數量遙遙領先於其它城市,可能存在以下兩個因素:a.上海市的火鍋餐廳數量較多,本身存在較大的消費群體 b.大眾點評總部在上海,上海的商戶入駐數量較多。如有興趣的朋友可以進行更深一步的研究。

討論完了火鍋數量和評論數後,我們再來看看TOP20城市的火鍋人均消費是多少。

Python資料分析入門(四)

可以看出上海不僅火鍋店的數量比較多,它的價格也是全國城市當中最高的,人均價格達到了147元,而成都的人均價為88元,最後一名武漢的火鍋店人均價格為83元,火鍋之都重慶的價格卻不在上述列表內,說明它的人均價格是低於83元的。我們再來看看TOP20城市的火鍋店平均分,平均分的計算方式是火鍋店的評分(口味。環境,服務)三者之後除以3之後所得。

Python資料分析入門(四)


不出所料,火鍋之都重慶是此次評分的榜首,武漢屈居第二,南京則排到了第三。那麼分析到這裡我們就已經有自己的結論了,武漢和重慶這兩座城市是目前城市裡吃火鍋價效比最高的,它們城市的火鍋店不僅評分高,價格還比較實惠。而且這兩座城市還有許多著名的景點,所以我們在旅途中不光可以看到美麗的風景,也還可以吃到好吃的火鍋,豈不是一件很美妙的事。尤其是小編所在的武漢,除了火鍋,還有大量其它的美食。如果你是吃貨,並且熱愛旅遊,那麼這兩個城市應該是你的首選之地。最後我們再放上好吃的火鍋。

Python資料分析入門(四)

Python資料分析入門(四)

Python資料分析入門(四)

好了,不說了,小編吃火鍋去了。


需要原始碼的讀者可以後臺留言,小編看到就會第一時間回覆你。

對爬蟲,資料分析,演算法感興趣的朋友們,可以加微信公眾號 TWcoding,我們一起玩轉Python。

If it works for you.Please,star.


自助者,天助之

Python資料分析入門(四)



相關文章