西雅圖AirBnB資料分析的開源案例

banq發表於2022-02-23

深入分析美國華盛頓州西雅圖的 AirBnB 活動:AirBnB 是旅遊業和酒店業的一場革命。人們將自己的財產或備用房間出租給遊客的概念促進了可持續旅行。鑑於 AirBnB 是一家資料驅動型公司,這為我們提供了一個獨特的機會來利用資料並探索世界各地的旅遊趨勢。作為 Inside AirBnB 計劃的一部分,AirBnB 釋出了捕捉美國西雅圖的 AirBnB 活動的資料。

在這篇文章中,我試圖深入探討同樣的問題,並搶先了解西雅圖的 AirBnB 趨勢。

 

資料概覽

AirBnB 釋出的資料收集了 2016 年的資料,描述了美國華盛頓州西雅圖的寄宿家庭的掛牌活動。西雅圖資料集中包含以下 Airbnb 活動:

  • — 房源,包括房源的完整描述和平均評論分數
  • — 評論,包括每個評論者的唯一 ID 和每個房源的詳細評論
  • — 日曆,包括房源 ID 以及價格和哪天可用

 

資料分析

在分析開始時,我定義了三個業務問題來幫助我理解西雅圖資料集:

  • Q1:一年中訪問西雅圖最繁忙的時間是什麼時候?價格飆升了多少?
  • Q2:哪些街區最受歡迎?可以使用可用資料來描述這些社群嗎?
  • Q3:我們可以使用listing details來預測listing價格嗎?如果是,哪些資訊是最重要的預測指標?

 

該專案需要安裝 Python 3.x 和以下 Python 庫:

詳細程式碼點選標題:

  • NumPy
  • Pandas
  • matplotlib
  • scikit-learn
  • RegEx
  • NLTK
  • Seaborn
  • Statsmodels

相關文章