主要就是貼程式碼,我還是比較猶豫的,因為我們做工程這件事怎麼說呢,應該不算主要業務。
1.用到的 Package
'''-------------------------- 本篇主要分析 Airbnb 2024.4.10 9:07 PM ------------------------------ ''' import pandas as pd import numpy as np import matplotlib.pyplot as plt import os print(np.__version__) os.getcwd()
2.匯入資料
# --- 匯入資料 --- data_ca = pd.read_csv(r"https://src20211130.oss-cn-beijing.aliyuncs.com/data-2024/listings-ca-usa-1.csv" , encoding='ISO-8859-1' ) data_ny = pd.read_csv(r"https://src20211130.oss-cn-beijing.aliyuncs.com/data-2024/listings-ny-usa-1.csv" , encoding='ISO-8859-1') print("-----------------------") print(data_ca.shape) print(data_ny.shape) data_base = pd.concat([data_ca, data_ny]).fillna(-1).reset_index(drop=True) print("*** data_base ***") print(data_base.shape) print("-----------------------\n")
3.資料處理。這一步仁者見仁智者見智,我們通常的做法,是將所有變數數值化,並且做好標準化(非常有用)。
4.構建 BP NN。這篇程式碼也是借鑑 Github 上的,參考:
https://shoelesscai.com/EssaySpace2/a/153005100001/945
主要結構都編寫在 class 裡,部分單獨羅列出的函式,是在用在 class 內部定義函式呼叫的。