租金多少才算合理?智慧分析工具Sophon幫你預測房屋租金
作為一名租客,你是否覺得租的房子質量平平,中介卻年年漲價;想換個地方住,在中介找個心儀又價廉的房子猶如大海撈針。而作為一名房東,你是否又遇到過中介左手壓價房東、右手漲價租客的情況?自己的房子,多少租出去才最合適?
如今,租房資訊大都掌握在房產中介手中,房主和租客之間很少形成對接,中介平臺可以任意抬升房租價格,以賺取更多中間差價。很多租客對房租市場瞭解較少,很容易租下房租過高的住房,致使生活成本增加。
克而瑞釋出的 《2021年1~6月上海租賃市場月度報告》顯示:上半年上海租房市場租金整體呈上升狀態。部分割槽域甚至已經連續上漲了7個月。房租上漲成了困擾人們的大問題。為了打破房產中介對房屋資訊的壟斷,為大眾提供租金定價參考。 本文將使用最近的房租資料,在智慧分析工具Sophon上訓練模型,並利用模型進行租金預測。
資料集介紹
本次實驗資料集來自愛數科,為CSV檔案。包含2020末-2021年初來自房天下、58同城、趕集網的位於北京、上海、深圳約 20000條資料。除上述網站提供的基本資訊,還整合了由百度地圖API獲取的經緯度和周邊設施資訊。
資料集欄位如下:
該資料集價格以外的欄位將作為輸入,而價格將作為預測目標。由此可見該問題是迴歸問題。迴歸問題可以使用線性迴歸、K近鄰、XGBoost、神經網路、隨機森林等演算法進行訓練。 本文將選取隨機森林進行訓練。
開始實驗
在建立專案之前,本文預設您的sophon平臺及各種配置檔案已經成功安裝,正常執行,並且您已成功註冊sophon 使用者。
進入專案首頁,點選 “+新建專案”以新建一個專案。
匯入資料與資料探索
本次實驗資料集是CSV檔案,可以直接匯入至sophon平臺。
點選主介面左邊的資料集按鈕進入資料集總覽介面,在該頁面點選 “新建資料集”。
在彈出的新建資料集視窗中,點選 “從本地匯入”。
在資料集匯入頁面上傳本地的CSV檔案,點選確定建立資料集。
Sophon也支援其他多種資料來源。使用者可以透過多種方式匯入資料,除了跟Transwarp Data Hub做深度對接以外,還支援多種資料來源,包括 RDBS、HDFS、ORC、Parquet等。
資料集建立完成後點選該資料集進入詳情介面,可以瀏覽資料集欄位。
同時Sophon也提供 圖形探索於統計分析功能,點選上方的圖形探索按鈕進入對應介面。
Sophon提供 多樣圖示樣式與自定義模組,簡單拖動資料集欄位即可完成圖表,幫助使用者迅速完成資料探索。圖中可以看到資料集大部分房屋租金都在50000以下,面積在300以下。還有少部分面積大,租金高的異常點,這些異常資料不利於模型的訓練與測試,需要處理。同理檢視其他的指標與價格之間的聯絡,發現其中的異常點,在後續的預處理環節進行處理。
點選上方的統計分析按鈕進入對應介面。
在統計分析介面, 可以自定義資料集欄位,點選分析後以圖表形式給出分析結果,幫助使用者迅速完成資料探索。在該資料集中,有許多資料朝向欄位為空,需要對資料進行預處理。還有一些欄位值為唯一值,在訓練前儘量去除這些學習難度大的欄位。
搭建運算元
回到專案首頁,點選左側的實驗,點選實驗以新建空白實驗。實驗建立後會自動進入該實驗介面。可以看到在左側運算元選擇介面中,我們已經可以使用剛剛上傳的資料集運算元。將該運算元拖動到右側的主流程介面。
拖動運算元,搭建預處理過程。
運算元搭建完成後,選中運算元設定引數。選中替換缺失值運算元,引數設定如下。
至此,資料預處理環節完成。
模型訓練
繼續搭建運算元,運算元連線如圖所示。
運算元搭建完成後,選中運算元設定引數。選中樣本切分運算元, 設定切分比例為9:1。選中隨機森林迴歸運算元,引數設定如下。
至此,主流程運算元搭建完成, 點選執行可以開始訓練。
執行實驗與檢視結果
我們可以直接點選上方的執行按鈕執行實驗。執行過程需要一段時間。
執行完成後,可以跳轉到實驗結果:
在之前效能(迴歸)運算元的引數設定中,本文勾選了 均方根誤差(RMSE)和R2_score兩個標準來判斷模型的好壞。
R2_score表示 模型擬合資料集的好壞,越接近1 表示擬合效果越好。R2_score =0.80表示 模型解釋了80%的不確定性,模型效果良好。
均方根誤差表示模型的偏離程度, 越接近 0 越好。此處 928的含義就是說 68% 的預測房價值和真實房價之間的差值在928(元)之間, 95% 預測房價值和真實房價之間的差值在1856(元)之間。
在模型詳情中也可以看到該模型的引數重要性,以供參考:
在引數重要性表格中可以看到 房屋面積的重要性最高,緊隨其後的是附近 醫院數量、房間數量、學校數量、最大高度、廳數量等。由此可以知道這幾個引數會對房屋的租金產生較大影響。
在選擇房屋時,可以首先根據這幾個因素判斷房屋租金是否處於一個合理的範圍。
預測房租與API釋出
新建一個實驗,搭建實驗流程,注意使用之前匯出的模型運算元:
運算元的引數設定與上文相同,不再贅述。點選執行以執行實驗。
在結果介面,可以看到模型對租金做出的預測:
實驗執行後,點選實驗介面左上角的釋出按鈕進入模型服務頁面:
在詳情介面填寫模型服務的相關資訊,注意在給上架的模型設定輸入時選擇資料集全部欄位,之後點選上架以上架模型服務:
點選左側的模型服務按鈕進入模型服務頁面,可以檢視剛剛上架的模型服務:
雙擊該模型來檢視詳細資訊,點選上線進入服務上線頁面:
在服務上線頁面,可以根據需要調整服務細節,完成後點選上線按鈕:
點選左側工具欄的模型服務按鈕進入模型服務介面,點選上方的服務管理按鈕進入服務管理頁面。在該頁面可以看到剛剛上線的服務:
可以點選測試連線按鈕測試連線狀態。如果API有返回代表連線成功,無返回代表連線失敗。模型剛上線時會顯示連線失敗,請稍後再嘗試測試連線。
點選測試按鈕可以測試模型,填寫對應的資訊後點選測試,可以得到API的返回結果:
模型API呼叫
感興趣的使用者也可以嘗試呼叫該服務,實際體驗一下模型的效果。
API介面(HTTP): http:// tdh5:8743/testV1/api 金鑰:Bearer
eyJhbGciOiJIUzUxMiJ9.eyJ1c2VybmFtZSI6Im1rdCIsInJvbGVzIjoiW1wicHVibGljXCIsXCJTT1BIT05fQkFTSUNcIl0iLCJleHAiOjQ3OTA4MDg3MTEsImlhdCI6MTYzNzIwODcxMX0.i08f39Oponyt5TvaWBCo7LLFsmyr-Q5vN0aOMX8p0VkL6N__kcvyvWe1SUfOUNcaiK6GfxbpTpgmRaGWxAZ9hw
基於Python的呼叫示例:
import requestsurl = " http:// tdh5:8743/testV1/api "headers = {"Content-Type": "application/json", "Authorization": "Bearer eyJhbGciOiJIUzUxMiJ9.eyJ1c2VybmFtZSI6Im1rdCIsInJvbGVzIjoiW1wicHVibGljXCIsXCJTT1BIT05fQkFTSUNcIl0iLCJleHAiOjQ3OTA4MDg3MTEsImlhdCI6MTYzNzIwODcxMX0.i08f39Oponyt5TvaWBCo7LLFsmyr-Q5vN0aOMX8p0VkL6N__kcvyvWe1SUfOUNcaiK6GfxbpTpgmRaGWxAZ9hw"}data = r'''{"feeds":{"MHno7-Pfi":{"columns":["website","city","price","room","bathroom","hall","area","face","height","maxheight","ownbalcony","infopublishertype","ownbed","ownwardrobe","ownsofa","owntv","ownfridge","ownwasher","ownaircon","ownwaterheater","ownbroadband","owngas","ownheater","nearestschooldistance","schoolnumber","nearesthospitaldistance","hospitalnumber"],"rows":[["","",0,0,0,0,0,"",0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]]}},"macros":{}}'''response = requests.post(url=url, headers=headers, data=data)print(response.text)
注意事項:1、API具體的資訊輸入格式,請參考資料集欄位說明進行輸入。2、價格欄位的輸入不會影響服務的預測值。
關於Sophon
Sophon是星環科技的智慧分析工具軟體,包含3個主要模組: Sophon Base,Sophon Edge,Sophon KG。其中Sophon Base 資料科學基礎平臺具備完整的資料探索、多資料來源接入、實驗排程、智慧分析、使用者資產以及平臺管理等功能;為使用者提供完整的模型上線閉環,全流程圖形化幫助使用者更加便捷地對線上服務進行管理,實現模型價值。
如果想要使用sophon實際操作,可點選下面的連結-進入頁面- 點選立即申請-即可免費獲得7天使用許可權。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69994106/viewspace-2848300/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 財務管理:租金攤銷計劃表
- PayLease報告:實現100%數字租金支付的5步
- 效能測試工具你知道多少?
- 馬化騰評馬雲:阿里巴巴像是收租金的地主 而我卻不收!阿里
- 學多少年才算“精通Java”?Java
- 【資料分析】颱風災害期間房屋損壞率預測
- 一臺智慧手機的系統維護週期有多長才算合理?
- 智慧數字經營平臺怎樣搭建才合理?
- 十大步驟幫你有效使用預測分析演算法演算法
- Sophon CE社群版上線,免費Get輕量易用、高效智慧的資料分析工具
- 學會用這些“套路”,你才算資料分析師
- 人工智慧算力出租,如何合理定價?人工智慧
- 微眾銀行投訴激增:租金貸業務存量10億,顧敏稱蛋殼專案或全損
- 智慧工具+海量模板幫你輕鬆搞定主圖設計!
- 從程式設計師到CTO要走多少步?人工智慧職業發展預測告訴你程式設計師人工智慧
- 【前端幫幫忙】第5期 關於CSS權重,你瞭解多少?前端CSS
- 預測維護和預測分析
- 測試人員與開發人員的比例究竟多少是合理的?
- App按鈕如何設計才合理?這些設計學問你還不知道APP
- 灰色預測分析
- 預測分析 · 員工滿意度預測
- 流上機器學習,星環科技Sophon Base助力海洋石油富島工藝監測智慧化機器學習
- 想要購買效能測試工具,如何計算自己需要多少併發使用者?
- 2022年最佳預測分析工具和軟體
- 健身房CRM軟體能幫你增加多少客人?
- 預算有限,資源冗餘?DWS叢集縮容如何幫你解決煩勞
- 強人工智慧和弱人工智慧,你瞭解多少?人工智慧
- 可以幫你減肥的智慧背心:Thin Ice
- 房屋戶型圖設計工具Room Arranger for MacOOMRangerMac
- 人工智慧未來有多可怕?你能預測得到嗎?人工智慧
- 未來人工智慧會有多可怕?你能預測嗎?人工智慧
- 大陸集團最新感測和控制技術,可以幫你提前預警“鬼探頭”
- 10種常見的計算機病毒,你知道多少?計算機
- 智慧足球幫你訓練:智慧化入侵體育市場
- MySQL伺服器最大連線數怎麼設定才合理MySql伺服器
- 圖形測試分析毫無頭緒?HarmonyOS圖形棧測試技術幫你解決
- Displio智慧日曆 生活規劃它幫你
- 資料分析告訴你,炒股能賠多少錢?