租金多少才算合理?智慧分析工具Sophon幫你預測房屋租金
作為一名租客,你是否覺得租的房子品質平平,中介卻年年漲價;想換個地方住,在中介找個心儀又價廉的房子猶如大海撈針。而作為一名房東,你是否又遇到過中介左手壓價房東、右手漲價租客的情況?自己的房子,多少租出去才最合適?
如今,租房資訊大都掌握在房產中介手中,房主和租客之間很少形成對接,中介平台可以任意抬升房租價格,以賺取更多中間差價。很多租客對房租市場了解較少,很容易租下房租過高的住房,致使生活成本增加。
克而瑞發布的**《2021年1~6月上海租賃市場月度報告》**顯示:上半年上海租房市場租金整體呈上升狀態。部分區域甚至已經連續上漲了7個月。房租上漲成了困擾人們的大問題。為了打破房產中介對房屋資訊的壟斷,為大眾提供租金定價參考。本文將使用最近的房租數據,在智慧分析工具Sophon上訓練模型,並利用模型進行租金預測。
數據集介紹
本次實驗數據集來自愛數科,為CSV文件。包含2020末-2021年初來自房天下、58同城、趕集網的位於北京、上海、深圳約**20000條數據。**除上述網站提供的基本資訊,還整合了由百度地圖API獲取的經緯度和周邊設施資訊。
數據集欄位如下:
該數據集價格以外的欄位將作為輸入,而價格將作為預測目標。由此可見該問題是回歸問題。回歸問題可以使用線性回歸、K近鄰、XGBoost、神經網路、隨機森林等演算法進行訓練。本文將選取隨機森林進行訓練。
開始實驗
在創建項目之前,本文默認您的sophon平台及各種配置文件已經成功安裝,正常運行,並且您已成功註冊sophon 用戶。
進入項目首頁,點擊**「+新建項目」**以新建一個項目。
導入數據與數據探索
本次實驗數據集是CSV文件,可以直接導入至sophon平台。
點擊主介面左邊的數據集按鈕進入數據集總覽介面,在該頁面點擊**「新建數據集」。**
在彈出的新建數據集窗口中,點擊**「從本地導入」。**
在數據集導入頁面上傳本地的CSV文件,點擊確定創建數據集。
Sophon也支援其他多種數據源。用戶可以通過多種方式導入數據,除了跟Transwarp Data Hub做深度對接以外,還支援多種數據源,包括RDBS、HDFS、ORC、Parquet等。
數據集創建完成後點擊該數據集進入詳情介面,可以瀏覽數據集欄位。
同時Sophon也提供**圖形探索於統計分析功能,**點擊上方的圖形探索按鈕進入對應介面。
Sophon提供**多樣圖標樣式與自定義模組,簡單拖動數據集欄位即可完成圖表,**幫助用戶迅速完成數據探索。圖中可以看到數據集大部分房屋租金都在50000以下,面積在300以下。還有少部分面積大,租金高的異常點,這些異常數據不利於模型的訓練與測試,需要處理。同理查看其他的指標與價格之間的聯繫,發現其中的異常點,在後續的預處理環節進行處理。
點擊上方的統計分析按鈕進入對應介面。
在統計分析介面,**可以自定義數據集欄位,點擊分析後以圖表形式給出分析結果,**幫助用戶迅速完成數據探索。在該數據集中,有許多數據朝向欄位為空,需要對數據進行預處理。還有一些欄位值為唯一值,在訓練前盡量去除這些學習難度大的欄位。
搭建運算元
回到項目首頁,點擊左側的實驗,點擊實驗以新建空白實驗。實驗創建後會自動進入該實驗介面。可以看到在左側運算元選擇介面中,我們已經可以使用剛剛上傳的數據集運算元。將該運算元拖動到右側的主流程介面。
拖動運算元,搭建預處理過程。
運算元搭建完成後,選中運算元設置參數。選中替換缺失值運算元,參數設置如下。
至此,數據預處理環節完成。
模型訓練
繼續搭建運算元,運算元連接如圖所示。
運算元搭建完成後,選中運算元設置參數。選中樣本切分運算元,**設置切分比例為9:1。**選中隨機森林回歸運算元,參數設置如下。
至此,主流程運算元搭建完成,點擊運行可以開始訓練。
運行實驗與查看結果
我們可以直接點擊上方的執行按鈕運行實驗。運行過程需要一段時間。
運行完成後,可以跳轉到實驗結果:
在之前性能(回歸)運算元的參數設置中,本文勾選了均方根誤差(RMSE)和R2_score兩個標準來判斷模型的好壞。
R2_score表示模型擬合數據集的好壞,越接近1 表示擬合效果越好。R2_score =0.80表示模型解釋了80%的不確定性,模型效果良好。
均方根誤差表示模型的偏離程度,**越接近 0 越好。**此處 928的含義就是說 68% 的預測房價值和真實房價之間的差值在928(元)之間, 95% 預測房價值和真實房價之間的差值在1856(元)之間。
在模型詳情中也可以看到該模型的參數重要性,以供參考:
在參數重要性表格中可以看到房屋面積的重要性最高,緊隨其後的是附近醫院數量、房間數量、學校數量、最大高度、廳數量等。由此可以知道這幾個參數會對房屋的租金產生較大影響。
在選擇房屋時,可以首先根據這幾個因素判斷房屋租金是否處於一個合理的範圍。
預測房租與API發布
新建一個實驗,搭建實驗流程,注意使用之前導出的模型運算元:
運算元的參數設置與上文相同,不再贅述。點擊執行以運行實驗。
在結果介面,可以看到模型對租金做出的預測:
實驗運行後,點擊實驗介面左上角的發布按鈕進入模型服務頁面:
在詳情介面填寫模型服務的相關資訊,注意在給上架的模型設置輸入時選擇數據集全部欄位,之後點擊上架以上架模型服務:
點擊左側的模型服務按鈕進入模型服務頁面,可以查看剛剛上架的模型服務:
雙擊該模型來查看詳細資訊,點擊上線進入服務上線頁面:
在服務上線頁面,可以根據需要調整服務細節,完成後點擊上線按鈕:
點擊左側工具欄的模型服務按鈕進入模型服務介面,點擊上方的服務管理按鈕進入服務管理頁面。在該頁面可以看到剛剛上線的服務:
**可以點擊測試連接按鈕測試連接狀態。**如果API有返回代表連接成功,無返回代表連接失敗。模型剛上線時會顯示連接失敗,請稍後再嘗試測試連接。
點擊測試按鈕可以測試模型,填寫對應的資訊後點擊測試,可以得到API的返回結果:
模型API調用
感興趣的用戶也可以嘗試調用該服務,實際體驗一下模型的效果。
API介面(HTTP)://tdh5:8743/testV1/api**密鑰:**Bearer
eyJhbGciOiJIUzUxMiJ9.eyJ1c2VybmFtZSI6Im1rdCIsInJvbGVzIjoiW1wicHVibGljXCIsXCJTT1BIT05fQkFTSUNcIl0iLCJleHAiOjQ3OTA4MDg3MTEsImlhdCI6MTYzNzIwODcxMX0.i08f39Oponyt5TvaWBCo7LLFsmyr-Q5vN0aOMX8p0VkL6N__kcvyvWe1SUfOUNcaiK6GfxbpTpgmRaGWxAZ9hw
基於Python的調用示例:
import requestsurl = “//tdh5:8743/testV1/api“headers = {“Content-Type”: “application/json”, “Authorization”: “Bearer eyJhbGciOiJIUzUxMiJ9.eyJ1c2VybmFtZSI6Im1rdCIsInJvbGVzIjoiW1wicHVibGljXCIsXCJTT1BIT05fQkFTSUNcIl0iLCJleHAiOjQ3OTA4MDg3MTEsImlhdCI6MTYzNzIwODcxMX0.i08f39Oponyt5TvaWBCo7LLFsmyr-Q5vN0aOMX8p0VkL6N__kcvyvWe1SUfOUNcaiK6GfxbpTpgmRaGWxAZ9hw”}data = r”'{“feeds”:{“MHno7-Pfi”:{“columns”:[“website”,”city”,”price”,”room”,”bathroom”,”hall”,”area”,”face”,”height”,”maxheight”,”ownbalcony”,”infopublishertype”,”ownbed”,”ownwardrobe”,”ownsofa”,”owntv”,”ownfridge”,”ownwasher”,”ownaircon”,”ownwaterheater”,”ownbroadband”,”owngas”,”ownheater”,”nearestschooldistance”,”schoolnumber”,”nearesthospitaldistance”,”hospitalnumber”],”rows”:[[“”,””,0,0,0,0,0,””,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]]}},”macros”:{}}”’response = requests.post(url=url, headers=headers, data=data)print(response.text)
**注意事項:**1、API具體的資訊輸入格式,請參考數據集欄位說明進行輸入。2、價格欄位的輸入不會影響服務的預測值。
關於Sophon
Sophon是星環科技的智慧分析工具軟體,包含3個主要模組:**Sophon Base,Sophon Edge,Sophon KG。**其中Sophon Base 數據科學基礎平台具備完整的數據探索、多數據源接入、實驗調度、智慧分析、用戶資產以及平台管理等功能;為用戶提供完整的模型上線閉環,全流程圖形化幫助用戶更加便捷地對線上服務進行管理,實現模型價值。
如果想要使用sophon實際操作,可點擊下面的鏈接-進入頁面-點擊立即申請-即可免費獲得7天使用許可權。
星環科技 | TranswarpCloudcloud.transwarp.cn/mobile/