鏈家網8000+萬個檔案何處安家?

玄學醬發表於2018-05-10

房產中介來由已久,“牙人”便是唐代時對中介人的稱呼。無論買房、賣房還是租房,絕大多數房產相關的商業行為都離不開中介。從實體店到線上,從網站到移動App,從內部系統到2C業務,與蓬勃發展的中國房地產行業一道,鏈家網也不斷與時俱進,更新系統架構,滿足不斷變化的市場和業務需求。

十年鏈家網,S3終迴歸

“現在,鏈家網儲存服務承載的總檔案數量已達8270萬+,房屋實堪圖佔66%,其他圖片佔15%,音視訊佔13%,檔案備份佔4%,其他型別資料佔2%,總儲存容量43TB。”2016 AWS北京峰會上,鏈家網平臺服務架構師呂毅分享了最新的儲存服務相關資料。不過時至今日,這些資料或許又會有變化了。

事實上,早在2007年,鏈家線上(鏈家網前身)、HERP系統就已上線運營,到2008年“樓盤字典”專案啟動,2012年提出“真房源”,SE(Sales Effectiveness)、TE(Transaction Effectiveness)系統上線,“掌上鍊家”App釋出,近六年時間,鏈家網儲存架構採用的一直是傳統檔案系統。

隨著業務線不斷擴充套件,資料量不斷增長,傳統架構中儲存服務的瓶頸日益凸顯。2014年,更名的鏈家網明確了大力發展2C業務、著手自研究SE、TE系統的業務思路。其間,儲存架構經歷了從傳統檔案系統到輕量級開源分散式檔案系統FastDFS的變遷。再後來,鏈家網又選用了開源分散式檔案系統Ceph,直到2016年,SE、TE合併為Link系統,“樓盤字典”積累了7000萬房產資訊,更多的UGC、PGC內容產生,AWS S3終擔重任。

2016-10-27-12df262129-90b9-4cfc-acbb-df9

鏈家網儲存架構變遷

十年鏈家網,S3終迴歸。巧合的是,2015年,鏈家網開始啟用AWS時,S3也已十歲了。呂毅表示,在大家熟悉的AWS S3能力之外,鏈家網對S3服務進行包裝後實現了更多的能力:採用Huge Bucket統一管理公司內部Bucket、使用資料庫儲存檔案Meta資訊供檢索、非常划算的冷資料儲存、代理S3服務讓使用者可在S3能力上封裝公司通用邏輯……AWS S3為使用者提供了足夠抽象的能力,方便企業、個人基於S3通用能力之上進行改造與包裝,這些方面也都是鏈家網選擇AWS的重要原因。

選擇S3的N個理由

開源商用領域,Ceph一直是分散式檔案系統的熱門選項。然而,並不是所有人都有時間和精力玩兒轉Ceph,尤其是在競爭激烈,業務瞬息變化的房地產市場,時間視窗是橫亙在所有市場行為主體面前的一座大山。

時不我待,千言萬語一個字:“快”!呂毅坦言,鏈家網在使用Ceph的過程中遇到了容量、運維、資料備份等方面的問題,各種因素疊加,反而推高了綜合成本,因此下定決心改造系統。

容量不夠、運維成本高、資料備份堪憂……使用Ceph過程中遇到的問題恰恰是S3使用者不需操心的事,容量規劃、儲存管理、資料備份,S3統統能輕鬆搞定,更無需硬體維護。此外,S3具備高達11個9的永續性,可讓長期資料留存“高枕無憂”。

2016-10-27-322b1aa48b-14eb-4260-a952-d18

鏈家網基於AWS S3的儲存架構

儲存架構改造過程中,不可避免地會遇到這樣那樣的問題。呂毅表示,以鏈家網自身的實踐經驗看,資料存量與增量問題、業務方遷移成本是兩個主要問題,相信這也是很多使用者面臨的共性問題。恰好在這些方面,AWS都能提供高均衡度的解決方案。“2015年底,鏈家網剛開始採用AWS服務時,EC2和ELB只承擔了外網20%的負載,本地資料中心和雲通過AWS Direct Connect連線。現在,主備中心已經對調了位置,雲端已承載了近80%的外網負載,並引入S3和資料倉儲服務Redshift,高效、可靠、安全地整理資料資料。”呂毅表示。

下一個十年,鏈家網又將經歷怎樣的變革之旅?搭上了雲快車,未來充滿想象和期待。

本文出處:暢享網
本文來自雲棲社群合作伙伴暢享網,瞭解相關資訊可以關注vsharing.com網站。


相關文章