鏈家網8000+萬個檔案何處安家?
房產中介來由已久,“牙人”便是唐代時對中介人的稱呼。無論買房、賣房還是租房,絕大多數房產相關的商業行為都離不開中介。從實體店到線上,從網站到移動App,從內部系統到2C業務,與蓬勃發展的中國房地產行業一道,鏈家網也不斷與時俱進,更新系統架構,滿足不斷變化的市場和業務需求。
十年鏈家網,S3終迴歸
“現在,鏈家網儲存服務承載的總檔案數量已達8270萬+,房屋實堪圖佔66%,其他圖片佔15%,音視訊佔13%,檔案備份佔4%,其他型別資料佔2%,總儲存容量43TB。”2016 AWS北京峰會上,鏈家網平臺服務架構師呂毅分享了最新的儲存服務相關資料。不過時至今日,這些資料或許又會有變化了。
事實上,早在2007年,鏈家線上(鏈家網前身)、HERP系統就已上線運營,到2008年“樓盤字典”專案啟動,2012年提出“真房源”,SE(Sales Effectiveness)、TE(Transaction Effectiveness)系統上線,“掌上鍊家”App釋出,近六年時間,鏈家網儲存架構採用的一直是傳統檔案系統。
隨著業務線不斷擴充套件,資料量不斷增長,傳統架構中儲存服務的瓶頸日益凸顯。2014年,更名的鏈家網明確了大力發展2C業務、著手自研究SE、TE系統的業務思路。其間,儲存架構經歷了從傳統檔案系統到輕量級開源分散式檔案系統FastDFS的變遷。再後來,鏈家網又選用了開源分散式檔案系統Ceph,直到2016年,SE、TE合併為Link系統,“樓盤字典”積累了7000萬房產資訊,更多的UGC、PGC內容產生,AWS S3終擔重任。
鏈家網儲存架構變遷
十年鏈家網,S3終迴歸。巧合的是,2015年,鏈家網開始啟用AWS時,S3也已十歲了。呂毅表示,在大家熟悉的AWS S3能力之外,鏈家網對S3服務進行包裝後實現了更多的能力:採用Huge Bucket統一管理公司內部Bucket、使用資料庫儲存檔案Meta資訊供檢索、非常划算的冷資料儲存、代理S3服務讓使用者可在S3能力上封裝公司通用邏輯……AWS S3為使用者提供了足夠抽象的能力,方便企業、個人基於S3通用能力之上進行改造與包裝,這些方面也都是鏈家網選擇AWS的重要原因。
選擇S3的N個理由
開源商用領域,Ceph一直是分散式檔案系統的熱門選項。然而,並不是所有人都有時間和精力玩兒轉Ceph,尤其是在競爭激烈,業務瞬息變化的房地產市場,時間視窗是橫亙在所有市場行為主體面前的一座大山。
時不我待,千言萬語一個字:“快”!呂毅坦言,鏈家網在使用Ceph的過程中遇到了容量、運維、資料備份等方面的問題,各種因素疊加,反而推高了綜合成本,因此下定決心改造系統。
容量不夠、運維成本高、資料備份堪憂……使用Ceph過程中遇到的問題恰恰是S3使用者不需操心的事,容量規劃、儲存管理、資料備份,S3統統能輕鬆搞定,更無需硬體維護。此外,S3具備高達11個9的永續性,可讓長期資料留存“高枕無憂”。
鏈家網基於AWS S3的儲存架構
儲存架構改造過程中,不可避免地會遇到這樣那樣的問題。呂毅表示,以鏈家網自身的實踐經驗看,資料存量與增量問題、業務方遷移成本是兩個主要問題,相信這也是很多使用者面臨的共性問題。恰好在這些方面,AWS都能提供高均衡度的解決方案。“2015年底,鏈家網剛開始採用AWS服務時,EC2和ELB只承擔了外網20%的負載,本地資料中心和雲通過AWS Direct Connect連線。現在,主備中心已經對調了位置,雲端已承載了近80%的外網負載,並引入S3和資料倉儲服務Redshift,高效、可靠、安全地整理資料資料。”呂毅表示。
下一個十年,鏈家網又將經歷怎樣的變革之旅?搭上了雲快車,未來充滿想象和期待。
本文出處:暢享網
本文來自雲棲社群合作伙伴暢享網,瞭解相關資訊可以關注vsharing.com網站。
相關文章
- 處理 Linux 檔案的 3 個技巧Linux
- Python處理CSV檔案的幾個方法Python
- python 檔案處理Python
- python處理檔案Python
- python檔案處理Python
- KeyboardMaestro_PathFinder_依次處理多個選中檔案
- oracle 控制檔案及引數檔案何時自動備份Oracle
- C/C++標頭檔案太難記?一個萬能標頭檔案全搞定!C++
- 新手小白打算建一個自己的網站,該從何處下手?網站
- elf檔案處理工具
- python處理txt檔案Python
- window 批處理檔案
- Python之檔案處理Python
- Go xml檔案處理GoXML
- [友鏈] 個人網站友鏈網站
- 記一次800多萬XML文字檔案預處理經歷XML
- 什麼叫智慧電網,「智慧」在何處?
- 使用beautifulsoup和re抓取鏈家資料基礎並儲存為csv檔案
- Dockerfile檔案萬字全面解析Docker
- Rust for Linux 專案為何處於危險之中?RustLinux
- 使用MFT進行加密檔案傳輸的7個好處加密
- node js 處理PDF檔案JS
- 控制檔案損壞處理
- Python批處理:檔案操作Python
- python ini 配置檔案處理Python
- Python如何處理檔案的?Python
- 使用 Python 處理 CSV 檔案Python
- ultracompare22,檔案處理
- java 檔案處理 工具類Java
- Python 如何處理大檔案Python
- 多個 EXCEL 檔案如何合併成一個檔案Excel
- 埃森哲、亞馬遜和萬事達卡抱團推出的區塊鏈專案有何神通?亞馬遜區塊鏈
- 網校原始碼究竟有何過人之處?原始碼
- 萬達網路科技集團釋出“大資料+區塊鏈”專案大資料區塊鏈
- java自己封裝檔案處理Java封裝
- 001.00 一般檔案處理
- Excel VBA 利用FileSystemObject處理檔案ExcelObject
- Python筆記(五)——檔案處理Python筆記