我們是如何設計儲存4億個電話號碼的

發表於2019-05-11

如果你居住在印度,當不希望接受任何電話推銷員的騷擾時,你可以在全國客戶偏好登記冊(National Customer Preference Register,NCPR) 1、中進行註冊。政府維護了這個由使用者註冊的電話號碼組成的資料庫。現在,差不多有4億個註冊號碼。所有註冊的電話推銷員必須及時更新資料,以保證他們在進行推銷時會參考這個偏好設定進行工作。


這些資料由一捆ZIP檔案(當下是40個)提供,每個ZIP檔案包含一個10M的CSV檔案。這篇文章將會講述這2.4GB壓縮後的資料如何基於一些簡單的方式以一種可搜尋的格式適配2GB的記憶體。

閱讀原文

回覆

相關文章