使用set cover演算法最佳化大型分散式系統的查詢延遲

banq發表於2013-08-25
來自LinkedIn的一篇文章Using set cover algorithm to optimize query latency for a large scale distributed graph

LinkedIn在實現一個人的連線距離時,需要查詢這個人的關係連線,這兩個連線有可能儲存在不同分割槽伺服器,也可能儲存在同一個伺服器,但是原來系統不管是否儲存在同一個節點,都看成儲存在不同伺服器,導致快取等利用率低,延遲高。

他們使用了set cover演算法,能夠尋找一個集合中最小子集,這樣能夠提高查詢合併延遲,提升效能。
該演算法實現原始碼:github

[該貼被banq於2013-08-25 08:52修改過]

相關文章