隨著國內服務共享化的熱潮普及，共享單車，共享雨傘，共享充電寶等各種服務如雨後春筍，隨之而來的LBS服務定位問題成為了後端服務的一個挑戰。MongoDB對LBS查詢的支援較為友好，也是各大LBS服務商的首選資料庫。騰訊雲MongoDB團隊在運營中發現，原生MongoDB在LBS服務場景下有較大的效能瓶頸，經騰訊雲團隊專業的定位分析與最佳化後，雲MongoDB在LBS服務的綜合效能上，有10倍以上的提升。

騰訊雲MongoDB提供的優異綜合效能，為國內各大LBS服務商，例如摩拜單車等，提供了強有力的保障。

LBS業務特點

以共享單車服務為例，LBS業務具有2個特點，分別是時間週期性和座標分佈不均勻。

一．時間週期性

雲MongoDB 最佳化讓LBS服務效能提升十倍

高峰期與低谷期的QPS量相差明顯，並且高峰期和低峰期的時間點相對固定。

二.座標分佈不均勻

雲MongoDB 最佳化讓LBS服務效能提升十倍

坐地鐵的上班族，如果留意可能會發現，在上班早高峰時，地鐵周圍擺滿了共享單車，而下班時段，地鐵周圍的共享單車數量非常少。如下圖，經緯度（121，31.44）附近集中了99%以上的座標。此外，一些特殊事件也會造成點的分佈不均勻，例如深圳灣公園在特殊家假日湧入大量的客戶，同時這個地域也會投放大量的單車。部分地域單車量非常集中，而其他地域就非常稀疏。

MongoDB的LBS服務原理

MongoDB中使用2d_index 或2d_sphere_index來建立地理位置索引(geoIndex),兩者差別不大，下面我們以2d_index為例來介紹。

一．2D索引的建立與使用

db.coll.createIndex({"lag":"2d"}, {"bits":int}))透過上述命令來建立一個2d索引，索引的精度透過bits來指定，bits越大，索引的精度就越高。更大的bits帶來的插入的overhead可以忽略不計
db.runCommand({geoNear: tableName,maxDistance: 0.0001567855942887398,distanceMultiplier: 6378137.0,num: 30,near: [ 113.8679388183982, 22.58905429302385 ],spherical: true|false})

透過上述命令來查詢一個索引，其中spherical：true|false 表示應該如何理解建立的2d索引，false表示將索引理解為平面2d索引，true表示將索引理解為球面經緯度索引。這一點比較有意思，一個2d索引可以表達兩種含義，而不同的含義是在查詢時被理解的，而不是在索引建立時。

二．2D索引的理論 MongoDB 使用GeoHash的技術來構建2d索引（見wiki geohash 文字鏈 )。MongoDB使用平面四叉樹劃分的方式來生成GeoHashId，每條記錄有一個GeoHashId，透過GeoHashId->RecordId的索引對映方式儲存在Btree中

很顯然的，一個2bits的精度能把平面分為4個grid，一個4bits的精度能把平面分為16個grid。 2d索引的預設精度是長寬各為26，索引把地球分為(2^26)(2^26)塊，每一塊的邊長估算為2 PI 6371000/(1 << 26) = 0.57 米 mongodb的官網上說的60cm的精度就是這麼估算出來的 By default, a 2d index on legacy coordinate pairs uses 26 bits of precision, which isroughly equivalent to 2 feet or 60 centimeters of precision using the default range of-180 to 180

三.2D索引在Mongodb中的儲存

上面我們講到Mongodb使用平面四叉樹的方式計算Geohash。事實上，平面四叉樹僅存在於運算的過程中，在實際儲存中並不會被使用到。

插入對於一個經緯度座標[x,y]，MongoDb計算出該座標在2d平面內的grid編號，該編號為是一個52bit的int64型別，該型別被用作btree的key，因此實際資料是按照 {GeoHashId->RecordValue}的方式被插入到btree中的。

查詢對於geo2D索引的查詢，常用的有geoNear和geoWithin兩種。geoNear查詢距離某個點最近的N個點的座標並返回，該需求可以說是構成了LBS服務的基礎（陌陌，滴滴，摩拜），geoWithin是查詢一個多邊形內的所有點並返回。我們著重介紹使用最廣泛的geoNear查詢。

geoNear的查詢過程,查詢語句如下

db.runCommand({geoNear: "places", //table Namenear: [ -73.9667, 40.78 ] , // central pointspherical: true, // treat the index as a spherical indexquery: { category: "public" } // filtersmaxDistance: 0.0001531 // distance in about one kilometer}

geoNear可以理解為一個從起始點開始的不斷向外擴散的環形搜尋過程。如下圖所示：由於圓自身的性質，外環的任意點到圓心的距離一定大於內環任意點到圓心的距離，所以以圓環進行擴張迭代的好處是： 1）減少需要排序比較的點的個數2）能夠儘早發現滿足條件的點從而返回，避免不必要的搜尋 MongoDB在實現的細節中，如果內環搜尋到的點數過少，圓環每次擴張的步長會倍增

MongoDB LBS服務遇到的問題

雲MongoDB 最佳化讓LBS服務效能提升十倍

部分大客戶在使用MongoDB的geoNear功能查詢附近的物件時，經常會發生慢查詢較多的問題，早高峰壓力是低谷時段的10-20倍，座標不均勻的情況慢查詢嚴重，瀕臨雪崩。初步分析發現，這些查詢掃描了過多的點集。如下圖，查詢500米範圍內，距離最近的10條記錄，花費了500ms，掃描了24000+的記錄。類似的慢查詢佔據了高峰期5%左右的查詢量

測試環境復現與定位排查資料庫的效能問題，主要從鎖等待,IO等待,CPU消耗三封面分析。上面的截圖掃描了過多的記錄，直覺上是CPU或者IO消耗性的瓶頸。為了嚴謹起見，我們在測試環境復現後，發現慢日誌中無明顯的timeAcquiringMicroseconds項排除了MongoDB執行層面的鎖競爭問題，並選用較大記憶體的機器使得資料常駐記憶體，發現上述用例依舊需要200ms以上的執行時間。10核的CPU資源針對截圖中的case，只能支援50QPS。

為何掃描集如此大上面我們說過，MongoDB搜尋距離最近的點的過程是一個環形擴張的過程，如果內環滿足條件的點不夠多，每次的擴張半徑都會倍增。因此在遇到內環點稀少，外環有密集點的場景時，容易陷入BadCase。如下圖，我們希望找到離中心點距離最近的三個點。由於圓環擴張太快，外環做了很多的無用掃描與排序。這樣的用例很符合實際場景，早高峰車輛聚集在地鐵周圍，你從家出發一路向地鐵，邊走邊找，共享單車軟體上動態搜尋距你最近的10輛車，附近只有三兩輛，於是擴大搜尋半徑到地鐵周圍，將地鐵周圍的所有幾千輛車都掃描計算一遍，返回距離你最近的其餘的七八輛

問題的解決

雲MongoDB 最佳化讓LBS服務效能提升十倍

問題我們已經知道了，我們對此的最佳化方式是控制每一圈的搜尋量，為此我們為geoNear命令增加了兩個引數，將其傳入NearStage中。hintCorrectNum可以控制結果品質的下限，返回的前N個一定是最靠近中心點的N個點。hintScan用以控制掃描集的大小的上限。

hintScan: 已經掃描的點集大小大於hintScan後，做模糊處理。 hintCorrectNum:已經返回的結果數大於hintCorrectNum後，做模糊處理。

該最佳化本質上是透過犧牲品質來儘快返回結果。對於國內大部分LBS服務來說，完全的嚴格最近並不是必要的。且可以透過控制引數獲得嚴格最近的效果。在搜尋過程中，密集的點落到一個環內，本身距離相差也不會不大。該最佳化在上線後，將部分大客戶的MongoDB效能上限從單機1000QPS提升了10倍到10000QPS以上。

和Redis3.2的對比

雲MongoDB 最佳化讓LBS服務效能提升十倍

Redis3.2也加入了地理位置查詢的功能，我們也將開源Redis和雲資料庫MongoDB進行對比。 Redis使用方式：GEORADIUS appname 120.993965 31.449034 500 m count 30 asc。在密集資料集場景下，使用騰訊雲MongoDB和開源的Redis進行了效能對比。下圖是在密集資料集上，在24核CPU機器上，MongoDB單例項與Redis單例項的測試對比。需要注意的是Redis本身是單執行緒的記憶體快取資料庫。MongoDB是多執行緒的高可用持久化的資料庫，兩者的使用場景有較大不同。

總結

雲MongoDB 最佳化讓LBS服務效能提升十倍

MongoDB原生的geoNear介面是國內各大LBS應用的主流選擇。原生MongoDB在點集稠密的情況下，geoNear介面效率會急劇下降，單機甚至不到1000QPS。騰訊雲MongoDB團隊對此進行了持續的最佳化，在不影響效果的前提下，geoNear的效率有10倍以上的提升，為我們的客戶如摩拜提供了強力的支援，同時相比Redis3.2也有較大的效能優勢。

作者 | 騰訊雲資料庫團隊

原文 |

雲MongoDB 最佳化讓LBS服務效能提升十倍

一．時間週期性

二.座標分佈不均勻

MongoDB的LBS服務原理

MongoDB LBS服務遇到的問題

問題的解決

和Redis3.2的對比

總結

相關文章