MongoDB學習筆記之索引用法和效率分析

edithfang發表於2015-01-26
MongoDB可以在各種型別的鍵上建立索引。下面分別講解各種型別的索引的建立,查詢,以及索引的維護等...

一、建立索引
   
1. 預設索引

MongoDB有個預設的“_id”的鍵,他相當於“主鍵”的角色。集合建立後系統會自動建立一個索引在“_id”鍵上,它是預設索引,索引名叫“_id_”,是無法被刪除的。我們可以通過以下方式檢視:

var _idIndex = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_id_");
Console.WriteLine(_idIndex);
   
2. 單列索引

在單個鍵上建立的索引就是單列索引,例如我們要在“UserInfo”集合上給“UserName”鍵建立一個單列索引,語法如下:(1表示正序,-1逆序)

mongoCollection.Metadata.CreateIndex(new Document { { "UserName", 1 } }, false);


接著,我們用同樣方法查詢名為“_UserName_”的索引

var _UserName_Index = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_UserName_");
Console.WriteLine(_UserName_Index);
   
3.組合索引

另外,我們還可以同時對多個鍵建立組合索引。如下程式碼建立了按照“UserId”正序,“UserName”逆序的組合索引:

mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 }, { "UserName", -1 } }, false);
   
4.子文件索引

我們可以對文件型別的鍵建立各種索引,例如單列索引,如下建立使用者詳細資訊“Detail”的單列索引:

mongoCollection.Metadata.CreateIndex(new Document { { "Detail", 1 } }, false);


對子文件的鍵建立組合索引:例如在“Detail.Address”和“Detail.Age”上建立組合索引:

mongoCollection.Metadata.CreateIndex(new Document { { "Detail.Address", 1 }, { "Detail.Age", -1 } }, false);
   
5.唯一索引

唯一索引限制了對當前鍵新增值時,不能新增重複的資訊。值得注意的是,當文件不存在指定鍵時,會被認為鍵值是“null”,所以“null”也會被認為是重複的,所以一般被作為唯一索引的鍵,最好都要有鍵值對。

對“UserId”建立唯一索引(這時候最後一個引數為“true”):

mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 } }, true);


二、維護索引
   
1. 查詢索引

通過索引名查詢的方式已有介紹。但有時候,我們可能忘記了索引名,怎麼查詢呢?

下面提供一個遍歷全部索引的方法,列印全部索引資訊:

foreach (var index in mongoCollection.Metadata.Indexes)
 {
     Console.WriteLine(index.Value);
}


輸出結果示例:

{ "name": "_id_", "ns": "myDatabase.UserInfo", "key": { "_id": 1 } }
{ "name": "_UserId_unique_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1 }, "unique": true, "_id": "4d8f406ab8a4730b78000005" }
{ "name": "_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserName": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000006" }
{ "name": "_Detail.Address_Detail.Age_", "ns": "myDatabase.UserInfo", "key": { "Detail.Address": 1, "Detail.Age": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000007" }
{ "name": "_UserId_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1, "UserName": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000008" }
{ "name": "_Detail_", "ns": "myDatabase.UserInfo", "key": { "Detail": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000009" }


可見,集合的索引也是通過一個集合來維護的。name表示索引名,ns表示索引屬於哪個庫哪個集合,key表示索引在哪個鍵上,正序還是逆序,unique表示是否為唯一索引,等等...

2. 刪除索引

新手常陷入的誤區是,認為集合被刪除,索引就不存在了。關係型資料庫中,表被刪除了,索引也不會存在。在MongoDB中不存在刪除集合的說法,就算集合資料清空,索引都是還在的,要移除索引還需要手工刪除。

例如,刪除名為“_UserName_”的索引:

mongoCollection.Metadata.DropIndex("_UserName_");


下面提供刪除除預設索引外其他全部索引的方法:

public void DropAllIndex()
{
    var listIndexes = mongoCollection.Metadata.Indexes.ToList();
    for (int i = 0; i < listIndexes.Count; i++)
    {
        if (listIndexes.Key != "_id_")
        {
            mongoCollection.Metadata.DropIndex(listIndexes.Key);
        }
    }
}

三、索引的效率

MongoDB的索引到底能不能提高查詢效率呢?我們在這裡通過一個例子來測試。比較同樣的資料在無索引和有索引的情況下的查詢速度。

首先,我們通過這樣一個方法插入10W條資料:

public void InsertBigData()
{
    var random = new Random();
    for (int i = 1; i < 100000; i++)
    {
        Document doc = new Document();
 
        doc["ID"] = i;
        doc["Data"] = "data" + random.Next(100000);
 
        mongoCollection.Save(doc);
    }
 
    Console.WriteLine("當前有" + mongoCollection.FindAll().Documents.Count() + "條資料");
}


然後,實現一個方法用來建立索引:

public void CreateIndexForData()
{
    mongoCollection.Metadata.CreateIndex(new Document { { "Data", 1 } }, false);
}


還有排序的方法:

public void SortForData()
{
    mongoCollection.FindAll().Sort(new Document { { "Data", 1 } });
}


執行測試程式碼如下:

static void Main(string[] args)
{
    IndexBLL indexBll = new IndexBLL();
    indexBll.DropAllIndex();
    indexBll.DeleteAll();
    indexBll.InsertBigData();
 
    Stopwatch watch1 = new Stopwatch();
    watch1.Start();
    for (int i = 0; i < 1; i++) indexBll.SortForData();
    Console.WriteLine("無索引排序執行時間:" + watch1.Elapsed);
 
    indexBll.CreateIndexForData();
 
    Stopwatch watch2 = new Stopwatch();
    watch2.Start();
    for (int i = 0; i < 1; i++) indexBll.SortForData();
    Console.WriteLine("有索引排序執行時間:" + watch2.Elapsed);
 
}


最後執行程式檢視結果:

多次測試表明在有索引的情況下,查詢效率要高於無索引的效率。
相關閱讀
評論(1)

相關文章