mongodb索引--1億條記錄的查詢從55.7秒到毫秒級別

weixin_34162629發表於2018-12-28

從頭開始,驗證mongodb的索引的好處。(window7環境下)

  1. 下載mongodb伺服器,並解壓到d盤,並使用以下命令啟動

    mongod --dbpath D:\mongodb\data

  2. mongo客戶端Robo 3T 去官網下載,安裝

  3. 準備資料,條數為1億

    public static void main(String[] args) {        try {            /**** Connect to MongoDB ****/
                // Since 2.10.0, uses MongoClient
                MongoClient mongo = new MongoClient("localhost", 27017);            /**** Get database ****/
                // if database doesn't exists, MongoDB will create it for you
                DB db = mongo.getDB("www");            /**** Get collection / table from 'testdb' ****/
                // if collection doesn't exists, MongoDB will create it for you
                DBCollection table = db.getCollection("person");            /**** Insert ****/
                // create a document to store key and value
                BasicDBObject document=null;            
                for(int i=0;i<100000000;i++) {
                    document = new BasicDBObject();
                    document.put("name", "mkyong"+i);
                    document.put("age", 30);
                    document.put("sex", "f");
                    table.insert(document);
                }            /**** Done ****/
                System.out.println("Done");
    
            } catch (UnknownHostException e) {
                e.printStackTrace();
            } catch (MongoException e) {
                e.printStackTrace();
            }
    
        }
  4. 獲取索引情況

     

  5. 根據姓名查詢一條記錄

     

  6. 根據姓名建立索引

    建立索引的時間稍微有點長,請耐心等待

    db.person.createIndex({name:1})

     

     

  7. 索引情況

     

  8. 再一次查詢

     

索引說明:

索引通常能夠極大的提高查詢的效率,如果沒有索引,MongoDB在讀取資料時必須掃描集合中的每個檔案並選取那些符合查詢條件的記錄。

這種掃描全集合的查詢效率是非常低的,特別在處理大量的資料時,查詢可以要花費幾十秒甚至幾分鐘,這對網站的效能是非常致命的。

索引是特殊的資料結構,索引儲存在一個易於遍歷讀取的資料集合中,索引是對資料庫表中一列或多列的值進行排序的一種結構。

http://www.runoob.com/mongodb/mongodb-indexing.html

createIndex() 方法

MongoDB使用 createIndex() 方法來建立索引。

注意在 3.0.0 版本前建立索引方法為 db.collection.ensureIndex(),之後的版本使用了 db.collection.createIndex() 方法,ensureIndex() 還能用,但只是 createIndex() 的別名。

語法

createIndex()方法基本語法格式如下所示:

>db.collection.createIndex(keys, options)

語法中 Key 值為你要建立的索引欄位,1 為指定按升序建立索引,如果你想按降序來建立索引指定為 -1 即可。

例項

>db.col.createIndex({"title":1})
>

createIndex() 方法中你也可以設定使用多個欄位建立索引(關係型資料庫中稱作複合索引)。

>db.col.createIndex({"title":1,"description":-1})
>

createIndex() 接收可選引數,可選引數列表如下:

ParameterTypeDescription
background Boolean 建索引過程會阻塞其它資料庫操作,background可指定以後臺方式建立索引,即增加 "background" 可選引數。 "background" 預設值為false
unique Boolean 建立的索引是否唯一。指定為true建立唯一索引。預設值為false.
name string 索引的名稱。如果未指定,MongoDB的通過連線索引的欄位名和排序順序生成一個索引名稱。
dropDups Boolean 3.0+版本已廢棄。在建立唯一索引時是否刪除重複記錄,指定 true 建立唯一索引。預設值為 false.
sparse Boolean 對文件中不存在的欄位資料不啟用索引;這個引數需要特別注意,如果設定為true的話,在索引欄位中不會查詢出不包含對應欄位的文件.。預設值為 false.
expireAfterSeconds integer 指定一個以秒為單位的數值,完成 TTL設定,設定集合的生存時間。
v index version 索引的版本號。預設的索引版本取決於mongod建立索引時執行的版本。
weights document 索引權重值,數值在 1 到 99,999 之間,表示該索引相對於其他索引欄位的得分權重。
default_language string 對於文字索引,該引數決定了停用詞及詞幹和詞器的規則的列表。 預設為英語
language_override string 對於文字索引,該引數指定了包含在文件中的欄位名,語言覆蓋預設的language,預設值為 language.

例項

在後臺建立索引:

db.values.createIndex({open: 1, close: 1}, {background: true})

通過在建立索引時加 background:true 的選項,讓建立工作在後臺執行

相關文章