MongoDB之索引(全文索引)
在一些資訊管理平臺上經常需要進行資訊模糊查詢,最早的時候是在某個欄位上實現的模糊查詢,但是這個時候返回的資訊並不會很準確,因為只能夠查A欄位或者是B欄位,而在MongoDB裡面實現了非常簡單的全文檢索。
範例:定義一個新的集合
db.news.insert({"title":"stoneA","content":"ttA"});
db.news.insert({"title":"stoneB","content":"ttB"});
db.news.insert({"title":"stoneC","content":"ttC"});
db.news.insert({"title":"stoneD","content":"ttD"});
範例:建立全文索引
> db.news.createIndex({"title":"text","content":"text"});
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
範例:實現資料的模糊查詢
如果要想表示出全文檢索,則使用“$text"判斷符,而要想進行資料的查詢則使用“$search”運算子:
● 查詢指定的關鍵字:{"$search":"查詢關鍵字"}
● 查詢多個關鍵字(或關係):{"$search":"查詢關鍵字 查詢關鍵字 ..."}
● 查詢多個關鍵字(與關係):{"$search":"\"查詢關鍵字\" \"查詢關鍵字\" ..."}
● 查詢多個關鍵字(排除某一個):{"$search":"查詢關鍵字 查詢關鍵字 ...-排查關鍵字"}
範例:查詢單個內容
> db.news.find({"$text":{"$search":"stoneA"}})
{ "_id" : ObjectId("5992c4310184ff511bf02bbb"), "title" : "stoneA", "content" : "ttA" }
範例:查詢包含有“stoneA”和“stoneB”的資訊
> db.news.find({"$text":{"$search":"stoneA stoneB"}})
{ "_id" : ObjectId("5992c4310184ff511bf02bbc"), "title" : "stoneB", "content" : "ttB" }
{ "_id" : ObjectId("5992c4310184ff511bf02bbb"), "title" : "stoneA", "content" : "ttA" }
範例:查詢同時包含有“ttC”和“ttD”
> db.news.find({"$text":{"$search":"\"ttC\" \"ttD\""}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE" }
{ "_id" : ObjectId("5992c61d0184ff511bf02bc2"), "title" : "stoneD", "content" : "ttC ttD ttF" }
範例:查詢包含有“ttE”但是不包含“ttF”
> db.news.find({"$text":{"$search":"ttE -ttF"}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE" }
但是在進行全文檢索操作的時候還可以使用相似度的打分來判斷檢索結果。
範例:為查詢結果打分
> db.news.find({"$text":{"$search":"ttC ttD ttE"}},{"score":{"$meta":"textScore"}}).sort({"score":{"$meta":"textScore"}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE", "score" : 2 }
{ "_id" : ObjectId("5992c61d0184ff511bf02bc2"), "title" : "stoneD", "content" : "ttC ttD ttF", "score" : 1.3333333333333333 }
按照打分的成績進行排列,實際上就可以實現更加準確的資訊搜尋。
如果一個集合的欄位太多了,那麼每一個欄位都分別設定全文索引比較麻煩,簡單一些,可以為所有欄位設定全文索引。
範例:為所有欄位設定全文索引
> db.news.dropIndexes()
{
"nIndexesWas" : 2,
"msg" : "non-_id indexes dropped for collection",
"ok" : 1
}
> db.news.createIndex({"$**":"text"});
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
這是一種最簡單的設定全文索引的方式,但是儘可能別用,會慢。
範例:定義一個新的集合
db.news.insert({"title":"stoneA","content":"ttA"});
db.news.insert({"title":"stoneB","content":"ttB"});
db.news.insert({"title":"stoneC","content":"ttC"});
db.news.insert({"title":"stoneD","content":"ttD"});
範例:建立全文索引
> db.news.createIndex({"title":"text","content":"text"});
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
範例:實現資料的模糊查詢
如果要想表示出全文檢索,則使用“$text"判斷符,而要想進行資料的查詢則使用“$search”運算子:
● 查詢指定的關鍵字:{"$search":"查詢關鍵字"}
● 查詢多個關鍵字(或關係):{"$search":"查詢關鍵字 查詢關鍵字 ..."}
● 查詢多個關鍵字(與關係):{"$search":"\"查詢關鍵字\" \"查詢關鍵字\" ..."}
● 查詢多個關鍵字(排除某一個):{"$search":"查詢關鍵字 查詢關鍵字 ...-排查關鍵字"}
範例:查詢單個內容
> db.news.find({"$text":{"$search":"stoneA"}})
{ "_id" : ObjectId("5992c4310184ff511bf02bbb"), "title" : "stoneA", "content" : "ttA" }
範例:查詢包含有“stoneA”和“stoneB”的資訊
> db.news.find({"$text":{"$search":"stoneA stoneB"}})
{ "_id" : ObjectId("5992c4310184ff511bf02bbc"), "title" : "stoneB", "content" : "ttB" }
{ "_id" : ObjectId("5992c4310184ff511bf02bbb"), "title" : "stoneA", "content" : "ttA" }
範例:查詢同時包含有“ttC”和“ttD”
> db.news.find({"$text":{"$search":"\"ttC\" \"ttD\""}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE" }
{ "_id" : ObjectId("5992c61d0184ff511bf02bc2"), "title" : "stoneD", "content" : "ttC ttD ttF" }
範例:查詢包含有“ttE”但是不包含“ttF”
> db.news.find({"$text":{"$search":"ttE -ttF"}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE" }
但是在進行全文檢索操作的時候還可以使用相似度的打分來判斷檢索結果。
範例:為查詢結果打分
> db.news.find({"$text":{"$search":"ttC ttD ttE"}},{"score":{"$meta":"textScore"}}).sort({"score":{"$meta":"textScore"}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE", "score" : 2 }
{ "_id" : ObjectId("5992c61d0184ff511bf02bc2"), "title" : "stoneD", "content" : "ttC ttD ttF", "score" : 1.3333333333333333 }
按照打分的成績進行排列,實際上就可以實現更加準確的資訊搜尋。
如果一個集合的欄位太多了,那麼每一個欄位都分別設定全文索引比較麻煩,簡單一些,可以為所有欄位設定全文索引。
範例:為所有欄位設定全文索引
> db.news.dropIndexes()
{
"nIndexesWas" : 2,
"msg" : "non-_id indexes dropped for collection",
"ok" : 1
}
> db.news.createIndex({"$**":"text"});
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
這是一種最簡單的設定全文索引的方式,但是儘可能別用,會慢。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28536251/viewspace-2144104/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- oracle全文索引之STORAGE PREFERENCEOracle索引
- oracle全文索引之WORDLIST PREFERENCEOracle索引
- oracle全文索引之STOPLIST_ CTXCAT 索引_INDEX SETOracle索引Index
- MongoDB之索引(地理資訊索引)MongoDB索引
- MongoDB之索引(過期索引)MongoDB索引
- MongoDB之索引(唯一索引)MongoDB索引
- MySQL索引系列:全文索引MySql索引
- Oracle:全文索引Oracle索引
- oracle全文索引之同步和優化索引做了什麼Oracle索引優化
- oracle全文索引之幾個關鍵表Oracle索引
- oracle全文索引之commit與DML操作Oracle索引MIT
- oracle全文索引之如何實現查詢Oracle索引
- oracle全文索引之STOPLIST_4_MULTI_STOPLISTOracle索引
- oracle全文索引之STOPLIST_3_DEFAULT_STOPLISTOracle索引
- oracle全文索引之STOPLIST_2_EMPTY_STOPLISTOracle索引
- oracle全文索引之STOPLIST_1_BASIC_STOPLISTOracle索引
- oracle全文索引之LEXER_4_MULTI_LEXEROracle索引
- oracle全文索引之LEXER_3_DEFAULT_LEXEROracle索引
- oracle全文索引之LEXER_2_CHINESE_LEXEROracle索引
- oracle全文索引之LEXER_1_BASIC_LEXEROracle索引
- oracle全文索引之FILTER_4_PROCEDURE_FILTEROracle索引Filter
- oracle全文索引之FILTER_3_FORMAT_COLUMNOracle索引FilterORM
- oracle全文索引之FILTER_1_NULL_FILTEROracle索引FilterNull
- oracle全文索引之datastore_6_NESTED_DATASTOREOracle索引AST
- oracle全文索引之datastore_5_detail_datastoreOracle索引ASTAI
- oracle全文索引之datastore_4_URL_DATASTOREOracle索引AST
- oracle全文索引之datastore_3_FILE_DATASTOREOracle索引AST
- oracle全文索引之datastore_1_DIRECT_DATASTOREOracle索引AST
- MongoDB之索引(簡介)MongoDB索引
- Oracle的全文索引Oracle索引
- ZT oracle全文索引Oracle索引
- SqlServer 建立全文索引SQLServer索引
- oracle全文索引之配置全文檢索環境Oracle索引
- oracle 之全文索引表的分割槽交換案例Oracle索引
- oracle全文索引之About_INDEX_THEMES操作Oracle索引Index
- oracle全文索引之datastore_2_MULTI_COLUMN_DATASTOREOracle索引AST
- MySQL全文索引的使用MySql索引
- oracle 全文索引的配置Oracle索引