elasticsearch相關

张碧晨發表於2024-04-16

原文網址 : https://www.cnblogs.com/gstszbc/p/18137735

es,倒排索引

倒排索引的概念是基於MySQL這樣的正向索引而言的。

倒排索引中有兩個非常重要的概念：

- 文件（`Document`）：用來搜尋的資料，其中的每一條資料就是一個文件。例如一個網頁、一個商品資訊
- 詞條（`Term`）：對文件資料或使用者搜尋資料，利用某種演算法分詞，得到的具備含義的詞語就是詞條。例如：我是中國人，就可以分為：我、是、中國人、中國、國人這樣的幾個詞條

**建立倒排索引**是對正向索引的一種特殊處理，流程如下：

- 將每一個文件的資料利用演算法分詞，得到一個個詞條
- 建立表，每行資料包括詞條、詞條所在文件id、位置等資訊
- 因為詞條唯一性，可以給詞條建立索引，例如hash表結構索引

倒排索引的**搜尋流程**如下（以搜尋"華為手機"為例）：

1）使用者輸入條件`"華為手機"`進行搜尋。

2）對使用者輸入內容**分詞**，得到詞條：`華為`、`手機`。

3）拿著詞條在倒排索引中查詢，可以得到包含詞條的文件id：1、2、3。

4）拿著文件id到正向索引中查詢具體文件。

那麼為什麼一個叫做正向索引，一個叫做倒排索引呢？

- **正向索引**是最傳統的，根據id索引的方式。但根據詞條查詢時，必須先逐條獲取每個文件，然後判斷文件中是否包含所需要的詞條，是**根據文件找詞條的過程**。

- 而**倒排索引**則相反，是先找到使用者要搜尋的詞條，根據詞條得到保護詞條的文件的id，然後根據id獲取文件。是**根據詞條找文件的過程**。

**正向索引**：

- 優點：
- 可以給多個欄位建立索引
- 根據索引欄位搜尋、排序速度非常快
- 缺點：
- 根據非索引欄位，或者索引欄位中的部分詞條查詢時，只能全表掃描。

**倒排索引**：

- 優點：
- 根據詞條搜尋、模糊搜尋時，速度非常快
- 缺點：
- 只能給詞條建立索引，而不是欄位
- 無法根據欄位做排序

- Mysql：擅長事務型別操作，可以確保資料的安全和一致性

- Elasticsearch：擅長海量資料的搜尋、分析、計算

索引庫的CRUD

1.建立索引庫和對映

- 請求方式：PUT
- 請求路徑：/索引庫名，可以自定義
- 請求引數：mapping對映

案例：

PUT /heima
{
  "mappings": {
    "properties": {
      "info":{
        "type": "text",
        "analyzer": "ik_smart"
      },
      "email":{
        "type": "keyword",
        "index": false
      },
      "name":{
        "type": "keyword",
        "index": false
      }
    }
  }
}

2.查詢索引庫

- 請求方式：GET

- 請求路徑：/索引庫名

- 請求引數：無

案例

GET /heima

3.修改索引庫

倒排索引結構雖然不復雜，但是一旦資料結構改變（比如改變了分詞器），就需要重新建立倒排索引，這簡直是災難。因此索引庫**一旦建立，無法修改mapping**。

雖然無法修改mapping中已有的欄位，但是卻允許新增新的欄位到mapping中，因為不會對倒排索引產生影響。

PUT /heima/_mapping
{
  "properties":{
    "sex":{//新欄位名
      "type": "keyword",
        "index": false
    }
  }
}

4.刪除索引庫

- 請求方式：DELETE

- 請求路徑：/索引庫名

- 請求引數：無

DELETE /heima

文件操作

1.新增文件

POST /heima/_doc/1
{
  "name":"李白",
  "sex":"男",
  "email":"gs@163.com",
  "info":"java開發程式設計師"
}

elasticsearch相關2
2024-04-19
Elasticsearch
Elasticsearch——document相關原理
2019-02-17
Elasticsearch
Elasticsearch——search相關知識
2019-02-18
Elasticsearch
Elasticsearch叢集運維相關知識
2018-11-21
Elasticsearch運維
Elasticsearch 學習總結 - 相關配置補充說明
2019-04-10
Elasticsearch
linux 環境下 elasticsearch 及 python 相關庫的使用
2024-04-08
LinuxElasticsearchPython
elasticsearch學習筆記二：相關軟體安裝
2020-12-14
Elasticsearch筆記
Elasticsearch BM25相關度演算法超詳細解釋
2021-08-23
Elasticsearch演算法
Elasticsearch 父子關係
2020-12-01
Elasticsearch
ElasticSearch系列--父子關係
2020-12-31
Elasticsearch
PHP相關
2019-02-16
PHP
AndroidJNI相關
2018-07-10
Android
【Unity】相關
2024-03-07
Unity
PDN相關
2024-04-28
Linux相關
2024-03-27
Linux
Git相關
2024-03-10
Git
Cookie相關
2024-05-07
Cookie
硬碟相關
2024-03-31
硬碟
sql相關
2024-04-26
SQL
CentOS相關
2020-10-30
CentOS
swoole 相關
2019-06-15
npm 相關
2024-11-12
NPM
bean相關
2024-10-01
Bean
RFID相關
2024-08-31
spring 相關
2024-08-11
Spring
mysql 相關
2024-08-11
MySql
nginx相關
2024-09-09
Nginx
SLAM相關
2018-04-16
SLAM
FutureTask相關
2021-07-04
Docker相關
2020-12-03
Docker
MyBatis相關
2020-12-09
MyBatis
gitlab 相關
2021-03-04
Gitlab
統計學三大相關係數之Pearson相關係數、Spearman相關係數
2019-05-11
MySQL鎖相關
2019-04-15
MySql
springboot 相關注解
2018-08-24
Spring Boot
BGP相關命令
2024-04-08
Java Bean相關
2024-05-08
JavaBean
Spring配置相關
2024-05-01
Spring

elasticsearch相關

相關文章