資料庫like匹配的實現猜測

王滔發表於2014-03-10

insert into test_fulltext values("王正科技全文")

select * from test_fulltext where data like "%王正%"

能夠搜尋到新插入的一行資料。

data欄位並不是全文索引欄位。

其實反而不要使用match against去搜尋，也就是不要使用全文搜尋，使用全文搜尋的話，會進入全文索引結構中去尋找資料。而剛好mysql對中文分詞支援存在問題。所以mysql全文索引中建立的詞典索引中不存在那個詞語，比如

select * from test_fulltext where MATCH(data) AGAINST('王正'IN BOOLEAN MODE )

提示此表不支援全文索引，也就是沒有建立成全文索引

讀者若有什麼更好的看法，歡迎討論

ALTER TABLE `test_fulltext`
ADD FULLTEXT INDEX `idx_data` (`data`) USING HASH ;

BTREE

上面都錯誤，正確sql為：

ALTER TABLE `test_fulltext` ADD FULLTEXT (
`data`
)

因為全文索引不存在使用btree還是hash方式進行索引。就是一個詞典，何來這種索引？

建立成全文索引後，使用

select * from test_fulltext WHERE MATCH(`data`) AGAINST('王正'IN BOOLEAN MODE)

搜尋不到

使用王正反而更加能夠搜到到。

結論：like這種搜尋，是全表掃描。是對欄位中出現的內容全部進行匹配。相等匹配。不是不可以，就是效率低下，當資料量大的情況下很慢

資料庫的實現思路可能為：逐個掃描所有行，然後拿到欄位的內容。比如拿到了此行data欄位的內容，然後把內容當成一個字串去裡面查詢是否有出現過的詞語

類似於 php的程式碼實現
if(strpos($data欄位內容,要查詢的字串))!==false)
{
找到了字串
}

like匹配是基於字串的匹配(%就是對應正則匹配，也是字串配對)，這樣的方式需要掃描表的所有行，拿到每行的內容進行字串匹配。其實我的理解是：最大瓶頸就是需要全表掃描。至於裡面的%正則匹配倒不是很大問題，這裡速度不會成為瓶頸，反而全表掃描耗費是時間比較長是一個大問題。

mysql 資料庫部署（google like?)
2011-08-15
MySql資料庫Go
MySQL 5.5 模式匹配LIKE
2016-06-02
MySql模式
EXCEl中LIKE的實現
2013-08-22
Excel
Elasticsearch實現Mysql的Like效果
2024-02-11
ElasticsearchMySql
通過sysbench工具實現MySQL資料庫的效能測試
2019-07-25
MySql資料庫
資料庫的最簡單實現
2014-07-04
資料庫
作為一名實施，需要自己反編譯、網路抓包、猜測資料庫，乾的全不像實施的活……
2016-09-22
編譯資料庫
資料庫工具類實現
2017-02-04
資料庫
實現MySQL資料庫的實時備份
2018-08-03
MySql資料庫
[python] 基於PyOD庫實現資料異常檢測
2024-10-01
Python
Redis 資料庫、鍵過期的實現
2019-03-03
Redis資料庫
Redis中單機資料庫的實現
2018-09-11
Redis資料庫
【JDBC的實現步驟……MySQL資料庫】
2020-12-07
JDBCMySql資料庫
TestContainers：現代資料庫的測試方法 -Gundu
2020-07-21
AI資料庫
Redis多機資料庫實現
2019-03-26
Redis資料庫
資料庫連線池實現
2024-09-29
資料庫
Redis 設計與實現（五）--多機資料庫的實現
2018-03-02
Redis資料庫
生產資料庫、開發資料庫、測試資料庫中的資料的區分
2021-01-03
資料庫
三體PCC大賽題目-facebook微博like場景資料庫設計與效能壓測
2017-05-12
資料庫
CAS配置資料庫，實現資料庫使用者認證
2020-11-23
資料庫
今日談：BoltDB資料庫，一款純Go實現的KV資料庫
2021-11-24
資料庫Go
資料泵實現資料遷移到異地庫
2013-01-08
老生常談：MYSQL模式匹配 REGEXP和like的用法
2017-10-23
MySql模式
資料庫應有與之匹配的基礎環境
2022-08-16
資料庫
java 實現excel中的資料匯入到資料庫的功能
2016-11-07
JavaExcel資料庫
資料庫連線池的實現及原理
2019-03-04
資料庫
資料庫分散式事務的實現原理！
2018-08-23
資料庫分散式
資料庫模型設計——關係的實現
2013-09-09
資料庫模型
常見資料庫的分頁實現方案
2012-06-21
資料庫
SQL Server資料庫的簡單實現方法
2010-02-24
SQLServer資料庫
用Asp實現對ORACLE資料庫的操作
2006-03-03
Oracle資料庫
rac環境下standby資料庫的實現
2007-01-17
資料庫
在Oracle中實現資料庫的複製
2007-05-21
Oracle資料庫
django中的資料庫連線池實現
2024-08-30
Django資料庫
Java實現資料庫和資料表的二級聯動
2015-12-15
Java資料庫
保護系統用資料庫加密實現資料的安全
2007-01-07
資料庫加密
資料庫實現原理#4（Hash Join）
2020-04-13
資料庫
Mybatis實現分包定義資料庫
2022-01-09
MyBatis資料庫

資料庫like匹配的實現猜測

相關文章