判斷資料屬於多個類別的技巧薦

passover發表於2011-08-31

在自主開發的多個系統中都用到了分類演算法，每個資料都可能被分到幾個類別中，對於詳細的分值可以簡單的放在一個冗餘表，但是在原始資料表中還是要記錄每條資料所屬的類別。這就有幾個比較棘手的問題，一是對於類別的查詢，二是對於類別的新增。有以下幾個解決方法：

1）每個類別都記錄成一個欄位來標記是否屬於：這樣查詢的時候後面要跟where條件，如果是查詢多個類別就要帶幾個條件，查詢效率一般。但新增類別的時候就比較麻煩，既要修改資料庫欄位，又要修改程式。

2）把類別都記錄在一個欄位：這樣新增類別簡單了，但是查詢的時候就不太方便，如果每次值查詢一個類別，那麼用like還是可以接受，但如果同時查詢多個類別，那sql就要寫好幾個like，這個效率自然更不能接受。有個折衷的辦法，就是把這些類別按一定順序排放，這樣查詢的時候一個like還可以處理。

3）同樣類別還是記錄在一個欄位：這個還可以利用全文索引來查詢，這樣也可以對該欄位進行復合查詢，但是mysql自帶的fulltext索引只能用於myisam，如果用lucene或sphinx就需要額外配置，稍微麻煩點。

上面幾個方式我想了下感覺都不是很滿意，今天突然想到之前做的演算法題中有個常用的技巧，就是利用二機制來解決問題。對於類別是否屬於就是一個0或1的標誌，多個類別就記錄多位即可。這個問題就迎刃而解了。

假設目前分類有CBA三個類別，至於為什麼倒過來，後面會有說明。現在有四條資料，所屬類別分別為001, 010, 100, 101，最後一個資料是為了表示有的會被分到多個類別。

類別的查詢方法：既然轉換成二進位制，自然是考慮使用位運算，這裡以mysql的函式語法為例。假設要查詢A類的資料，那麼條件為categories & b`001`，這樣資料1和資料4就會匹配上。查詢屬於多個類別的也很簡單，查詢屬於A或B類，條件為categories & b`011`。查詢A且B類，條件為categories & b`011` = b`011`。

類別的新增方法：由於位運算的低位始終在後面，所以新新增的類別就要加到高位上，比如增加D類別，原資料分類就相當與預設都沒分到D類中，原始資料也不用做任何修改。

這個方法對於類別是否屬於的判斷非常高效，計算機只要做一次運算就能拿到結果，但mysql對於位數也是有限制，64位系統下最多隻能有64位長度，使用時注意一下。將十進位制轉換成二進位制形式可以使用函式bin(n)。

JS資料型別分類和判斷
2018-06-21
JS資料型別
多個陣列，判斷從屬關係
2021-08-15
陣列
js資料型別的判斷
2018-10-15
JS資料型別
判斷值的資料型別
2018-05-07
資料型別
js判斷資料型別
2018-11-30
JS資料型別
JavaScript判斷資料型別
2019-04-04
JavaScript資料型別
JavaScript的資料型別如何判斷
2018-10-15
JavaScript資料型別
如何判斷JavaScript的資料型別？
2021-09-09
JavaScript資料型別
聊一下關於判斷資料型別
2018-07-14
資料型別
js資料型別及判斷
2019-04-28
JS資料型別
分享一個在js中判斷資料是undefined,NaN,null,的技巧
2018-06-25
JSUndefinedNaNNull
打造屬於自己的underscore系列 ( 二 ) - 資料型別診斷
2019-01-11
資料型別
javascript 判斷各種資料的型別
2019-03-05
JavaScript型別
前幾天為了精準判斷物件型別，封裝一個高大上的資料型別的判斷，裝個逼
2018-05-10
物件封裝資料型別
多個陣列，判斷鍵值是否存在從屬關係
2021-08-15
陣列
python3 判斷資料型別
2019-01-21
Python資料型別
判斷a是否是int型別資料
2022-02-28
型別
JS資料型別判斷的幾種方法
2020-07-04
JS資料型別
JavaScript資料型別判斷的四種方法
2021-02-19
JavaScript資料型別
C# 隨機給一個全部資訊都未知的類型別，如何獲取該類的類名、屬性個數、屬性名、屬性的資料型別、屬性值？
2022-05-07
C#隨機資料型別
PHP 資料型別之檢視和判斷資料型別
2019-06-15
PHP資料型別
JavaScript 資料型別與型別判斷詳解
2020-02-28
JavaScript資料型別
我所知道的JavaScript中判斷資料型別
2019-02-20
JavaScript資料型別
判斷js中的資料型別的幾種方法
2019-01-10
JS資料型別
使用帶型別判斷的比較判斷
2019-02-03
型別
nginx 多if判斷。
2021-01-04
Nginx
如何判斷一個類是從另一個類繼承
2020-04-05
繼承
前端基礎——js資料型別及判斷方法
2021-06-08
前端JS資料型別
記一次關於js陣列型別判斷及js型別判斷的細節探索
2019-03-02
JS陣列型別
評價判斷類
2024-08-01
python能判斷一個物件的型別嗎
2021-09-11
Python物件型別
jQuery中判斷input的disabled屬性
2018-10-22
jQuery
scala_繼承、型別判斷、抽象類、匿名內部類
2019-09-21
繼承型別抽象
js判斷物件裡面是否有某個屬性
2018-08-17
JS物件
Javascript判斷資料型別的五種方式及其特殊性
2020-10-15
JavaScript資料型別
一個小技巧助您減少if語句的狀態判斷
2020-12-22
c#中判斷類是否繼承於泛型基類
2022-04-13
C#繼承泛型
js判斷json中資料的真假
2019-02-16
JSON
如何判斷一個點在地圖上？如何判斷一個點在多邊形內？
2023-09-30
地圖

判斷資料屬於多個類別的技巧薦

相關文章