所謂的BitMap就是用一個bit位來標記某個元素所對應的value,而key即是該元素,由於BitMap使用了bit位來儲存資料,因此可以大大節省儲存空間。
1. 基本思想
首先用一個簡單的例子來詳細介紹BitMap演算法的原理。假設我們要對0-7內的5個元素(4,7,2,5,3)進行排序(這裡假設元素沒有重複)。我們可以使用BitMap演算法達到排序目的。要表示8個數,我們需要8個byte。
首先我們開闢一個位元組(8byte)的空間,將這些空間的所有的byte位都設定為0
然後便利這5個元素,第一個元素是4,因為下邊從0開始,因此我們把第五個位元組的值設定為1
然後再處理剩下的四個元素,最終8個位元組的狀態如下圖
- 現在我們遍歷一次bytes區域,把值為1的byte的位置輸出(2,3,4,5,7),這樣便達到了排序的目的
從上面的例子可以看出,BitMap演算法的思想還是比較簡單的,關鍵的問題是如何確定10進位制數到二進位制的轉換
MAP對映:
假設需要排序或則查詢的數的總數N=100000000,BitMap中1bit代表一個數字,1個int = 4Bytes = 4*8bit = 32 bit,那麼N個數需要N/32 int空間。所以我們需要申請記憶體空間的大小為int a[1 + N/32],其中:a[0]在記憶體中佔32為可以對應十進位制數0-31,依次類推:
a[0]-----------------------------> 0-31
a[1]------------------------------> 32-63
a[2]-------------------------------> 64-95
a[3]--------------------------------> 96-127
......................................................
那麼十進位制數如何轉換為對應的bit位,下面介紹用位移將十進位制數轉換為對應的bit位:
1.求十進位制數在對應陣列a中的下標
十進位制數0-31,對應在陣列a[0]中,32-63對應在陣列a[1]中,64-95對應在陣列a[2]中………,使用數學歸納分析得出結論:對於一個十進位制數n,其在陣列a中的下標為:a[n/32]
2.求出十進位制數在對應數a[i]中的下標
例如十進位制數1在a[0]的下標為1,十進位制數31在a[0]中下標為31,十進位制數32在a[1]中下標為0。 在十進位制0-31就對應0-31,而32-63則對應也是0-31,即給定一個數n可以通過模32求得在對應陣列a[i]中的下標。
3.位移
對於一個十進位制數n,對應在陣列a[n/32][n%32]中,但陣列a畢竟不是一個二維陣列,我們通過移位操作實現置1
a[n/32] |= 1 << n % 32
移位操作:
a[n>>5] |= 1 << (n & 0x1F)
n & 0x1F 保留n的後五位 相當於 n % 32 求十進位制數在陣列a[i]中的下標
2.程式碼實現
public class BitMap {
private static final int N = 10000000;
private int[] a = new int[N/32 + 1];
/**
* 設定所在的bit位為1
* @param n
*/
public void addValue(int n){
//row = n / 32 求十進位制數在陣列a中的下標
int row = n >> 5;
//相當於 n % 32 求十進位制數在陣列a[i]中的下標
a[row] |= 1 << (n & 0x1F);
}
// 判斷所在的bit為是否為0
public boolean exits(int n){
int row = n >> 5;
return (a[row] & ( 1 << (n & 0x1F))) != 0;
}
public void display(int row){
System.out.println("BitMap點陣圖展示");
for(int i=0;i<row;i++){
List<Integer> list = new ArrayList<Integer>();
int temp = a[i];
for(int j=0;j<32;j++){
list.add(temp & 1);
temp >>= 1;
}
System.out.println("a["+i+"]" + list);
}
}
public static void main(String[] args){
//int num[] = {1,5,30,32,64,56,159,120,21,17,35,45};
int num[] = {4,7}
BitMap map = new BitMap();
for(int i=0;i<num.length;i++){
map.addValue(num[i]);
}
int temp = 4;
if(map.exits(temp)){
System.out.println("value:[" + temp + "] has already exists");
}
map.display(3);
}
}
執行結果:
value:[4] has already exists
BitMap點陣圖展示
a[0][0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
a[1][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
a[2][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
解析程式碼:
如果將 0,1,2 ,3 這些10進位制位的數字 分別 通過 & 0X1F (相當於取模32) 通過移位 << N
其實就是 將其 變為 :
0 ---> 0001 即2的0次方 1
1 ---> 0010 即2的1次方 2
2 ---> 0100 即2的2次方 4
再然後 | 運算 由於 都是通過直接左移 得出(不會有重合的值 )
此時的 | 運算 可以理解為相加 那麼 如果 a[row] |= 1 << (n & 0x1F) 得出結果為 7
那麼肯定是由 0111 構成,那麼 不管是 0001 (1) 、 0010 (2)、0100(4) 與 0111 & 運算
其結果肯定有相同位置 同1 也就是一定不為0
應用範圍: 可以運用在快速查詢、去重、排序、壓縮資料等。