Java 位域

千江月09發表於2019-07-03

Java位域


這個概念是在 Effective Java中瞭解到的, 可以通過EnumSet來代替位域這種方式表達.

並不是很常見的概念, 因此記錄下.

如果在這之前恰好了解過 bitmap這種資料結構就更好了。

不瞭解也沒有關係。

bitmap 就是用bit的每一位來代表一個特殊的狀態值, 或者說標籤屬性等等.

舉例來說, 8位的數值, 用 0000 0001 代表 北, 0000 0010 代表南, 0000 0100 代表西 依次類推.

那麼當我們拿到一串bit, 如:

0100 0000 自然可以去對應的對映關係表中查詢到 究竟是屬於哪一種型別, 如果我們想同時傳遞兩個數值呢?

只需要 0000 0011 這樣就可以表示 北 南 兩個方向了, 當然 至多可以表示 8個方向.

我們來試試這種表示方式:

public class Direction {

    public static final short NORTH = 1;

    public static final short SOUTH = 1 << 2;

    public static final short WEST = 1 << 3;

    public static final short EAST = 1 << 4;

    public static final short SOUTH_EAST = 1 << 8;
}

在這裡我只是簡略的定義了其中5中.

那麼可能會有一個問題, 既然使用 short來表示, 為什麼不用 1 2 3 ... 8 來表示資料呢? 這樣我們甚至都不需要2 的 8次方, 只需要 3位就能夠表示所有資料了.

但是不妨讓我們再來想一想, 在使用 1 ~ 8 的方式中如何同時傳入多種狀態呢?

在這裡是不是必須使用 一個 short[] 去接收資料?

那麼用位有什麼好處呢?

void array(NORTH | SOUTH | SOUTH_EAST)

在方法的呼叫上 可以採用這種直觀易懂且計算速度快的方式, 而在傳入值 不難發現 最終只有一個值:

1000 0011

這一個數值即表示了包含了相應的三種狀態.

而這就是 java中 位域的使用方式.

那麼進一步來看, 當我們不再滿足 8位 甚至需要更多種狀態值的時候 可以切換到 int long 甚至於 bitmap. 接收無限位。

但僅僅是位域這種表示 我們僅僅支援 64種以下的狀態型別, 因為 java種最長的基本型別 也就只有64位了。

那麼繼續來看看這種位域有什麼缺陷呢?

使用int 型別 或 long型別, 沒有辦法加入一些自定義的東西, 通常情況下 在這種地方使用列舉是更好地選擇。

否則的話所有的地方依然要使用 switch判斷的方式, 另外由於 int定義為 static final 時 本身就是編譯時常量,

如果有人依賴他, 將來即使這裡的數值更新了, 比如刪掉兩三個, 即使不重新編譯, 對方的class檔案依然不會出錯。 但事實上, 出錯是一種必然。

就上面的例子來說, 我們想要返回所有的String 該怎麼辦?

必然是 switch case return "南" 類似的方式.

那麼切換成列舉型別呢?

public enum EnumDirection {

    NORTH("north"), EAST("east"), SOUTH("south"), WEST("south");

    private final String name;

    private EnumDirection(String name) {
        this.name = name;
    }

    public String getName() {
        return this.name;
    }
}

列舉型別的好處,不再贅述。

那與今天的主題, 位域有什麼關係呢?

我們知道,位域的優點 佔用記憶體小, 表示方便, 傳遞值方便, 效能高.

EnumSet, 讓我抄一段描述:

這個類實現Set介面,提供了豐富的功能,型別安全性,以及可以從任何其他Set實現中得到的互用性。但是在內部具體的實現上,每個EnumSet內容都表示為位向量。如果底層的列舉型別有64個或者更少的元素——大多數如此。整個EnumSet就用單個long來表示,因此它的效能比的上位域的效能。批處理,如removeAll和retainAll,都是利用位演算法來實現的。就像手工替代位域實現得那樣。

是的, 是位運算.

就看一段程式碼:

public boolean contains(Object e) {
    if (e == null)
        return false;
    Class<?> eClass = e.getClass();
    if (eClass != elementType && eClass.getSuperclass() != elementType)
        return false;

    return (elements & (1L << ((Enum<?>)e).ordinal())) != 0;
}

我們關注到最後一行, 如上述EnumDirection, WEST 的 ordinal() 即是4, 也就意味著 它值在這裡被理解為 1 << 4

而通過 elements 傳入enumSet 的集合, 如:

EnumSet<EnumDirection> enumSet = EnumSet.of(EnumDirection.EAST, EnumDirection.NORTH);

不難獲知 enumSet 的 elements值為 0000 0011 當然 這裡是 long型別, 我只寫了最後8位, 而

0000 0011 & 0000 1000 必然是等於 0的 因此 contains 返回false.

這是極其高效的方式. 而目的也正在於解決 int型 位域的種種弊端.

相關文章