Java9後String的空間優化

超人汪小建發表於2018-05-19

原文網址 : https://juejin.im/post/5aff7f10518825426e0233ea

前言

據我所知 Java 開發人員幾乎任何時候都會想到 String，字串確實已經成為最常用的類了，而且是大量使用。我們都知道，String 其實是封裝了字元，裡面必須由字元或位元組陣列來存放，從 Java9 開始 Java 語言開發者對 String 做了一些空間的優化。

從char到byte

JDK9 之前的庫的 String 類的實現使用了 char 陣列來存放字串，char 佔用16位，即兩位元組。

private final char value[];
複製程式碼

這種情況下，如果我們要儲存字元A，則為0x00 0x41，此時前面的一個位元組空間浪費了。但如果儲存中文字元則不存在浪費的情況，也就是說如果儲存 ISO-8859-1 編碼內的字元則浪費，之外的字元則不會浪費。

而 JDK9 後 String 類的實現使用了 byte 陣列存放字串，每個 byte 佔用8位，即1位元組。

private final byte[] value
複製程式碼

編碼

String 支援多種編碼，但如果不指定編碼的話，它可能使用兩種編碼，分別為 LATIN1 和 UTF16。LATIN1 可能比較陌生，其實就是 ISO-8859-1 編碼，屬於單位元組編碼。而 UTF16 為雙位元組編碼，它使用1個或2個16位長的空間儲存。

壓縮空間

壓縮的字元物件主要是在 ISO-8859-1 編碼內的字元，比如英語字母數字還有其他常見符號。為了更好理解我們看下圖，假如我們有一個“what”字串，那麼如果在 Java9 之前，它的儲存是按如下佇列排列的，可以看到每個字元都需要16位來儲存，而高位元組位都為0，這個其實就是浪費了。

而在 Java9 後，它的儲存的排列則很緊湊了，如下圖，只需四個位元組即可。

但如果是“哈a”，則佈局為下圖，所以如果字串中的字元一旦包含了不在 ISO-8859-1 編碼內的字元，則同樣還是統一使用16位長度來儲存。

Java9 的 String 預設是使用了上述緊湊的空間佈局的，看如下程式碼，預設將 COMPACT_STRINGS 設定為 true。而如果要取消緊湊的佈局可以通過配置 VM 引數-XX:-CompactStrings實現。

static final boolean COMPACT_STRINGS;
static {
    COMPACT_STRINGS = true;
}
複製程式碼

字串長度

因為改變了 String 的實現，使用了 UTF-16 或 LATIN-1 編碼，所以內部需要一個標識coder來表示使用了哪種編碼，LATIN1 值為0，UTF16 值為1。

private final byte coder;
static final byte LATIN1 = 0;
static final byte UTF16  = 1;
複製程式碼

而字串的長度也與編碼相關，計算時通過右移來實現。如果是 LATIN-1 編碼，則右移0位，陣列長度即為字串長度。而如果是 UTF16 編碼，則右移1位，陣列長度的二分之一為字串長度。

public int length() {
    return value.length >> coder();
}
複製程式碼

總結

字串物件是 Java 中大量使用的物件，而且我們會輕易大量使用它而從不考慮它的代價，所以對其的空間優化是有必要的，Java9 開始對這能幫助我們減少字串在堆中佔用的空間，而且還能減輕GC壓力。同時也能看到該空間優化對中文來說意義不大。

-------------推薦閱讀------------

我的2017文章彙總——機器學習篇

我的2017文章彙總——Java及中介軟體

跟我交流，向我提問：

公眾號的選單已分為“讀書總結”、“分散式”、“機器學習”、“深度學習”、“NLP”、“Java深度”、“Java併發核心”、“JDK原始碼”、“Tomcat核心”等，可能有一款適合你的胃口。

為什麼寫《Tomcat核心設計剖析》

歡迎關注：

String字串效能優化的探究
2020-10-28
字串優化
01揹包動態規劃空間優化
2019-02-12
動態規劃優化
MySQL空間最佳化（空間清理）
2024-08-30
MySql
原始碼|String拼接操作”+”的優化？
2019-03-04
原始碼優化
java9第5篇-Collection集合類的增強與優化
2020-10-18
Java優化
多重揹包動態規劃及空間優化
2019-02-12
動態規劃優化
Mac新手使用技巧——如何在Mac上優化儲存空間
2021-10-20
Mac優化
空間剪枝最佳化
2024-03-20
你覺得我的這段Java程式碼還有優化的空間嗎？
2021-12-15
Java優化
永久代和元空間的變化
2019-03-18
Java9系列第7篇：Java.util.Optional優化與增強
2020-10-20
Java優化
優化三維空間定位法及C語言快捷實現
2021-01-05
優化C語言
【Go】string 優化誤區及建議
2019-02-24
Go優化
你所不知道的Java效能優化之String！
2020-12-26
Java優化
劍指offer-Go版實現第五章：優化時間和空間效率
2022-01-09
Go優化
Centos8中安裝並配置VDO來優化儲存空間
2021-10-12
CentOS優化
python中的時間轉換,秒級時間戳轉string，string轉時間
2024-04-20
Python時間戳
時間和空間的完美統一！阿里雲時空資料庫正式商業化
2019-09-19
阿里資料庫
世界空間到觀察空間的矩陣
2024-10-14
矩陣
獨立IP的網站空間有什麼優勢？
2018-12-26
網站
李飛飛「空間智慧」之後，上交、智源、北大等提出空間大模型SpatialBot
2024-08-07
大模型
iOS效能優化 - APP啟動時間優化
2018-08-03
iOS優化APP
刪除檔案後儲存空間容量沒有變化怎麼辦？
2022-12-13
Geopandas——從“視覺化”到“字母化”的空間資料分析
2018-12-07
視覺化
16、表空間建立表空間
2020-12-03
當使用者無限制使用表空間配額且表空間有足夠空間時出現超出表空間的空間限額
2019-06-03
onethink上傳到空間之後，runtime資料夾將空間佔滿如何解決
2019-05-11
uni微信小程式優化，幾行程式碼就能省100kb的主包空間？
2022-02-02
微信小程式優化行程
[譯] 優化 Swift 的編譯時間
2019-02-16
優化Swift編譯
日常分享：關於時間複雜度和空間複雜度的一些優化心得分享(C#)
2021-01-23
時間複雜度優化C#
[20211011]跟蹤freespace空間的變化情況.txt
2021-10-11
Ora-01536：超出了表空間users的空間限量
2018-12-30
表空間利用率及表空間的補充
2021-01-14
KingbaseES的表空間
2022-03-30
MySQL 5.7的表刪除資料後的磁碟空間釋放
2020-06-28
MySql
Mysql InnoDB刪除資料後釋放磁碟空間的方法
2021-09-09
MySql
win10系統怎麼優化字型庫減少c盤空間佔用
2020-06-09
Win10優化
Json，String，Map之間的轉換
2020-09-28
JSON

Java9後String的空間優化

前言

從char到byte

編碼

壓縮空間

字串長度

總結

相關文章