編寫高質量程式碼:改善Java程式的151個建議(第4章:字串___建議52~55)

阿赫瓦里發表於2016-09-17

建議52:推薦使用String直接量賦值

  一般物件都是通過new關鍵字生成的,但是String還有第二種生成方式,也就是我們經常使用的直接宣告方式,這種方式是極力推薦的,但不建議使用new String("A")的方式賦值。為什麼呢?我們看如下程式碼:

public class Client58 {
    public static void main(String[] args) {
        String str1 = "詹姆斯";
        String str2 = "詹姆斯";
        String str3 = new String("詹姆斯");
        String str4 = str3.intern();
        // 兩個直接量是否相等
        System.out.println(str1 == str2);
        // 直接量和物件是否相等
        System.out.println(str1 == str3);
        // 經過intern處理後的物件與直接量是否相等
        System.out.println(str1 == str4);
    }
}

  注意看上面的程式,我們使用"=="判斷的是兩個物件的引用地址是否相同,也就是判斷是否為同一個物件,列印的結果是true,false,true。即有兩個直接量是同一個物件(進過intern處理後的String與直接量是同一個物件),但直接通過new生成的物件卻與之不等,原因何在?

  原因是Java為了避免在一個系統中大量產生String物件(為什麼會大量產生,因為String字串是程式中最經常使用的型別),於是就設計了一個字串池(也叫作字串常量池,String pool或String Constant Pool或String Literal Pool),在字串池中容納的都是String字串物件,它的建立機制是這樣的:建立一個字串時,首先檢查池中是否有字面值相等的字串,如果有,則不再建立,直接返回池中該物件的引用,若沒有則建立之,然後放到池中,並返回新建物件的引用,這個池和我們平常說的池非常接近。對於此例子來說,就是建立第一個"詹姆斯"字串時,先檢查字串池中有沒有該物件,發現沒有,於是就建立了"詹姆斯"這個字串並放到池中,待建立str2字串時,由於池中已經有了該字串,於是就直接返回了該物件的引用,此時,str1和str2指向的是同一個地址,所以使用"=="來判斷那當然是相等的了。

  那為什麼使用new String("詹姆斯")就不相等了呢?因為直接宣告一個String物件是不檢查字串池的,也不會把物件放到字串池中,那當然"=="為false了。

  那為什麼intern方法處理後即又相等了呢?因為intern會檢查當前物件在物件池中是否存在字面值相同的引用物件,如果有則返回池中的物件,如果沒有則放置到物件池中,並返回當前物件。

  可能有人要問了,放到池中,是不是要考慮垃圾回收問題呀?不用考慮了,雖然Java的每個物件都儲存在堆記憶體中但是字串非常特殊,它在編譯期已經決定了其存在JVM的常量池(Constant Pool),垃圾回收不會對它進行回收的。

  通過上面的介紹,我們發現Java在字串的建立方面確實提供了非常好的機制,利用物件池不僅可以提高效率,同時減少了記憶體空間的佔用,建議大家在開發中使用直接量賦值方式,除非必要才建立一個String物件。

建議53:注意方法中傳遞的引數要求

   有這樣的一個簡單需求,寫一個方法,實現從原始字串中刪除與之匹配的所有字串,比如在"好是好"中,刪除"好",程式碼如下:

public class StringUtils {
    //刪除字串
    public static String remove(String source, String sub) {
        return source.replaceAll(sub, "");
    }
}

  StringUtils工具類很簡單,它採用了String的replaceAll方法,該方法是做字串替換的,我們編寫一個測試用例,檢查remove方法是否正確,如下所示:

import static org.junit.Assert.*;
import org.junit.Test;
public class TestStringUtils {

    @Test
    public void test() {
        assertTrue(StringUtils.remove("好是好","好").equals("是"));
        assertTrue(StringUtils.remove("$是$","$").equals("是"));
    }
}

  單獨執行第一個是綠條,單獨執行第二個是紅條,為什麼第二個(assertTrue(StringUtils.remove("$是$","$").equals("是")))不通過呢?

  問題就出在replaceAll方法上,該方法確實需要傳遞兩個String型別的引數,也確實進行了字串替換,但是它要求第一個引數是正規表示式,符合正規表示式的字串才會被替換。對上面的例子來說,第一個測試案例傳遞進來的是一個字串"好",這是一個全匹配查詢替換,處理的非常正確,第二個測試案例傳遞進來的是一個"$"符號,"$"符號在正規表示式中表示的是字串的結束位置,也就是執行完replaceAll後在字串結尾的地方加上了空字串,其結果還是"$"是"$",所以測試失敗也就再所難免了。問題清楚了,解決方案也就出來了:使用replace方法替換即可,它是replaceAll的方法的簡化版,可傳遞兩個String引數,與我們的編碼意圖是吻合的。

  大家如果注意看JDK文件,會發現replace(CharSequence target,CharSequence replacement)方法是1.5版本以後才開始提供的, 在此之前如果要對一個字串進行全體換,只能使用replaceAll方法,不過由於replaceAll方法的第二個引數使用了正規表示式,而且引數型別只要是CharSequence就可以(String的父類),所以很容易使使用者誤解,稍有不慎就會導致嚴重的替換錯誤。

  注意:replaceAll傳遞的第一個引數是正規表示式  

建議54:正確使用String、StringBuffer、StringBuilder

   CharSequence介面有三個實現類與字串有關,String、StringBuffer、StringBuilder,雖然它們都與字串有關,但其處理機制是不同的。

  String類是不可變的量,也就是建立後就不能再修改了,比如建立了一個"abc"這樣的字串物件,那麼它在記憶體中永遠都會是"abc"這樣具有固定表面值的一個物件,不能被修改,即使想通過String提供的方法來嘗試修改,也是要麼建立一個新的字串物件,要麼返回自己,比如:

String  str = "abc";
String str1 = str.substring(1);

  其中str是一個字串物件,其值是"abc",通過substring方法又重新生成了一個字串str1,它的值是"bc",也就是說str引用的物件一但產生就永遠不會變。為什麼上面還說有可能不建立物件而返回自己呢?那是因為採用substring(0)就不會建立物件。JVM從字串池中返回str的引用,也就是自身的引用。

  StringBuffer是一個可變字串,它與String一樣,在記憶體中儲存的都是一個有序的字元序列(char 型別的陣列),不同點是StringBuffer物件的值是可改變的,例如:

StringBuffer sb = new StringBuffer("a");
sb.append("b");

  從上面的程式碼可以看出sb的值在改變,初始化的時候是"a" ,經過append方法後,其值變成了"ab"。可能有人會問了,這與String類通過 "+" 連線有什麼區別呢?例如

String s = "a";
s = s + "b";

  有區別,字串變數s初始化時是 "a" 物件的引用,經過加號計算後,s變數就修改為了 “ab” 的引用,但是初始化的 “a” 物件還沒有改變,只是變數s指向了新的引用地址,再看看StringBuffer的物件,它的引用地址雖不變,但值在改變。

  StringBuffer和StringBuilder基本相同,都是可變字元序列,不同點是:StringBuffer是執行緒安全的,StringBuilder是執行緒不安全的,翻翻兩者的原始碼,就會發現在StringBuffer的方法前都有關鍵字syschronized,這也是StringBuffer在效能上遠遠低於StringBuffer的原因。

  在效能方面,由於String類的操作都是產生String的物件,而StringBuilder和StringBuffer只是一個字元陣列的再擴容而已,所以String類的操作要遠慢於StringBuffer 和 StringBuilder。

  弄清楚了三者之間的原理,我們就可以在不同的場景下使用不同的字元序列了:

  1. 使用String類的場景:在字串不經常變化的場景中可以使用String類,例如常量的宣告、少量的變數運算等;
  2. 使用StringBuffer的場景:在頻繁進行字串的運算(如拼接、替換、刪除等),並且執行在多執行緒的環境中,則可以考慮使用StringBuffer,例如XML解析、HTTP引數解析和封裝等;
  3. 使用StringBuilder的場景:在頻繁進行字串的運算(如拼接、替換、刪除等),並且執行在單執行緒的環境中,則可以考慮使用StringBuilder,如SQL語句的拼接,JSON封裝等。

  注意:在適當的場景選用字串型別 

建議55:注意字串的位置

   看下面一段程式:

public class Client55 {
    public static void main(String[] args) {
        String str1 = 1 + 2 + "apples";
        String str2 = "apples" + 1 + 2;
        System.out.println(str1);
        System.out.println(str2);
    }
}

  想想兩個字串輸出的結果的蘋果數量是否一致,如果一致,會是幾呢?

  答案是不一致,str1的值是"3apples" ,str2的值是“apples12”,這中間懸殊很大,只是把“apples” 調換了一下位置,為何會發生如此大的變化呢?

  這都源於java對於加號的處理機制:在使用加號進行計算的表示式中,只要遇到String字串,則所有的資料都會轉換為String型別進行拼接,如果是原始資料,則直接拼接,如是是物件,則呼叫toString方法的返回值然後拼接,如:

  str =  str + new ArrayList();

  上面就是呼叫ArrayList物件的toString方法返回值進行拼接的。再回到前面的問題上,對與str1 字串,Java的執行順序是從左到右,先執行1+2,也就是算術加法運算,結果等於3,然後再與字串進行拼接,結果就是 "3 apples",其它形式類似於如下計算:

  String str1 = (1 + 2 ) + "apples" ;

  而對於str2字串,由於第一個參與運算的是String型別,加1後的結果是“apples 1” ,這仍然是一個字串,然後再與2相加,結果還是一個字串,也就是“apples12”。這說明如果第一個引數是String,則後續的所有計算都會轉變為String型別,誰讓字串是老大呢!

  注意: 在“+” 表示式中,String字串具有最高優先順序。

相關文章