編寫高質量程式碼:改善Java程式的151個建議(第4章:字串___建議52~55)

建議52：推薦使用String直接量賦值

　　一般物件都是通過new關鍵字生成的，但是String還有第二種生成方式，也就是我們經常使用的直接宣告方式，這種方式是極力推薦的，但不建議使用new String（"A"）的方式賦值。為什麼呢？我們看如下程式碼：

public class Client58 {
    public static void main(String[] args) {
        String str1 = "詹姆斯";
        String str2 = "詹姆斯";
        String str3 = new String("詹姆斯");
        String str4 = str3.intern();
        // 兩個直接量是否相等
        System.out.println(str1 == str2);
        // 直接量和物件是否相等
        System.out.println(str1 == str3);
        // 經過intern處理後的物件與直接量是否相等
        System.out.println(str1 == str4);
    }
}

　　注意看上面的程式，我們使用"=="判斷的是兩個物件的引用地址是否相同，也就是判斷是否為同一個物件，列印的結果是true,false,true。即有兩個直接量是同一個物件(進過intern處理後的String與直接量是同一個物件)，但直接通過new生成的物件卻與之不等，原因何在？

　　原因是Java為了避免在一個系統中大量產生String物件(為什麼會大量產生，因為String字串是程式中最經常使用的型別)，於是就設計了一個字串池(也叫作字串常量池，String pool或String Constant Pool或String Literal Pool),在字串池中容納的都是String字串物件，它的建立機制是這樣的：建立一個字串時，首先檢查池中是否有字面值相等的字串，如果有，則不再建立，直接返回池中該物件的引用，若沒有則建立之，然後放到池中，並返回新建物件的引用，這個池和我們平常說的池非常接近。對於此例子來說，就是建立第一個"詹姆斯"字串時，先檢查字串池中有沒有該物件，發現沒有，於是就建立了"詹姆斯"這個字串並放到池中，待建立str2字串時，由於池中已經有了該字串，於是就直接返回了該物件的引用，此時，str1和str2指向的是同一個地址，所以使用"=="來判斷那當然是相等的了。

　　那為什麼使用new String("詹姆斯")就不相等了呢？因為直接宣告一個String物件是不檢查字串池的，也不會把物件放到字串池中，那當然"=="為false了。

　　那為什麼intern方法處理後即又相等了呢？因為intern會檢查當前物件在物件池中是否存在字面值相同的引用物件，如果有則返回池中的物件，如果沒有則放置到物件池中，並返回當前物件。

　　可能有人要問了，放到池中，是不是要考慮垃圾回收問題呀？不用考慮了，雖然Java的每個物件都儲存在堆記憶體中但是字串非常特殊，它在編譯期已經決定了其存在JVM的常量池(Constant Pool),垃圾回收不會對它進行回收的。

　　通過上面的介紹，我們發現Java在字串的建立方面確實提供了非常好的機制，利用物件池不僅可以提高效率，同時減少了記憶體空間的佔用，建議大家在開發中使用直接量賦值方式，除非必要才建立一個String物件。

建議53：注意方法中傳遞的引數要求

　　有這樣的一個簡單需求，寫一個方法，實現從原始字串中刪除與之匹配的所有字串，比如在"好是好"中，刪除"好"，程式碼如下：

public class StringUtils {
    //刪除字串
    public static String remove(String source, String sub) {
        return source.replaceAll(sub, "");
    }
}

　　StringUtils工具類很簡單，它採用了String的replaceAll方法，該方法是做字串替換的，我們編寫一個測試用例，檢查remove方法是否正確，如下所示：

import static org.junit.Assert.*;
import org.junit.Test;
public class TestStringUtils {

    @Test
    public void test() {
        assertTrue(StringUtils.remove("好是好","好").equals("是"));
        assertTrue(StringUtils.remove("$是$","$").equals("是"));
    }
}

　　單獨執行第一個是綠條，單獨執行第二個是紅條，為什麼第二個（assertTrue(StringUtils.remove("$是$","$").equals("是"))）不通過呢？

　　問題就出在replaceAll方法上，該方法確實需要傳遞兩個String型別的引數，也確實進行了字串替換，但是它要求第一個引數是正規表示式，符合正規表示式的字串才會被替換。對上面的例子來說，第一個測試案例傳遞進來的是一個字串"好"，這是一個全匹配查詢替換，處理的非常正確，第二個測試案例傳遞進來的是一個"$"符號，"$"符號在正規表示式中表示的是字串的結束位置，也就是執行完replaceAll後在字串結尾的地方加上了空字串，其結果還是"$"是"$"，所以測試失敗也就再所難免了。問題清楚了，解決方案也就出來了：使用replace方法替換即可，它是replaceAll的方法的簡化版，可傳遞兩個String引數，與我們的編碼意圖是吻合的。

　　大家如果注意看JDK文件，會發現replace(CharSequence target,CharSequence replacement)方法是1.5版本以後才開始提供的，在此之前如果要對一個字串進行全體換，只能使用replaceAll方法，不過由於replaceAll方法的第二個引數使用了正規表示式，而且引數型別只要是CharSequence就可以(String的父類)，所以很容易使使用者誤解，稍有不慎就會導致嚴重的替換錯誤。

　　注意：replaceAll傳遞的第一個引數是正規表示式　　

建議54：正確使用String、StringBuffer、StringBuilder

　　CharSequence介面有三個實現類與字串有關，String、StringBuffer、StringBuilder，雖然它們都與字串有關，但其處理機制是不同的。

　　String類是不可變的量，也就是建立後就不能再修改了，比如建立了一個"abc"這樣的字串物件，那麼它在記憶體中永遠都會是"abc"這樣具有固定表面值的一個物件，不能被修改，即使想通過String提供的方法來嘗試修改，也是要麼建立一個新的字串物件，要麼返回自己，比如：

String  str = "abc";
String str1 = str.substring(1);

　　其中str是一個字串物件，其值是"abc",通過substring方法又重新生成了一個字串str1，它的值是"bc",也就是說str引用的物件一但產生就永遠不會變。為什麼上面還說有可能不建立物件而返回自己呢？那是因為採用substring(0)就不會建立物件。JVM從字串池中返回str的引用，也就是自身的引用。

　　StringBuffer是一個可變字串，它與String一樣，在記憶體中儲存的都是一個有序的字元序列(char 型別的陣列)，不同點是StringBuffer物件的值是可改變的，例如：

StringBuffer sb = new StringBuffer("a");
sb.append("b");

　　從上面的程式碼可以看出sb的值在改變，初始化的時候是"a" ，經過append方法後，其值變成了"ab"。可能有人會問了，這與String類通過 "+" 連線有什麼區別呢？例如

String s = "a";
s = s + "b";

　　有區別，字串變數s初始化時是 "a" 物件的引用，經過加號計算後，s變數就修改為了 “ab” 的引用，但是初始化的 “a” 物件還沒有改變，只是變數s指向了新的引用地址，再看看StringBuffer的物件，它的引用地址雖不變，但值在改變。

　　StringBuffer和StringBuilder基本相同，都是可變字元序列，不同點是：StringBuffer是執行緒安全的，StringBuilder是執行緒不安全的，翻翻兩者的原始碼，就會發現在StringBuffer的方法前都有關鍵字syschronized,這也是StringBuffer在效能上遠遠低於StringBuffer的原因。

　　在效能方面，由於String類的操作都是產生String的物件，而StringBuilder和StringBuffer只是一個字元陣列的再擴容而已，所以String類的操作要遠慢於StringBuffer 和 StringBuilder。

　　弄清楚了三者之間的原理，我們就可以在不同的場景下使用不同的字元序列了：

使用String類的場景：在字串不經常變化的場景中可以使用String類，例如常量的宣告、少量的變數運算等；
使用StringBuffer的場景：在頻繁進行字串的運算(如拼接、替換、刪除等)，並且執行在多執行緒的環境中，則可以考慮使用StringBuffer，例如XML解析、HTTP引數解析和封裝等；
使用StringBuilder的場景：在頻繁進行字串的運算(如拼接、替換、刪除等)，並且執行在單執行緒的環境中，則可以考慮使用StringBuilder，如SQL語句的拼接，JSON封裝等。

　　注意：在適當的場景選用字串型別

建議55：注意字串的位置

　　看下面一段程式：

public class Client55 {
    public static void main(String[] args) {
        String str1 = 1 + 2 + "apples";
        String str2 = "apples" + 1 + 2;
        System.out.println(str1);
        System.out.println(str2);
    }
}

　　想想兩個字串輸出的結果的蘋果數量是否一致，如果一致，會是幾呢？

　　答案是不一致，str1的值是"3apples" ,str2的值是“apples12”，這中間懸殊很大，只是把“apples” 調換了一下位置，為何會發生如此大的變化呢？

　　這都源於java對於加號的處理機制：在使用加號進行計算的表示式中，只要遇到String字串，則所有的資料都會轉換為String型別進行拼接，如果是原始資料，則直接拼接，如是是物件，則呼叫toString方法的返回值然後拼接，如：

　　str = str + new ArrayList();

　　上面就是呼叫ArrayList物件的toString方法返回值進行拼接的。再回到前面的問題上，對與str1 字串，Java的執行順序是從左到右，先執行1+2，也就是算術加法運算，結果等於3，然後再與字串進行拼接，結果就是 "3 apples",其它形式類似於如下計算：

　　String str1 = (1 + 2 ) + "apples" ;

　　而對於str2字串，由於第一個參與運算的是String型別，加1後的結果是“apples 1” ，這仍然是一個字串，然後再與2相加，結果還是一個字串，也就是“apples12”。這說明如果第一個引數是String，則後續的所有計算都會轉變為String型別，誰讓字串是老大呢！

　　注意：在“+” 表示式中，String字串具有最高優先順序。

編寫高質量程式碼:改善Java程式的151個建議(第4章:字串___建議52~55)

建議52：推薦使用String直接量賦值

建議53：注意方法中傳遞的引數要求

建議54：正確使用String、StringBuffer、StringBuilder

建議55：注意字串的位置

相關文章