Java 字串比較、拼接問題

Johnson1z發表於2020-07-11

@


/——————————————————字串型別—————————————————/
Java中用於處理字串常用的有三個類:

1、java.lang.String

2、java.lang.StringBuffer

3、java.lang.StrungBuilder

相同點: 都是final類, 不允許被繼承;

不同點:

  • StringBuffered/StringBuilder 都繼承自抽象類AbstractStringBuilder
    (實現了Appendable, CharSequence介面),可以通過append()、indert()進行字串的操作
  • String實現了三個介面: Serializable、Comparable、CarSequence,
    String的例項可以通過compareTo方法進行比較
    StringBuilder/StringBuffer只實現了兩個介面Serializable、CharSequence
  • StringBuffer是執行緒安全的(Synchronized 加鎖),可以不需要額外的同步用於多執行緒中
    StringBuilder不是執行緒安全的,但是效率比StringBuffer高

/—————————————本篇主要討論String型別————————————/

1.字串的比較

1. 1 字串常量池

字串常量池(以下簡稱常量池/字串池)的存在意義:實際開發中,String類是使用頻率非常高的一種引用物件型別。但是不斷地建立新的字串物件,會極大地消耗記憶體。因此,JVM為了提升效能和減少記憶體開銷,內建了一塊特殊的記憶體空間即常量池,以此來避免字串的重複建立。JDK 1.8 後,常量池被放入到堆空間中。

字串池中維護了共享的字串物件,這些字串不會被垃圾收集器回收。

1.2 String型別的比較方式

若直接使用“==”進行比較物件,則比較的是兩個物件的引用地址;

若使用str1.equals(str2)方法進行比較,由於String類內部已經覆蓋Object類中的equals()方法,實際比較的是兩個字串的值。

  • 比較原理:
    先判斷物件地址是否相等,若相等則直接返回true;
    若不相等再去引數判斷括號內傳入的引數是否為String型別的:若不是字串將最終返回false;若是字串,再依次比較所有字元是否一樣。
// 原始碼
public boolean equals(Object anObject) {
	if (this == anObject) {
    	return true;
    }
    if (anObject instanceof String) {
        String aString = (String)anObject;
        if (coder() == aString.coder()) {
        	return isLatin1() ? StringLatin1.equals(value, aString.value) : StringUTF16.equals(value, aString.value);
        }
     }
     return false;
}

1.3 String的建立方式

1.3.1 直接使用“=”進行賦值

String str_01 = "aa";
String str_02 = "aa";
System.out.println(str_01 == str_02);

使用這種方式建立字串,會先在棧中建立一個引用變數str_01,再去常量池中尋找是否已存在值為"aa"的字串:

  1. 如果不存在這樣的字串,則會在常量池中新建一個"aa"字串物件,並把這個字串物件的引用地址賦值給物件str_01;
  2. 如果常量池中尋找已存在這樣的字串,則不會再建立新的物件,直接返回已存在的物件地址,並將其賦值給物件str_02;
// result
true

1.3.2 使用“new”關鍵字建立新物件

String str_01 = new String("xyz");
String str_02 = new String("xyz");
System.out.println(str_01 == str_02);

這種方式至少會建立一個物件,因為本質是呼叫了String類的構造器方法public String(String original){...},在堆中一定會建立一個字串物件。

使用"new"關鍵字創造物件主要分為三步:

  1. 在堆中會建立一個字串物件;
  2. 判斷常量池是否存在與構造器引數中的字串值相等的常量;
  3. 如果常量池中已有這樣的字串存在,則直接返回堆中的字串物件引用地址,賦值給棧中的變數;如果不存在,會先建立一個字串物件在常量池中,然後返回堆中的物件引用地址,賦值給棧中的變數。
// result
false

1.3.3 intern()方法返回的引用地址

String str_01 = new String("abc").intern();
String str_02 = "abc";
String str_03 = new String("abc");
System.out.println(str_01 == str_02);
System.out.println(str_02 == str_03);

String str_04 = new String("cba");
String str_05 = new String("cba").intern();
System.out.println(str_04 == str_05);

當使用構造器建立字串呼叫 intern()方法時,如果常量池中已經存在一個值相同的字串(內部使用equals()方法來確定),則返回常量池中的字串物件的引用地址;否則,將堆中新建立的字串物件新增到常量池中,並返回池中字串物件的引用地址。

// result
true
false
false

2. 字串類的可變性與不可變性

字串的本質:char型別陣列 private final char[] str
String類實現了CharSequence介面

String型別的不可變性指的是記憶體地址不可變,如果將一個物件重新賦值,則本質上是改變了其引用物件。

String a = "hello";
System.out.println(a.hashCode());
a = "hey";
System.out.println(a.hashCode());
// result
99162322
103196

StringBuffer型別和StringBuilder型別的字串定義好後可以進行值改變,並且不會建立新的記憶體地址。

StringBuilder a = new StringBuilder();
System.out.println(a.hashCode());
a.append("Hello");
a.append("World");
System.out.println(a.hashCode());
// result
1395089624
1395089624

3. 字串的相加/拼接

3.1 字串與非字串型別的相加/拼接

String類中的valueOf(Object obj)方法可以將任意一個物件轉換為字串型別。

// 原始碼
public static String valueOf(Object obj) {
  return (obj == null) ? "null" : obj.toString();
}

String類中,過載了+與+=運算,這也是Java中唯一過載的兩個運算子。
兩個字串相加即是字串的拼接,在進行拼接時,會先呼叫valueOf(Object obj)方法將其為字串型別,再進行拼接。從原始碼可以看出,如果字串為null,會將其轉換為字面值為"null"的字串。

String s = null;
s = s + "World";
System.out.println("Hello " +s);
// result: Hello nullWorld

因此在進行字串拼接時,初始字串應該設定成空字串"",而非null。

3.2 兩個String型別物件相加/拼接原理

在字串間使用加法運算時:

  • 若是常量字串相加,如: "AB"+"CD",則是編譯優化。
    凡是單獨使用雙引號" "引用起來的內容直接拼接時,均會被編譯優化,編譯時就已經確定其值,即為拼接後的值。
  • 若是字串變數相加,如:
    String temp1 = "AB";
    String temp2 = "CD";
    String str = temp1 + temp2;
    則是在底層呼叫了StringBuilder類中的構造方法及append()方法來輔助完成:
    String str = new StringBuilder().append(temp1).append(temp2).toString();
		String str1 = "ABCD";
		String str2 = "AB" + "CD";
		String str3 = "A" + "B" + "C" + "D";
		String temp1 = "AB";
		String temp2 = "CD";
		String str4 = temp1 + temp2;
		// String str4 = new StringBuilder().append(temp1).append(temp2).toString();
		
		String temp = "AB";
		String str5 = temp + "CD";
		// String str4 = new StringBuilder(String.valueOf(temp)).append("CD").toString();
		
		System.out.println(str1 == str2);
		System.out.println(str1 == str3);
		System.out.println(str1 == str4);
		System.out.println(str1 == str5);
// result
true
true
false
false

4. final型別的String類字串

public class test {
	public static final String str1 = "abc";
	public static final String str2 = "def";
	public static void main(String[] args) {
		String str3 = str1 + str2;
		String str4 = "abcdef";
		System.out.println(str3 == str4);
	}
}

str1和str2都是final型別的,並且在編譯階段都是已經被賦值了,相當於一個常量,當執行Strings str3 = str1 + str2 的時候,str3已經是"abcdef"常量了,已被建立在常量池中,所以地址是相等的。

// result
true
public class test {
public static final String s1;
public static final String s2;
	static{
	s1 = "ab";
	s2 = "cd";
	}
	public static void main(String[] args) {
		String s3 = s1 + s2;
		String s4 = "abcd";
		System.out.println(s3 == s4); 
	}
}

雖然s1和s2都是final型別,但是起初並沒有初始化,在編譯期還不能確定具體的值,此處是變數,所以這裡會呼叫StringBuilder類中的構造方法及append()方法來建立新的字串s3,返回的新字串s3在堆中的地址,所以與s4不相等。

// result
false

參考內容:

  1. java-String常量池的知識點你知道多少?-結合jdk版本變更 by hz90s
  2. java中String、StringBuffer和StringBuilder的區別(簡單介紹) by 韋邦槓
  3. Java String:字串常量池(轉)by 暖暖-木木

If you have any question, please let me know, your words are always welcome.*
新人入坑,如有錯誤/不妥之處,歡迎指出,共同學習。

相關文章