之前在部落格上分享過一篇文章,涉及到 Java 中的註釋,就信誓旦旦地寫了一句話:“註釋是不會被執行的!”結果,有小夥伴留言說,“老師,你確定嗎?”
我這個人一直有個優點,就是能聽得進去別人的聲音,管你是讚美的還是批評的,從來都是虛心接受。因為我相信,大多數小夥伴都是出於善的目的。
況且,我在技術上從來沒想過要成為多牛逼的大佬,就是喜歡分享的感覺,而已。很多文章中出現的錯誤,我都原封不動的保留,因為如果把修正了,那麼留言中那些指出錯誤的人,在後來的讀者眼裡,就會覺得不合時宜。
那些 diss 我的小夥伴們,放心,我是不會介意的。
儘管如此,但對於註釋這件事,真的是不能忍啊!註釋肯定不會被執行啊,我想這位小夥伴一定是在諷刺我。於是我就私信問他為什麼,然後他就甩給了我下面這段程式碼:
public class Test {
public static void main(String[] args) {
String name = "沉默王二";
// \u000dname="沉默王三";
System.out.println(name);
}
}
我拷貝到 IDEA 中跑了一下,結果程式輸出的結果出乎我的意料:
沉默王三
竟然是王三,不是王二。看到這個結果,我算是徹底懵逼了。
那一剎那,我感覺這十來年的 Java 算是白學了。大學那會,老師說註釋是不會執行的;就連《程式設計思想》裡也說註釋是不會執行的。那現在誰能告訴我這到底為什麼?
不是說程式的世界很單純嗎?不是 0 就是 1?事情搞到這個地步,只能花心思好好研究一下了。
單純從程式碼上來看,問題應該出在那串特殊的字元上——\u000d
,如果不是它在作怪,把 name 的值由“沉默王二”修改為了“沉默王三”,就沒有別的原因了——沒別的,憑藉多年的工作經驗,找問題的根源我還是很得心應手的。
\u000d
雖然看上去比較陌生,但我知道它是一個 Unicode 字元。問了一下搜尋引擎後,知道它代表一個換行符——一種恍然大悟的感覺啊。我知道,Java 編譯器不僅會編譯程式碼,還會解析 Unicode 字元。
我大致看了一眼上面這段程式碼編譯後的位元組碼,它長下面這個樣子:
// class version 58.65535 (-65478)
// access flags 0x21
public class com/cmower/dzone/secret/Test {
// compiled from: Test.java
// access flags 0x1
public <init>()V
L0
LINENUMBER 3 L0
ALOAD 0
INVOKESPECIAL java/lang/Object.<init> ()V
RETURN
L1
LOCALVARIABLE this Lcom/cmower/dzone/secret/Test; L0 L1 0
MAXSTACK = 1
MAXLOCALS = 1
// access flags 0x9
public static main([Ljava/lang/String;)V
L0
LINENUMBER 5 L0
LDC "\u6c89\u9ed8\u738b\u4e8c"
ASTORE 1
L1
LINENUMBER 6 L1
LDC "\u6c89\u9ed8\u738b\u4e09"
ASTORE 1
L2
LINENUMBER 7 L2
GETSTATIC java/lang/System.out : Ljava/io/PrintStream;
ALOAD 1
INVOKEVIRTUAL java/io/PrintStream.println (Ljava/lang/String;)V
L3
LINENUMBER 8 L3
RETURN
L4
LOCALVARIABLE args [Ljava/lang/String; L0 L4 0
LOCALVARIABLE name Ljava/lang/String; L1 L4 1
MAXSTACK = 2
MAXLOCALS = 2
}
嗯,表示看不懂。不過沒關係,把它反編譯一下就行了,於是我看到下面這段程式碼:
public class Test {
public Test() {
}
public static void main(String[] args) {
String name = "沉默王二";
name = "沉默王三";
System.out.println(name);
}
}
咦,兩個反斜槓 //
真的不見了,這可以確定一點——註釋確實是不會執行的。只不過 \u000d
把 name="沉默王三";
擠到了 //
註釋的下一行,就好像下面這段程式碼的樣子:
public class Test {
public static void main(String[] args) {
String name = "沉默王二";
//
name="沉默王三";
System.out.println(name);
}
}
那這算不算是 Java 的 bug 呢?說算也不算。
因為通過允許 Java 原始碼包含 Unicode 字元,可以確保在世界上任何一個區域編寫的程式碼在其他地方執行。
老實說,這段話是我從網上找到,好像明白點啥,又好像不明白。那再來看一段程式碼:
double π = Math.PI;
System.out.println(\u03C0);
假如說程式設計師小王在建立週期率這個變數的時候,不知道 π
這個字元怎麼敲出來,那麼他就可以選擇使用 \u03C0
來替代——編譯器知道 \u03C0
就是 π
這個變數(編譯器會在編譯其他程式碼之前先解析 Unicode 字元)。
只能說 \u000d
是一種例外吧。
當然了,除非特殊情況,不要在原始碼中包含 Unicode 字元,以免更改原始碼的本意。
這篇文章沒有別的意思,我也不想探究過於深奧的東西,純粹是提高一下小夥伴們的認知:註釋有可能被編譯器執行。就好像,魯迅如果不知道茴香豆的“茴”字有 4 種寫法,那他就沒辦法讓孔乙己在魯鎮的那家茶館裡裝逼。
當然了,如果有小夥伴想體驗一下裝逼的感覺的話,可以把下面這段程式碼儲存在一個名叫 Ugly.java 的檔案中:
\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020\u0020
\u0063\u006c\u0061\u0073\u0073\u0020\u0055\u0067\u006c\u0079
\u007b\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020
\u0020\u0020\u0020\u0020\u0073\u0074\u0061\u0074\u0069\u0063
\u0076\u006f\u0069\u0064\u0020\u006d\u0061\u0069\u006e\u0028
\u0053\u0074\u0072\u0069\u006e\u0067\u005b\u005d\u0020\u0020
\u0020\u0020\u0020\u0020\u0061\u0072\u0067\u0073\u0029\u007b
\u0053\u0079\u0073\u0074\u0065\u006d\u002e\u006f\u0075\u0074
\u002e\u0070\u0072\u0069\u006e\u0074\u006c\u006e\u0028\u0020
\u0022\u0048\u0065\u006c\u006c\u006f\u0020\u0077\u0022\u002b
\u0022\u006f\u0072\u006c\u0064\u0022\u0029\u003b\u007d\u007d
在命令列中先執行 javac Ugly.java
,再執行 java Ugly
命令就可以看到程式結果了:
Hello world
體驗過後,就拉到吧。反正寫這樣的程式碼誰也看不懂,除了機器。好了,我親愛的讀者朋友,以上就是本文的全部內容了。是不是感覺認知邊界又拓寬了?
我是沉默王二,一枚有趣的程式設計師。如果覺得文章對你有點幫助,請微信搜尋「 沉默王二 」第一時間閱讀,回覆【666】更有我為你精心準備的 500G 高清教學視訊(已分門別類)。
本文 GitHub 已經收錄,有大廠面試完整考點,歡迎 Star。
原創不易,莫要白票,請你為本文點個贊吧,這將是我寫作更多優質文章的最強動力。