老師,你確定Java註釋不會被執行嗎?

千鋒Python唐小強發表於2020-05-06

之前分享過一篇文章,涉及到 Java 中的註釋,就信誓旦旦地寫了一句話:“註釋是不會被執行的!”結果,有小夥伴留言說,“老師,你確定嗎?”

我這個人一直有個優點,就是能聽得進去別人的聲音,管你是讚美的還是批評的,從來都是虛心接受。因為我相信,大多數小夥伴都是出於善的目的。

況且,我在技術上從來沒想過要成為多牛逼的大佬,就是喜歡分享的感覺,而已。很多文章中出現的錯誤,我都原封不動的保留,因為如果把修正了,那麼留言中那些指出錯誤的人,在後來的讀者眼裡,就會覺得不合時宜。

那些  diss 我的小夥伴們,放心,我是不會 介意的。

儘管如此,但對於註釋這件事,真的是不能忍啊!註釋肯定不會被執行啊,我想這位小夥伴一定是在諷刺我。於是我就私信問他為什麼,然後他就甩給了我下面這段程式碼:

public class Test {

    public static void main(String[] args) {
        String name = "沉默王二";
        // \\u000dname="沉默王三";
        System.out.println(name);
    }
}

我複製到 IDEA 中跑了一下,結果程式輸出的結果出乎我的意料:

沉默王三

竟然是王三,不是王二。看到這個結果,我算是徹底懵逼了。

那一剎那,我感覺這十來年的 Java 算是白學了。大學那會,老師說註釋是不會執行的;就連《程式設計思想》裡也說註釋是不會執行的。那現在誰能告訴我這到底為什麼?

不是說程式的世界很單純嗎?不是 0 就是 1?事情搞到這個地步,只能花心思好好研究一下了。

單純從程式碼上來看,問題應該出在那串特殊的字元上——\\u000d,如果不是它在作怪,把 name 的值由“沉默王二”修改為了“沉默王三”,就沒有別的原因了——沒別的,憑藉多年的工作經驗,找問題的根源我還是很得心應手的。

\\u000d 雖然看上去比較陌生,但我知道它是一個 Unicode 字元。問了一下搜尋引擎後,知道它代表一個換行符——一種恍然大悟的感覺啊。我知道,Java 編譯器不僅會編譯程式碼,還會解析 Unicode 字元。

我大致看了一眼上面這段程式碼編譯後的位元組碼,它長下面這個樣子:

// class version 58.65535 (-65478)

// access flags 0x21
public class com/cmower/dzone/secret/Test {

  // compiled from: Test.java

  // access flags 0x1
  public <init>()V
   L0
    LINENUMBER 3 L0
    ALOAD 0
    INVOKESPECIAL java/lang/Object.<init> ()V
    RETURN
   L1
    LOCALVARIABLE this Lcom/cmower/dzone/secret/Test; L0 L1 0
    MAXSTACK = 1
    MAXLOCALS = 1

  // access flags 0x9
  public static main([Ljava/lang/String;)V
   L0
    LINENUMBER 5 L0
    LDC "\\u6c89\\u9ed8\\u738b\\u4e8c"
    ASTORE 1
   L1
    LINENUMBER 6 L1
    LDC "\\u6c89\\u9ed8\\u738b\\u4e09"
    ASTORE 1
   L2
    LINENUMBER 7 L2
    GETSTATIC java/lang/System.out : Ljava/io/PrintStream;
    ALOAD 1
    INVOKEVIRTUAL java/io/PrintStream.println (Ljava/lang/String;)V
   L3
    LINENUMBER 8 L3
    RETURN
   L4
    LOCALVARIABLE args [Ljava/lang/String; L0 L4 0
    LOCALVARIABLE name Ljava/lang/String; L1 L4 1
    MAXSTACK = 2
    MAXLOCALS = 2
}

嗯,表示看不懂。不過沒關係,把它反編譯一下就行了,於是我看到下面這段程式碼:

public class Test {

    public Test() {
    }

    public static void main(String[] args) {
        String name = "沉默王二";
        name = "沉默王三";
        System.out.println(name);
    }
}

咦,兩個反斜槓 // 真的不見了,這可以確定一點——註釋確實是不會執行的。只不過 \\u000d 把 name="沉默王三"; 擠到了 // 註釋的下一行,就好像下面這段程式碼的樣子:

public class Test {

    public static void main(String[] args) {
        String name = "沉默王二";
        //
        name="沉默王三";
        System.out.println(name);
    }
}

那這算不算是 Java 的 bug 呢?說算也不算。

因為透過允許 Java 原始碼包含 Unicode 字元,可以確保在世界上任何一個區域編寫的程式碼在其他地方執行。

老實說,這段話是我從網上找到,好像明白點啥,又好像不明白。那再來看一段程式碼:

double π = Math.PI;

System.out.println(\\u03C0);

假如說程式設計師小王在建立週期率這個變數的時候,不知道 π 這個字元怎麼敲出來,那麼他就可以選擇使用 \\u03C0 來替代——編譯器知道 \\u03C0 就是 π 這個變數(編譯器會在編譯其他程式碼之前先解析 Unicode 字元)。

只能說 \\u000d 是一種例外吧。

當然了,除非特殊情況,不要在原始碼中包含 Unicode 字元,以免更改原始碼的本意。

這篇文章沒有別的意思,我也不想探究過於深奧的東西,純粹是提高一下小夥伴們的認知:註釋有可能被編譯器執行。就好像,魯迅如果不知道茴香豆的“茴”字有 4 種寫法,那他就沒辦法讓孔乙己在魯鎮的那家茶館裡裝逼。

當然了,如果有小夥伴想體驗一下裝逼的感覺的話,可以把下面這段程式碼儲存在一個名叫 Ugly.java 的檔案中:

\\u0070\\u0075\\u0062\\u006c\\u0069\\u0063\\u0020\\u0020\\u0020\\u0020


\\u0063\\u006c\\u0061\\u0073\\u0073\\u0020\\u0055\\u0067\\u006c\\u0079

\\u007b\\u0070\\u0075\\u0062\\u006c\\u0069\\u0063\\u0020\\u0020\\u0020

\\u0020\\u0020\\u0020\\u0020\\u0073\\u0074\\u0061\\u0074\\u0069\\u0063

\\u0076\\u006f\\u0069\\u0064\\u0020\\u006d\\u0061\\u0069\\u006e\\u0028

\\u0053\\u0074\\u0072\\u0069\\u006e\\u0067\\u005b\\u005d\\u0020\\u0020

\\u0020\\u0020\\u0020\\u0020\\u0061\\u0072\\u0067\\u0073\\u0029\\u007b

\\u0053\\u0079\\u0073\\u0074\\u0065\\u006d\\u002e\\u006f\\u0075\\u0074

\\u002e\\u0070\\u0072\\u0069\\u006e\\u0074\\u006c\\u006e\\u0028\\u0020

\\u0022\\u0048\\u0065\\u006c\\u006c\\u006f\\u0020\\u0077\\u0022\\u002b

\\u0022\\u006f\\u0072\\u006c\\u0064\\u0022\\u0029\\u003b\\u007d\\u007d

在命令列中先執行 javac Ugly.java,再執行 java Ugly 命令就可以看到程式結果了:

Hello world

體驗過後,就拉到吧。反正寫這樣的程式碼誰也看不懂,除了機器。


老師,你確定Java註釋不會被執行嗎?


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69923331/viewspace-2690152/,如需轉載,請註明出處,否則將追究法律責任。

相關文章