老師,你確定Java注釋不會被執行嗎?

之前在部落格上分享過一篇文章,涉及到 Java 中的注釋,就信誓旦旦地寫了一句話:「注釋是不會被執行的!」結果,有小夥伴留言說,「老師,你確定嗎?」

我這個人一直有個優點,就是能聽得進去別人的聲音,管你是讚美的還是批評的,從來都是虛心接受。因為我相信,大多數小夥伴都是出於善的目的。

況且,我在技術上從來沒想過要成為多牛逼的大佬,就是喜歡分享的感覺,而已。很多文章中出現的錯誤,我都原封不動的保留,因為如果把修正了,那麼留言中那些指出錯誤的人,在後來的讀者眼裡,就會覺得不合時宜。

那些 diss 我的小夥伴們,放心,我是不會介意的。

儘管如此,但對於注釋這件事,真的是不能忍啊!注釋肯定不會被執行啊,我想這位小夥伴一定是在諷刺我。於是我就私信問他為什麼,然後他就甩給了我下面這段程式碼:

public class Test {
    public static void main(String[] args) {
        String name = "沉默王二";
        // \u000dname="沉默王三";
        System.out.println(name);
    }
}

我拷貝到 IDEA 中跑了一下,結果程式輸出的結果出乎我的意料:

沉默王三

竟然是王三,不是王二。看到這個結果,我算是徹底懵逼了。

那一剎那,我感覺這十來年的 Java 算是白學了。大學那會,老師說注釋是不會執行的;就連《編程思想》里也說注釋是不會執行的。那現在誰能告訴我這到底為什麼?

不是說程式的世界很單純嗎?不是 0 就是 1?事情搞到這個地步,只能花心思好好研究一下了。

單純從程式碼上來看,問題應該出在那串特殊的字元上——\u000d,如果不是它在作怪,把 name 的值由「沉默王二」修改為了「沉默王三」,就沒有別的原因了——沒別的,憑藉多年的工作經驗,找問題的根源我還是很得心應手的。

\u000d 雖然看上去比較陌生,但我知道它是一個 Unicode 字元。問了一下搜索引擎後,知道它代表一個換行符——一種恍然大悟的感覺啊。我知道,Java 編譯器不僅會編譯程式碼,還會解析 Unicode 字元。

我大致看了一眼上面這段程式碼編譯後的位元組碼,它長下面這個樣子:

// class version 58.65535 (-65478)
// access flags 0x21
public class com/cmower/dzone/secret/Test {

  // compiled from: Test.java

  // access flags 0x1
  public <init>()V
   L0
    LINENUMBER 3 L0
    ALOAD 0
    INVOKESPECIAL java/lang/Object.<init> ()V
    RETURN
   L1
    LOCALVARIABLE this Lcom/cmower/dzone/secret/Test; L0 L1 0
    MAXSTACK = 1
    MAXLOCALS = 1

  // access flags 0x9
  public static main([Ljava/lang/String;)V
   L0
    LINENUMBER 5 L0
    LDC "\u6c89\u9ed8\u738b\u4e8c"
    ASTORE 1
   L1
    LINENUMBER 6 L1
    LDC "\u6c89\u9ed8\u738b\u4e09"
    ASTORE 1
   L2
    LINENUMBER 7 L2
    GETSTATIC java/lang/System.out : Ljava/io/PrintStream;
    ALOAD 1
    INVOKEVIRTUAL java/io/PrintStream.println (Ljava/lang/String;)V
   L3
    LINENUMBER 8 L3
    RETURN
   L4
    LOCALVARIABLE args [Ljava/lang/String; L0 L4 0
    LOCALVARIABLE name Ljava/lang/String; L1 L4 1
    MAXSTACK = 2
    MAXLOCALS = 2
}

嗯,表示看不懂。不過沒關係,把它反編譯一下就行了,於是我看到下面這段程式碼:

public class Test {
    public Test() {
    }

    public static void main(String[] args) {
        String name = "沉默王二";
        name = "沉默王三";
        System.out.println(name);
    }
}

咦,兩個反斜杠 // 真的不見了,這可以確定一點——注釋確實是不會執行的。只不過 \u000dname="沉默王三"; 擠到了 // 注釋的下一行,就好像下面這段程式碼的樣子:

public class Test {
    public static void main(String[] args) {
        String name = "沉默王二";
        //
        name="沉默王三";
        System.out.println(name);
    }
}

那這算不算是 Java 的 bug 呢?說算也不算。

因為通過允許 Java 源程式碼包含 Unicode 字元,可以確保在世界上任何一個區域編寫的程式碼在其他地方執行。

老實說,這段話是我從網上找到,好像明白點啥,又好像不明白。那再來看一段程式碼:

double π = Math.PI;
System.out.println(\u03C0);

假如說程式設計師小王在創建周期率這個變數的時候,不知道 π 這個字元怎麼敲出來,那麼他就可以選擇使用 \u03C0 來替代——編譯器知道 \u03C0 就是 π 這個變數(編譯器會在編譯其他程式碼之前先解析 Unicode 字元)。

只能說 \u000d 是一種例外吧。

當然了,除非特殊情況,不要在源程式碼中包含 Unicode 字元,以免更改源程式碼的本意。

這篇文章沒有別的意思,我也不想探究過於深奧的東西,純粹是提高一下小夥伴們的認知:注釋有可能被編譯器執行。就好像,魯迅如果不知道茴香豆的「茴」字有 4 種寫法,那他就沒辦法讓孔乙己在魯鎮的那家茶館裡裝逼。

當然了,如果有小夥伴想體驗一下裝逼的感覺的話,可以把下面這段程式碼保存在一個名叫 Ugly.java 的文件中:

\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020\u0020

\u0063\u006c\u0061\u0073\u0073\u0020\u0055\u0067\u006c\u0079

\u007b\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020

\u0020\u0020\u0020\u0020\u0073\u0074\u0061\u0074\u0069\u0063

\u0076\u006f\u0069\u0064\u0020\u006d\u0061\u0069\u006e\u0028

\u0053\u0074\u0072\u0069\u006e\u0067\u005b\u005d\u0020\u0020

\u0020\u0020\u0020\u0020\u0061\u0072\u0067\u0073\u0029\u007b

\u0053\u0079\u0073\u0074\u0065\u006d\u002e\u006f\u0075\u0074

\u002e\u0070\u0072\u0069\u006e\u0074\u006c\u006e\u0028\u0020

\u0022\u0048\u0065\u006c\u006c\u006f\u0020\u0077\u0022\u002b

\u0022\u006f\u0072\u006c\u0064\u0022\u0029\u003b\u007d\u007d

在命令行中先執行 javac Ugly.java,再執行 java Ugly 命令就可以看到程式結果了:

Hello world

體驗過後,就拉到吧。反正寫這樣的程式碼誰也看不懂,除了機器。好了,我親愛的讀者朋友,以上就是本文的全部內容了。是不是感覺認知邊界又拓寬了?

我是沉默王二,一枚有趣的程式設計師。如果覺得文章對你有點幫助,請微信搜索「 沉默王二 」第一時間閱讀,回復【666】更有我為你精心準備的 500G 高清教學影片(已分門別類)。

本文 GitHub 已經收錄,有大廠面試完整考點,歡迎 Star。

原創不易,莫要白票,請你為本文點個贊吧,這將是我寫作更多優質文章的最強動力。