Java Grammer：數據類型

2019 年 10 月 3 日
筆記

Java的數據類型

我們知道，Java是一種強類型語言，類型對於Java語言來說非常的重要不言而喻，在Java中，分為基礎數據類型和引用數據類型，其中基礎數據類型分為了四類八種：

下面，我們來分別說一下這四類八種

整形

首先，需要說明一點，在Java的整形中不存在unsigned類型的數值，也就是說Java的整形都是有符號的可為正，可為負的整數

名稱	取值範圍	位元組數	位數	包裝類
byte	(-2^7) 到 (2^7-1)	1	8	Byte
short	(-2^{15}) 到 (2^{15}-1)	2	16	Short
int	(-2^{31}) 到 (2^{31}-1)	4	32	Integer
long	(-2^{63}) 到 (2^{63}-1)	8	64	Long

可以看出，取值範圍取決於該類型的位數，由於Java的代碼是運行在JVM中，所以該類型是獨立於機器之外存在的，與機器的關係並沒有很大，大大的提高了代碼的可移植性。

在書寫代碼的時候，我們需要注意，在我們定義一個long類型的變量時，一定要記得在代碼後加上大寫的L（小寫的l在某些字體下容易被認證1，給代碼的可讀性帶來影響）。

整形默認類型

我們的整數默認類型是int類型，在我們進行計算的時候，會默認按照int類型進行計算。

byte a = 127; //right    byte b = 1; //right    byte c = a + b; // wrong    byte d = 127 + 1; //wrong

編譯器報錯兩處，均是下面的這個錯誤信息：

HelloWorld.java:7: 錯誤: 不兼容的類型: 從int轉換到byte可能會有損失  byte c = a + b; // wrong             ^  HelloWorld.java:9: 錯誤: 不兼容的類型: 從int轉換到byte可能會有損失  byte d = 127 + 1; //wrong

這是一道很常見的面試題，其中錯誤的原因有兩點：

編譯器可以識別常量，但是無法識別變量，常量可以在編譯期間判斷是否超出範圍，但是兩個變量相加，編譯器在編譯期間無法得知，所以會報錯。
編譯器在編譯期將該值作為int類型進行預編譯計算後發現超出byte的取值範圍，但是又是通過一個byte類型的變量去接收，所以就會出現可能會損失精度的異常。

這裡很好的體現了整數類型的默認計算類型就是int類型~

浮點類型

浮點型有兩種，一種是32位的float類型（單精度），一種是64位的double類型（雙精度）。

名稱	取值範圍	位元組數	位數	包裝類
float	大約(-3.4E+38) 到 (+3.4E38)	8	32	Float
double	大約(-1.7E-308) 到 (1.7E308)	16	64	Double

因為double的取值範圍更廣，精度更高，所以我們日常都是使用double，默認的浮點類型也是double。

關於float和long

從上面我們可以知道float是32位的，而long是64位的，下意識的我們會認為64位的取值範圍必定要大於32位的，但事實並非如此：

float佔了4個位元組，也就是32位，其中第一位是符號位，23位是尾數位，剩下的8位都是指數位，(2^{8})為256，由於（signed）符號數的原因，也就是說，float的取值範圍大致位於(2^{-126})到({2^{127}})，是要遠遠的大於long的取值範圍的。

其實，這也詮釋了另外一個浮點數問題，因為計算機是二進制的，所以無法精確的表示出浮點數，但是Java也給我們了一種解決方案，那就是我們在涉及到浮點數比較敏感的地方（比如經緯度，金錢）的時候，一定要注意使用BigDecimal傳參為字符串的方式！

三個特殊的浮點數值：

正無窮大（Double.POSITIVE_INFINITY）

負無窮大（Double.NEGATIVE_INFINITY）

NAN（Double.NaN）

字符型

char關鍵字所修飾的類型是字符型，需要由單引號引起來，一個或兩個char類型的數值可以表示一個Unicode字符，我們所熟知的字符串底層數據結構正是一個字符數組常量：

    /** The value is used for character storage. */      private final char value[];

char類型其實是由u+十六進制數據的組成的，最大值為uffff(65535)，最小值為u0000(0)。

這裡需要注意一些特殊的轉義字符：

轉義序列	名稱	Unicode值
b	退格	u0008
t	製表	u0009
n	換行	u000a
r	回車	u000d
"	雙引號	u0022
‘	單引號	u0027
\	反斜杠	u005c

布爾型

boolean修飾的變量就是布爾型，布爾類型很簡單，只有true false兩個值，但是這裡需要注意，和C++不同的地方是它不能由數字0或1轉換成布爾型。

強制類型轉換

  byte a = 127; //right    byte b = 1; //right    byte c = a + b; // wrong    byte d = (byte)(a + b) // right    System.out.println(d);

還是這個熟悉的例子，剛剛我們已經分析了第三種情況為什麼會報錯，這裡我們可以通過強制類型轉換來強制完成這個操作。

強制類型轉換隻發生在位數較多的類型（int，64位）轉為位數較少（byte，8位）的類型。

果不其然，我們將第三句注釋掉之後，代碼可以正常編譯通過，然後我們去運行的時候，發現打印的d的值如下：

-128

這裡就說到了強制類型轉換會發生的一種情況，如果被轉換的數值超出目標類型的取值範圍，就會發生數據的丟失。

二進制在計算的時候，發生了超出數據範圍的進位操作，隨着強制類型轉換，進位的部分被咔嚓掉，然後就發生這種情況了（熟悉原反補的同學應該明白這一點）。

var

JDK 10中推出了一種新的類型var，猛地看起來很像javascript中的var，它可以這麼玩：

var list = new ArrayList<String>();  var x = 3;

乍一看，還真的和javascript有些像，但其實並不然，並不會影響Java是一個強類型語言的事實，它是基於局部變量推斷機制來完成的，編譯器在處理var時，先讀構造器，並將它作為變量的類型，然後將該類型寫入位元組碼當中。也就是說，該類型是無法更改的。

var a = 3;  a = [1,2,3];

這樣的寫法在javascript中毫無問題，但是在Java中就不行。但是需要注意，var只能作用於帶有構造器的局部變量和for循環中。

本篇重點總結

數據類型四類八種
float取值範圍要大於long
強制轉換隻發生在高位轉低位
var類型的原理是局部類型推斷

公眾號

原創文章，才疏學淺，如有不對之處，萬望告知！