Java8 中用法優雅的 Stream 性能也"優雅"嗎？

2019 年 11 月 27 日
筆記

之前的文章中我們介紹了Java 8中Stream相關的API，我們提到Stream API可以極大提高Java程式設計師的生產力，讓程式設計師寫出高效率、乾淨、簡潔的程式碼。

那麼，Stream API的性能到底如何呢，程式碼整潔的背後是否意味著性能的損耗呢？本文我們對Stream API的性能一探究竟。

為保證測試結果真實可信，我們將JVM運行在-server模式下，測試數據在GB量級，測試機器採用常見的商用伺服器，配置如下：

OS	CentOS 6.7 x86_64
CPU	Intel Xeon X5675, 12M Cache 3.06 GHz, 6 Cores 12 Threads
記憶體	96GB
JDK	java version 1.8.0_91, Java HotSpot(TM) 64-Bit Server VM

測試方法與數據

性能測試並不是容易的事，Java性能測試更費勁，因為虛擬機對性能的影響很大，JVM對性能的影響有兩方面：

GC的影響。GC的行為是Java中很不好控制的一塊，為增加確定性，我們手動指定使用CMS收集器，並使用10GB固定大小的堆記憶體。具體到JVM參數就是-XX:+UseConcMarkSweepGC -Xms10G -Xmx10G
JIT(Just-In-Time)即時編譯技術。即時編譯技術會將熱點程式碼在JVM運行的過程中編譯成本地程式碼，測試時我們會先對程式預熱，觸發對測試函數的即時編譯。相關的JVM參數是-XX:CompileThreshold=10000。

Stream並行執行時用到ForkJoinPool.commonPool()得到的執行緒池，為控制並行度我們使用Linux的taskset命令指定JVM可用的核數。

測試數據由程式隨機生成。為防止一次測試帶來的抖動，測試4次求出平均時間作為運行時間。

基本類型迭代

測試內容：找出整型數組中的最小值。對比for循環外部迭代和Stream API內部迭代性能。

測試程式IntTest，測試結果如下圖：

圖中展示的是for循環外部迭代耗時為基準的時間比值。分析如下：

對於基本類型Stream串列迭代的性能開銷明顯高於外部迭代開銷（兩倍）；
Stream並行迭代的性能比串列迭代和外部迭代都好。

並行迭代性能跟可利用的核數有關，上圖中的並行迭代使用了全部12個核，為考察使用核數對性能的影響，我們專門測試了不同核數下的Stream並行迭代效果：

分析，對於基本類型：

使用Stream並行API在單核情況下性能很差，比Stream串列API的性能還差；
隨著使用核數的增加，Stream並行效果逐漸變好，比使用for循環外部迭代的性能還好。

以上兩個測試說明，對於基本類型的簡單迭代，Stream串列迭代性能更差，但多核情況下Stream迭代時性能較好。

對象迭代

接下來我們再來看對象的迭代效果。

測試內容：找出字元串列表中最小的元素（自然順序），對比for循環外部迭代和Stream API內部迭代性能。

測試程式StringTest，測試結果如下圖：

結果分析如下：

對於對象類型Stream串列迭代的性能開銷仍然高於外部迭代開銷（1.5倍），但差距沒有基本類型那麼大。
Stream並行迭代的性能比串列迭代和外部迭代都好。

再來單獨考察Stream並行迭代效果：

分析，對於對象類型：

使用Stream並行API在單核情況下性能比for循環外部迭代差；
隨著使用核數的增加，Stream並行效果逐漸變好，多核帶來的效果明顯。

以上兩個測試說明，對於對象類型的簡單迭代，Stream串列迭代性能更差，但多核情況下Stream迭代時性能較好。

複雜對象歸約

從實驗一、二的結果來看，Stream串列執行的效果都比外部迭代差（很多），是不是說明Stream真的不行了？先別下結論，我們再來考察一下更複雜的操作。

測試內容：給定訂單列表，統計每個用戶的總交易額。對比使用外部迭代手動實現和Stream API之間的性能。

我們將訂單簡化為<userName, price, timeStamp>構成的元組，並用Order對象來表示。測試程式ReductionTest，測試結果如下圖：

分析，對於複雜的歸約操作：

Stream API的性能普遍好於外部手動迭代，並行Stream效果更佳；

再來考察並行度對並行效果的影響，測試結果如下：

img

分析，對於複雜的歸約操作：

使用Stream並行歸約在單核情況下性能比串列歸約以及手動歸約都要差，簡單說就是最差的；
隨著使用核數的增加，Stream並行效果逐漸變好，多核帶來的效果明顯。

以上兩個實驗說明，對於複雜的歸約操作，Stream串列歸約效果好於手動歸約，在多核情況下，並行歸約效果更佳。我們有理由相信，對於其他複雜的操作，Stream API也能表現出相似的性能表現。

結論

上述三個實驗的結果可以總結如下：

對於簡單操作，比如最簡單的遍歷，Stream串列API性能明顯差於顯示迭代，但並行的Stream API能夠發揮多核特性。
對於複雜操作，Stream串列API性能可以和手動實現的效果匹敵，在並行執行時Stream API效果遠超手動實現。

所以，如果出於性能考慮，

對於簡單操作推薦使用外部迭代手動實現
對於複雜操作，推薦使用Stream API，
在多核情況下，推薦使用並行Stream API來發揮多核優勢 4.單核情況下不建議使用並行Stream API

如果出於程式碼簡潔性考慮，使用Stream API能夠寫出更短的程式碼。即使是從性能方面說，儘可能的使用Stream API也另外一個優勢，那就是只要Java Stream類庫做了升級優化，程式碼不用做任何修改就能享受到升級帶來的好處。

Java8 中用法優雅的 Stream 性能也"優雅"嗎？

測試方法與數據

基本類型迭代

對象迭代

複雜對象歸約

結論

VirMach 便宜 VPS

QNews

Java8 中用法優雅的 Stream 性能也"優雅"嗎？

測試方法與數據

基本類型迭代

對象迭代

複雜對象歸約

結論

分享此文：

Related Posts

(2019)[前端]面試題[4]：CSS盒模型你了解多少？

(五)Jira Api對接：修改任務狀態

e.printStackTrace() 會導致鎖死？這僅僅是列印，怎麼可能？

10大開源安全資訊和事件管理SIEM工具

VirMach 便宜 VPS

QNews

熱門搜尋