PerfView專題 (第五篇):如何尋找 C# 託管記憶體泄漏

一:背景

前幾篇我們聊的都是 非託管記憶體泄漏,這一篇我們再看下如何用 PerfView 來排查 託管記憶體泄漏 ,其實 託管記憶體泄漏 比較好排查,尤其是用 WinDbg,畢竟C#是帶有豐富的元數據,不像C++下去就是二進位。

二:如何分析

PerfView 用的是權重佔比來尋找可疑的問題函數,為了方便講述,我們先上一段問題程式碼。


    internal class Program
    {
        static void Main(string[] args)
        {
            Task.Run(Alloc1);
            Task.Run(Alloc2);
            Task.Run(Alloc3);

            Console.ReadLine();
        }

        static void Alloc1()
        {
            var list = new List<string>();

            for (int i = 0; i < 200000; i++)
            {
                list.Add(string.Join(",", Enumerable.Range(0, 1000)));
            }

            Console.WriteLine("Alloc1 處理完畢");
        }

        static void Alloc2()
        {
            var list = new List<string>();

            for (int i = 0; i < 100; i++)
            {
                list.Add(string.Join(",", Enumerable.Range(0, 1000)));
            }

            Console.WriteLine("Alloc2 處理完畢");
        }

        static void Alloc3()
        {
            var list = new List<string>();

            for (int i = 0; i < 100; i++)
            {
                list.Add(string.Join(",", Enumerable.Range(0, 1000)));
            }

            Console.WriteLine("Alloc3 處理完畢");
        }
    }

這段程式碼運行完成後會發現記憶體佔用高達 1.5G,如下圖所示:

在真實場景中,你根本不知道是誰佔用了這麼大的記憶體,在分析武器庫中,用 WinDbg 肯定是最穩的,既然是介紹 PerfView 工具,得用它來分析。

二:PerfView 分析

1. 到底是哪裡的泄漏

分析之前,還是要先搞清楚到底是哪裡的泄漏,才好用 PerfView 追查下來,首先用 !eeheap -gc 查看下託管堆的佔用大小。


0:005> !eeheap -gc
Number of GC Heaps: 1
generation 0 starts at 0x0000000072D7AEC0
generation 1 starts at 0x0000000072B1B790
generation 2 starts at 0x0000000002841000
ephemeral segment allocation context: none
         segment             begin         allocated         committed    allocated size    committed size
0000000002840000  0000000002841000  000000001283FB10  0000000012840000  0xfffeb10(268430096)  0xffff000(268431360)
0000000023E80000  0000000023E81000  0000000033E7F0A8  0000000033E80000  0xfffe0a8(268427432)  0xffff000(268431360)
00000000347D0000  00000000347D1000  00000000447CFA98  00000000447D0000  0xfffea98(268429976)  0xffff000(268431360)
0000000045A60000  0000000045A61000  0000000055A5E2A0  0000000055A60000  0xfffd2a0(268423840)  0xffff000(268431360)
0000000055A60000  0000000055A61000  0000000065A5F7B8  0000000065A60000  0xfffe7b8(268429240)  0xffff000(268431360)
0000000065A60000  0000000065A61000  0000000073252ED8  00000000735F6000  0xd7f1ed8(226434776)  0xdb95000(230248448)
Large object heap starts at 0x0000000012841000
         segment             begin         allocated         committed    allocated size    committed size
0000000012840000  0000000012841000  0000000012C21130  0000000012C22000  0x3e0130(4063536)  0x3e1000(4067328)
Pinned object heap starts at 0x000000001A841000
000000001A840000  000000001A841000  000000001A845C38  000000001A852000  0x4c38(19512)  0x11000(69632)
Total Allocated Size:              Size: 0x5dbcdce8 (1572658408) bytes.
Total Committed Size:              Size: 0x5df71000 (1576472576) bytes.
------------------------------
GC Allocated Heap Size:    Size: 0x5dbcdce8 (1572658408) bytes.
GC Committed Heap Size:    Size: 0x5df71000 (1576472576) bytes.

從輸出中可以看到,當前的 託管堆 佔用 1.5G, 這就說明當前的泄漏確實是 託管堆 的泄漏,這就給繼續分析指明了方向。

2. 使用 .NET Alloc 攔截

在 PerfView 中有一個 .NET Alloc 選項,它可以攔截每一次對象分配,然後記錄下 執行緒調用棧,再根據分配量計算權重,知道原理後,接下來就可以開啟 .NET Alloc 攔截。

需要注意的是,對於這個選項,需要先開啟收集,再啟動程式,等程式執行完畢後,點擊 Stop Collection ,稍等片刻,會看到如下截圖。

點擊 GC Heap Net MEM (Coarse Sampling) Stack 列表,選擇我們的進程,會看到當前的 System.String 權重佔比最高,所以調查它的分配源就是當務之急了,截圖如下:

接下來雙擊 System.String 行,查看它的 Callers,逐一往下翻,終於找到了 Program.Alloc1() 方法,截圖如下:

到這裡就找到了問題函數 Alloc1() ,接下來就是探究源碼了哈。

3. 生產中可以用 .NET Alloc 嗎

現在大家都知道 .NET Alloc 可以實現對象分配攔截,但是在生產場景中,每秒的分配量可能達到幾十萬,上百萬,每一次分配都要攔截,會產生諸多的負面影響。

1) 程式速度變慢。

2) 產生非常大的 zip 文件。

如果你不在意的話,可以這麼使用,如果在意,建議用 .NET SampAlloc 選項,它是一種取樣的方式,每秒中的同類型分配最多只會取樣 100 次,所以在 性能zip文件 兩個維度可以達到最優狀態。

接下來勾選 .NET SampAlloc 項,其他操作步驟一致,截圖如下:

有點意思的是,觀察到的佔比都是 43.7% ,🐂哈!

Tags: