【GAN優化】什麼是模式崩潰，以及如何從優化目標上解決這個問題

2019 年 10 月 8 日
筆記

今天講述的內容是GAN中的模式崩潰問題，之前的文章有提到這個問題，在接下來的兩三期內，將和大家一起討論有關模式崩潰的解決方法。

本期將會首先介紹什麼是模式崩潰，然後給出兩種通過修改GAN目標函數的解決方法，而下一期將從網路結構和mini-batch判別器的角度出發討論模式崩潰的解決方法。

本期不會涉及什麼數學知識，示意圖將會最大限度的說明本質問題，如有問題歡迎底部留言。

作者 | 小米粥

編輯 | 言有三

1. 模式崩潰（mode collapse）

GAN，屬於無監督生成模型中的一類。既然是生成模型，我們最起碼應該關注兩點：生成器生成樣本的品質和樣本多樣性。

根據數據的流形分布定律，自然界中同一類別的高維數據，往往集中在某個低維流形附近，所以生成器最理想的情況是：將輸入的雜訊都映射到訓練數據所在的流形上，並且與訓練數據的概率分布對應。舉一個簡單的例子，對於某一個訓練數據集，其中樣本的概率分布為一個簡單的一維高斯混合分布，包含兩個峰：

理想狀態下，生成器應該生成的樣本應該如下所示（綠色標記），生成樣本的位置幾乎都在兩個峰下，且分布符合訓練集的概率分布：

但是，上述情況在實際中是不可能出現的，我們實際中大多時候生成的樣本品質是比較差的，例如：

上圖裡生成器生成了一些品質比較差的樣本（標記為紅色），訓練集中本不包含紅色樣本，生成器應該著力生成綠色樣本而不應該產生紅色樣本，這屬於生成品質問題（比如使用貓的影像訓練GAN，最終GAN生成了一些狗？四不像？之類的照片）。而模式崩潰問題是針對於生成樣本的多樣性，即生成的樣本大量重複類似，例如下圖中，

生成的樣本全部聚集在左邊的峰下，這時雖然生成樣本的品質比較高，但是生成器完全沒有捕捉到右邊的峰的模式。（如果使用多種貓的影像訓練GAN，最終GAN只能產生逼真的英短，而無法產生其他品種）。

關於GAN模式崩潰問題的緩解方式有很多，我們接下來關注兩種修改目標函數的解決方案。

2. unrolled GAN

首先需要說明：其實，生成器在某一時刻單純地將樣本都聚集到某幾個高概率的峰下並不是我們討厭模式崩潰的根本原因，如果生成器能「及時發現問題」，自動調整權值，將生成樣本分散到整個訓練數據的流形上，則能自動跳出當前的模式崩潰狀態，並且理論上生成器確實「具備」該項能力（因為GoodFellow證明了GAN會實現最優解）。

但是實際情況是：對於生成器的不斷訓練並未使其學會提高生成樣本的多樣性，生成器只是在不斷將樣本從一個峰轉移聚集到另一個峰下。這樣的過程「沒完沒了」，無法跳出模式崩潰的循環。無論你在何時終止訓練，都面臨著模式崩潰，只是在不同時刻，生成樣本所聚集的峰不同罷了。

不過，這種情況的發生有一定的必然性，我們先使用原始形式GAN對這個過程進行示意描述，其目標函數為：