推薦收藏 | 一份AutoML自動化調參的指南

2019 年 10 月 6 日
筆記

深度強化學習

來源：WANN論文，awesone-automl-paper

編輯：DeepRL

最近，谷歌大腦David Ha等人的論文《Weight Agnostic Neural Networks》佔據了學術各大頭條，引爆了機器學習圈。其「顛覆性」的理論讓人驚呼：「到頭來我們對神經網絡一無所知？」，但一些無知公眾各種寫着各種不需調參、不用學習的標題，真的是嘩眾取寵！Reddit 上有一些研究者認為該論文更有趣的意義在於，它也宣告了深度學習分層編碼特徵這一解釋壽終正寢。更多討論搜索Reddit論壇（地址見文章末尾）。本文為大家推薦一項包含了神經網絡搜索等技術的AutoML方法，它是解決自動化問題的根源方法。

Part 1

WANN技術

WANN的核心思想：

為了尋找具備強歸納偏置的神經網絡架構，研究者提出通過降低權重重要性的方式來搜索架構。具體步驟為：

1）為每一個網絡連接提供單一的共享權重參數；
2）在較大的權重參數值範圍內評估網絡。

該研究沒有採用優化固定網絡權重的方式，而是優化在大範圍權重值上都有良好性能的架構。研究者證明，該方法可生成使用隨機權重參數執行不同連續控制任務的網絡。使用 權重無關的神經網絡搜索創建編碼解的網絡架構與神經架構搜索（NAS）解決的問題有着本質上的區別。NAS 技術的目標是生成訓練完成後能夠超越人類手工設計的架構。從來沒有人聲稱該解是該網絡架構所固有的，而傳統使用的梯度下降法訓練的網絡結構是固定。

搜索權重無關的神經網絡WANN的流程如下：

創建最少神經網絡拓撲結構的初始群組；
在多個 rollout 上對每個網絡進行評估，每個 rollout 分配一個不同的共享權重值；
根據網絡的性能和複雜度對其進行排序；
通過改變排名最高的網絡拓撲結構創建新的群組，這些拓撲結構是通過錦標賽選擇法（tournament selection）根據概率選擇的。
接下來，算法從第二步開始重複，生成複雜度遞增的權重無關拓撲結構，其性能優於之前的幾代。

於是，搜索到的在BipedalWalker中表現最好的網絡結構如下圖所示：

本質上神經網絡的學習，就是搜索最優參數，只是參數的搜索可以利用到梯度信息進行輔助（網絡結構固定，其實是最優化一個多目標參數過程）。但該論文的計算量在於網絡結構，而結構的學習，由於懲罰值和結構之間缺乏梯度信息交互，所以大部分只能通過搜索來做，以下是論文的計算資源:96-core CPU

論文博客地址: https://weightagnostic.github.io/ 論文arxiv: https://arxiv.org/pdf/1906.04358.pdf

然而這種計算資源，普通的研究者都不能夠滿足,所以接下來介紹使用AutoML(包含了前面的網絡搜索技術)技術，以便幫助大家在方法上有新的創新。

Part 2

AutoML

傳統上，術語AutoML用於描述模型選擇和/或超參數優化的自動化方法。這些方法適用於許多類型的算法，例如隨機森林，梯度提升機器（gradient boosting machines），神經網絡等。AutoML領域包括開源AutoML庫，研討會，研究和比賽。初學者常常覺得他們在為模型測試不同的超參數時通常僅憑猜測，而將這部分過程的自動化可以使機器學習變得更加容易。即使是對經驗豐富的機器學習從業者而言，這一自動化過程也可以加快他們的速度，過程結構如下所示：

目前，業內現存有許多AutoML庫，其中最早出現的AutoWEKA，它於2013年首次發佈，可以自動選擇模型和超參數。其他值得注意的AutoML庫包括auto-sklearn（將AutoWEKA拓展到了python環境），H2O AutoML和TPOT。AutoML.org（以前被稱為ML4AAD，Machine Learning for AutomatedAlgorithm Design）小組，自2014年以來一直在ICML機器學習學術會議上組織AutoML研討會。

那麼AutoML包含了那些內容呢？下圖是一張思維導圖：

目前由很多公司已經開源了一部分庫（後續陸續更新），大致如下：

其中AutoML所做的內容包含了以下：

今天為大家推薦一本新書 《Automatic Machine Learning: Methods, Systems, Challenges》

該書由Frank Hutter, Lars Kotthoff, Joaquin Vanschoren撰寫，221頁的草稿版本已經放出，詳細講解了所有AutoML系統背後的基礎知識，以及對當前AutoML系統進行了深入描述，Auto-WEKA、Hyperopt-Sklearn、Auto-sklearn等，最後介紹了AutoML的挑戰。以下是書的目錄（網絡搜索見第3章）