推薦收藏 | 一份AutoML自動化調參的指南

  • 2019 年 10 月 6 日
  • 筆記

深度強化學習

來源:WANN論文,awesone-automl-paper

編輯:DeepRL

最近,谷歌大腦David Ha等人的論文《Weight Agnostic Neural Networks》佔據了學術各大頭條,引爆了機器學習圈。其「顛覆性」的理論讓人驚呼:「到頭來我們對神經網絡一無所知?」,但一些無知公眾各種寫着各種不需調參、不用學習的標題,真的是嘩眾取寵!Reddit 上有一些研究者認為該論文更有趣的意義在於,它也宣告了深度學習分層編碼特徵這一解釋壽終正寢。更多討論搜索Reddit論壇(地址見文章末尾)。本文為大家推薦一項包含了神經網絡搜索等技術的AutoML方法,它是解決自動化問題的根源方法。

Part 1

WANN技術

WANN的核心思想:

為了尋找具備強歸納偏置的神經網絡架構,研究者提出通過降低權重重要性的方式來搜索架構。具體步驟為:

  • 1)為每一個網絡連接提供單一的共享權重參數;
  • 2)在較大的權重參數值範圍內評估網絡。

該研究沒有採用優化固定網絡權重的方式,而是優化在大範圍權重值上都有良好性能的架構。研究者證明,該方法可生成使用隨機權重參數執行不同連續控制任務的網絡。使用 權重無關的神經網絡搜索創建編碼解的網絡架構與神經架構搜索(NAS)解決的問題有着本質上的區別。NAS 技術的目標是生成訓練完成後能夠超越人類手工設計的架構。從來沒有人聲稱該解是該網絡架構所固有的,而傳統使用的梯度下降法訓練的網絡結構是固定。

搜索權重無關的神經網絡WANN的流程如下:

  • 創建最少神經網絡拓撲結構的初始群組;
  • 在多個 rollout 上對每個網絡進行評估,每個 rollout 分配一個不同的共享權重值;
  • 根據網絡的性能和複雜度對其進行排序;
  • 通過改變排名最高的網絡拓撲結構創建新的群組,這些拓撲結構是通過錦標賽選擇法(tournament selection)根據概率選擇的。
  • 接下來,算法從第二步開始重複,生成複雜度遞增的權重無關拓撲結構,其性能優於之前的幾代。

於是,搜索到的在BipedalWalker中表現最好的網絡結構如下圖所示:

本質上神經網絡的學習,就是搜索最優參數,只是參數的搜索可以利用到梯度信息進行輔助(網絡結構固定,其實是最優化一個多目標參數過程)。但該論文的計算量在於網絡結構,而結構的學習,由於懲罰值和結構之間缺乏梯度信息交互,所以大部分只能通過搜索來做,以下是論文的計算資源:96-core CPU

論文博客地址: https://weightagnostic.github.io/ 論文arxiv: https://arxiv.org/pdf/1906.04358.pdf

然而這種計算資源,普通的研究者都不能夠滿足,所以接下來介紹使用AutoML(包含了前面的網絡搜索技術)技術,以便幫助大家在方法上有新的創新。

Part 2

AutoML

傳統上,術語AutoML用於描述模型選擇和/或超參數優化的自動化方法。這些方法適用於許多類型的算法,例如隨機森林,梯度提升機器(gradient boosting machines),神經網絡等。AutoML領域包括開源AutoML庫,研討會,研究和比賽。初學者常常覺得他們在為模型測試不同的超參數時通常僅憑猜測,而將這部分過程的自動化可以使機器學習變得更加容易。即使是對經驗豐富的機器學習從業者而言,這一自動化過程也可以加快他們的速度,過程結構如下所示:

目前,業內現存有許多AutoML庫,其中最早出現的AutoWEKA,它於2013年首次發佈,可以自動選擇模型和超參數。其他值得注意的AutoML庫包括auto-sklearn(將AutoWEKA拓展到了python環境),H2O AutoML和TPOT。AutoML.org(以前被稱為ML4AAD,Machine Learning for AutomatedAlgorithm Design)小組,自2014年以來一直在ICML機器學習學術會議上組織AutoML研討會。

那麼AutoML包含了那些內容呢?下圖是一張思維導圖:

目前由很多公司已經開源了一部分庫(後續陸續更新),大致如下:

其中AutoML所做的內容包含了以下:

今天為大家推薦一本新書 《Automatic Machine Learning: Methods, Systems, Challenges》

該書由Frank Hutter, Lars Kotthoff, Joaquin Vanschoren撰寫,221頁的草稿版本已經放出,詳細講解了所有AutoML系統背後的基礎知識,以及對當前AutoML系統進行了深入描述,Auto-WEKA、Hyperopt-Sklearn、Auto-sklearn等,最後介紹了AutoML的挑戰。以下是書的目錄(網絡搜索見第3章)

Reddit關於WANN討論地址:

[R] Weight Agnostic Neural Networks from MachineLearning

原文詳情:AutoML