曠視張祥雨:神經網絡架構設計新思路
- 2020 年 12 月 31 日
- AI
-
神經網絡架構搜索中存在一個有趣的現象,即搜索空間中不同模型的收斂速度與最終性能之間常常存在正相關關係,據此我們可以不基於準確率、而是基於收斂速度去判斷子結構的優劣,從而實現高效搜索;
-
隱式模型有低參數量、強表示能力、大感受野等優點,這對設計通用模型結構可以帶來很多啟發;
-
重參數化則是一種應用技巧,可以讓模型的訓練和推理更加高效。

基於收斂速度指標的神經網絡架構搜索算法







隱式模型





重參數化模型




點擊閱讀原文,直達AAAI小組!
由於微信公眾號試行亂序推送,您可能不再能準時收到AI科技評論的推送。為了第一時間收到AI科技評論的報道, 請將「AI科技評論」設為星標賬號,以及常點文末右下角的「在看」。