旷视张祥雨:神经网络架构设计新思路
- 2020 年 12 月 31 日
- AI
-
神经网络架构搜索中存在一个有趣的现象,即搜索空间中不同模型的收敛速度与最终性能之间常常存在正相关关系,据此我们可以不基于准确率、而是基于收敛速度去判断子结构的优劣,从而实现高效搜索;
-
隐式模型有低参数量、强表示能力、大感受野等优点,这对设计通用模型结构可以带来很多启发;
-
重参数化则是一种应用技巧,可以让模型的训练和推理更加高效。

基于收敛速度指标的神经网络架构搜索算法







隐式模型





重参数化模型




点击阅读原文,直达AAAI小组!
由于微信公众号试行乱序推送,您可能不再能准时收到AI科技评论的推送。为了第一时间收到AI科技评论的报道, 请将“AI科技评论”设为星标账号,以及常点文末右下角的“在看”。