【直播】模型参数这么多,泛化能力为什么还能这么强?| ICLR 2020
- 2020 年 5 月 6 日
- AI
直播主题:从梯度信噪比来理解深度学习泛化性能为什么这么好
直播时间:2020年4月30日(周四)晚20:00整
论文信息
标题:Understanding Why Neural Networks Generalize Well Through GSNR of Parameters
下载链接://openreview.net/forum?id=HyevIJStwH
分享背景:
泛化性能问题是深度学习的一个基础理论问题,传统的泛化理论在解释深度学习的泛化性能上遇到困难。本文中提出一个全新的角度来理解深度学习的泛化性能问题。
分享提纲:
1. Motivation:深度学习的泛化性能为什么这么好?
2.一步泛化比例和梯度信噪比的定义
3.主要结论:训练过程中梯度信噪比越大,网络泛化性能越好,结论的试验验证