騰訊優圖刷新濾波器剪枝的SOTA效果，相關論文入選NeurIPS 2020

2020 年 11 月 19 日
AI
深度學習

近日，騰訊優圖實驗室在模型壓縮任務中獲得創新性突破，提出的基於濾波器骨架的逐條剪枝算法（Stripe-Wise Pruning，SWP），刷新了濾波器剪枝的SOTA效果。相關論文（Pruning Filter in Filter）已被機器學習領域的國際頂級會議Conference on Neural Information Processing Systems（NeurIPS 2020）收錄，文章鏈接見文末。

圖1 Stripe-Wise Pruning與幾種主流Pruning方式的區別

神經網絡的具有結構和參數這兩個屬性，這兩個屬性都具有重要意義。本文指出神經網絡的濾波器除了通常使用的參數屬性以外，還有一種形狀屬性。形狀屬性之前一直隱含在參數中，通過訓練每個濾波器的參數使其獲得不同的形狀。濾波器的形狀屬性具有重要的意義。具有合適形狀的濾波器，即使參數是隨機的，也能具有較好的性能。

因此本文通過一種名為濾波器骨架（Filter Skeleton，FS）的模塊來顯性地學習濾波器的形狀（如圖2中①）。當訓練結束，我們可以將FS乘回參數上，因此不會引入額外的參數（如圖2中②）。

圖2 PFF方法流程示意圖

對於不在骨架上的參數，使用逐條裁剪的方法將其整條（stripe，1*1濾波器）裁剪掉。

具體的，首先通過卷積計算順序的變換，可以將濾波器從Filter wise等價變換為stripe wise（如圖2中③）。接下來就可以使用正常的濾波器剪枝方法對其進行裁剪（如圖2中④）。

該方法的創新點包括：

1、提出濾波器除了參數屬性外，還存在形狀屬性，並且形狀屬性具有重要意義。

2、提出濾波器除了參數屬性外，還存在形狀屬性，並且形狀屬性具有重要意義。

3、通過變換普通卷積為Stripe-Wise Convolution，結構化的實現逐條剪枝後的模型。

圖3

圖4

目前逐條剪枝算法在CIFAR10和ImageNet數據集上達到了SOTA效果。文章已公開，複製下方鏈接即可訪問👇

//arxiv.org/abs/2009.14410

點擊「閱讀原文」登陸優圖官網，找到「關於優圖——學術論文」，即可了解更多優圖的論文解讀。

Tags: 深度學習

騰訊優圖刷新濾波器剪枝的SOTA效果，相關論文入選NeurIPS 2020

VirMach 便宜 VPS

QNews

騰訊優圖刷新濾波器剪枝的SOTA效果，相關論文入選NeurIPS 2020

分享此文：

Related Posts

WAVE SUMMIT 2022深度學習開發者峰會

C# 運算符的重載（學習心得 21）

「蘋果稅」從30%降至15% 蘋果揮刀自割為哪般？

新手避坑 — 用 Jenkins +miniprogram-ci 自動構建微信小程序

VirMach 便宜 VPS

QNews

熱門搜尋