5分钟，不仅精通MobileNet系列网络，更能...

灿视学长

发布于 2021-07-07 10:30:39

4910

发布于 2021-07-07 10:30:39

文章被收录于专栏：灿视学长灿视学长

MobileNet系列盘点(科研灵感也可借鉴)

大家好，周末愉快！

今天是团队中的

BJWang

给大家带来的，关于

MobileNet

系列文章的梳理。

本文主要是从直观感受上，了解下每一个网络有哪些新模块的设计，具体的原理与代码，可以扫码去相对应的

git

中看更详细的内容。

我们可以先看下其相对应的跨界应用，再来一步步看

Mobile

Net

系列的大作！：

MobileNet系列算法之V1

更详细文章，可扫码观看：

MobileNet

网络是由

google

团队在

2017

年提出的，专注于移动端或者嵌入式设备中的轻量级

CNN

网络。相比传统卷积神经网络，在准确率小幅降低的前提下大大减少模型参数与运算量。

其主要亮点有两个：

采用

Depthwise

Separable

Convolution

大大降低了计量量。

增加超参数

和

来控制网络模型。

Depthwise

Separable

Convolution

深度可分卷积是由

卷积和

卷积组合而来，一般来说

卷积用于提取特征，

用于降低或者升高

channel

的维度。

Depthwise

Separable

Convolution

如下图

中左上角所示为传统卷积方式，即卷积核的

channel

是等于输入特征矩阵的

channel

，而输出特征矩阵的

channel

是等于卷积核的个数。

如下图

中右下角所示为

Depthwise

Converlution

。

Depthwise

Converlution

是将单个卷积核应用于每个输入通道，例如输入的特征为

RGB

三个通道，对应的

Depthwise

Converlution

就有三个卷积核分别去和

、

通道做计算，得到三个输出特征，更进一步看，

Depthwise

Converlution

的输出

channel

和输入

channel

是相等的。

图

Depthwise

Converlution

和传统卷积计算过程

Pointwise

Convolution

如下图

所示，其实

卷积就是普通的卷积而已，只不过卷积核大小为1。通常

卷积和

卷积是放在一起使用的，先使用

卷积提取特征，再使用

卷积做通道维度的变换，二者合起来叫做

Depthwise

Separable

Convolution

（深度可分卷积）。

图

Pointwise

Convolution

计算过程

超参数设计

在

Mobilenet

原论文中，还提出了两个超参数，一个是

一个是

。

其中参数

，称为宽度因子。使用超参数

对

卷积核的个数以及

卷积核的个数进行等比例缩小。因此其计算量变为:

{D_K}

{D_F}

这里的

∈（

，

], 这里的

值分别取了

，

0.75

，

0.5

，

0.25

。当

时即为上面的

MobileNet

结构。

如下图

是分别采用不同的

值对应的精确度、计算量和参数量，

值越小，对应的精度越低，但其计算量和参数量也会越少。用户可以根据不同的场景来选择不同的

参数。

图

不同α值下的模型参数量、计算量以及精度

第二个参数

，称为分辨率因子。超参数

用来降低空间分辨率。用法和

一样。因此其计算量变为：

{D_K}

{D_F}

。这里

∈（

，

]。因此空间分辨率变为了

224

，

192

，

160

或

128

，能够降低计算量，但无法降低参数量。

如下图4所示为分别采用不同的

值对应的精确度、计算量和参数量。随着

值降低，模型精度和计算量都在减少，但参数量并没有减少。

图

不同ρ值下的模型参数量、计算量以及精度

MobileNet 系列算法之 V2

更详细文章，可扫码观看：

针对

MobileNet

中出现的

Depthwise

部分的卷积核容易废掉，即卷积核参数大部分为零的问题，

Google

团队在

2018

年提出

MobileNet

，相比于

MobileNet

网络，准确率更高，模型更小。

其主要亮点有两个：

使用了

Inverted

Residuals

(倒残差结构)

使用了

Linear

Bottlenecks

Inverted

Residuals

区别于传统卷积采用先降维再升维度，

MobileNet

中的

Inverted

Residuals

采用先升维再降维的方式，来保证

深度卷积能够在高纬度上进行计算。

图

Inverted

Residuals

和传统残差对比

Linear

Bottlenecks

作者提出

ReLU

将会导致的信息损耗，因此将

ReLU

替换成线性激活函数。当然了并不是将所有的

ReLU

函数都替换为线性激活函数，而是将

Inverted

Residuals

(倒残差结构)中的最后一个

Relu6

激活函数换成线性激活函数。并对于

stride

并且输入和输入的

shape

相同的

Bottlenecks

采用了

Resnet

的思想使用

shortcuts

操作增加跳跃连接，减缓梯度传播时造成的梯度弥散。

图

Linear

Bottlenecks

MobileNet

系列算法之

更详细文章，可扫码观看：

MobileNet

同样是由谷歌于

2019

年提出的。在

网络的基础上，

主要有以下四个亮点，其中第一点的

NAS

在本文不做讨论：

使用

NAS

神经架构搜索确定网络结构

的

block

基础上引入

Squeeze

and

Excitation

结构

使用h-swish激活函数
重新设计耗时层结构

Squeeze

and

Excitation

MobileNet

采用了通道注意力机制，简单来说就是在

MobileNet

的倒残差结构中加入

模块，对

卷积层后输出的特征矩阵采用两个全连接层来计算出特征矩阵每一个通道的“重要度”，然后给每个通道乘以相应的重要度得到一个全新的特征矩阵。如下如图

中红色框所示。

图

Squeeze

and

Excitation

模块

swish

激活函数

在

swish

激活函数的基础上，作者对其进行了改进，提出了

swish

激活函数。表达式如下：

h-swish(x)=x·\frac{ReLU6(x+3)}{6}

重新设计耗时层结构

1、作者经过实验证明第一层的

bneck

使用

个卷积核和使用

个卷积核的精度是一样，而使用

个卷积核自然是可以提升推理速度。如下图

中所示，第一个

bneck

的采用

个卷积核。

图

2、精简

Last

Stage

：如下图

中所示，上半图为原始

Last

Stage

结构，经过作者实验后采用下图下半部分的网络结构来精简

Last

Stage

可以保证精度几乎不变的情况下，将单图推理性能提升

11%

（减少约

7ms

）。

图

精简

Last

Stage

- END -

本文参与?腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2021-06-05，如有侵权请联系?cloudcommunity@tencent.com 删除

腾讯云开发者社区

本文分享自灿视学长微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ，欢迎热爱写作的你一起参与！

腾讯云开发者社区

登录后参与评论

0 条评论

热度