开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >论文阅读: 1706.Deeplabv3

论文阅读: 1706.Deeplabv3

作者头像

JNingWei

发布于 2021-12-06 21:41:21

4640

发布于 2021-12-06 21:41:21

举报

文章被收录于专栏：JNing的专栏JNing的专栏

1706.05587：Rethinking Atrous Convolution for Semantic Image Segmentation

三大改进点

去掉CRF模块。
改进了ASPP：
- 相比V2的ASPP增加了1x1的conv以及global avg pooling。
- 对ASPP每个空洞卷积加入了BN层。
在级联模块中应用空洞卷积：
- 将空洞卷积应用在最后面的级联模块，框架可以更通用。
- 论文中的级联模块指复制了四份block4，这四份分别使用不同rate的空洞卷积，最终block输出结果：
  在这里插入图片描述
- 但这种结构效果并没有改进后的ASPP结构好：
  在这里插入图片描述

架构设计

Encoder的主体是带有空洞卷积的DCNN，可以采用常用的分类网络如ResNet，然后是带有空洞卷积的空间金字塔池化模块（Atrous Spatial Pyramid Pooling, ASPP)），主要是为了引入多尺度信息。（这种架构在DeeplabV3+中被沿用）。
对于DeepLabv3，经过ASPP模块得到的特征图的output_stride为8或者16，其经过1x1的分类层后直接双线性插值到原始图片大小，这是一种非常暴力的decoder方法，特别是output_stride=16。然而这并不利于得到较精细的分割结果，故v3+模型中借鉴了EncoderDecoder结构，引入了新的Decoder模块。

本文参与?腾讯云自媒体分享计划，分享自作者个人站点/博客。

原始发表：2021-09-06 ，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客?前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

目录

三大改进点
架构设计