前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >论文阅读: 1706.Deeplabv3

论文阅读: 1706.Deeplabv3

作者头像
JNingWei
发布2021-12-06 21:41:21
4640
发布2021-12-06 21:41:21
举报
文章被收录于专栏:JNing的专栏JNing的专栏

1706.05587:Rethinking Atrous Convolution for Semantic Image Segmentation

三大改进点

  • 去掉CRF模块。
  • 改进了ASPP:
    • 相比V2的ASPP增加了1x1的conv以及global avg pooling。
    • 对ASPP每个空洞卷积加入了BN层。
  • 在级联模块中应用空洞卷积:
    • 将空洞卷积应用在最后面的级联模块,框架可以更通用。
    • 论文中的级联模块指复制了四份block4,这四份分别使用不同rate的空洞卷积,最终block输出结果:
      在这里插入图片描述
      在这里插入图片描述
    • 但这种结构效果并没有改进后的ASPP结构好:
      在这里插入图片描述
      在这里插入图片描述

架构设计

  • Encoder的主体是带有空洞卷积的DCNN,可以采用常用的分类网络如ResNet,然后是带有空洞卷积的空间金字塔池化模块(Atrous Spatial Pyramid Pooling, ASPP)),主要是为了引入多尺度信息。(这种架构在DeeplabV3+中被沿用)。
  • 对于DeepLabv3,经过ASPP模块得到的特征图的output_stride为8或者16,其经过1x1的分类层后直接双线性插值到原始图片大小,这是一种非常暴力的decoder方法,特别是output_stride=16。然而这并不利于得到较精细的分割结果,故v3+模型中借鉴了EncoderDecoder结构,引入了新的Decoder模块。
本文参与?腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-09-06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客?前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 三大改进点
  • 架构设计
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com