目录
Multi-Modal Attention-based Fusion Model for Semantic Segmentation of RGB-Depth Images
arXiv
基于注意力机制的融合模块受注意力机制的启发,该网络注重于feature maps的channel-wise recalibration,对通道的dependency进行建模。从两个编码器的RGB和深度通道提取的中间特征图作为基于注意力机制的融合块的输入。基于注意力机制的融合块计算attention maps,attention maps再乘以输入的feature maps以进行自适应特征融合。基于注意力机制的融合模块由通道方向和空间方向的注意力机制组成,来构建attention maps。因此,基于两种模态在不同通道之间的相互依赖性来融合它们的feature maps。图2说明了基于注意力机制的融合块的架构。此外,每个AFB之后是lightweight chained redisual pooling layers,用于考虑解码器侧的全局上下文信息。
MMAF-Net以RGB和深度模态的两个编码器分支同时作为输入,同时包含一个解码器分支。在解码器分支中,基于新提出的注意融合模块,融合同一分辨率下两个编码器分支的特征图,将外观和3D特征图结合起来。这些融合的feature map被用来恢复编码器的信息丢失,并产生高分辨率的预测输出。
提出的模型利用ResNet模型(Convi-x)的residual blocks作为两个独立的编码器分支。在deep residual network中使用identity map函数。
encoder branch的residual block的输出作为long跳跃连接,被馈送到解码器的4个级联子模块,称为多模态多分辨率融合(MRF)模块。MRF模块的结构见下图。
1,首先在自己新建的项目文本框中输入Web Project的名称,然后单击下一步。 2,...
本文的初衷在于对Asp.net常用数据绑定控件进行一个概览性的总结,主要分析各种数...
用ASP开发的时候遇到一个解码问题。虽然在ASP中使用Request获取编码过URL字符串...
重要Tips 1.每个等级下做每个等级应该做的事可以帮领导做更高层级的事但不要帮下...
W3Cschool上是这样说明的 meta 元素可提供有关页面的元信息(meta-information)...
本文实例讲述了PHP 使用 Trait 解决 PHP 单继承问题。分享给大家供大家参考,具...
在网页制作中,常将 input 和 img 放在同一行,img标签总是比input高出一个头,...
本文转载自网络,原文链接:https://www.toutiao.com/a6864892090686374412/...
前言 正则表达式,新手见它的感觉就是“这都什么玩意,乱七八糟的,完全不知所云...
首先Mysql的密码权限存储在mysql.user表中。我们不关注鉴权的部分,我们只关心身...