首页
学习
活动
专区
工具
TVP
发布

计算机视觉

专栏成员
146
文章
38503
阅读量
26
订阅数
深度学习500问——Chapter09:图像分割(5)
卷积神经网络结构的设计主要朝着两个方向发展,一个是更宽的网络(代表:GoogleNet、VGG),一个是更深的网络(代表:ResNet)。但是随着层数的加深会出现一个问题——梯度消失,这将会导致网络停止训练。到目前为止解决这个问题的思路基本都是在前后层之间加一个identity connections(short path)。
JOYCE_Leo16
2024-05-26
1080
深度学习500问——Chapter09:图像分割(4)
其中黑色部分为原来的Faster-RCNN,红色部分为在Faster 网络上的修改:
JOYCE_Leo16
2024-05-24
400
深度学习500问——Chapter09:图像分割(3)
场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的。本文使用文中的 pyramid pooling module 实现基于不同区域的上下文集成,提出了PSPNet,实现利用上下文信息的能力来进行场景解析。
JOYCE_Leo16
2024-05-24
350
深度学习500问——Chapter09:图像分割(2)
卷积网络被大规模应用在分类任务中,输出的结果是整个图像的类标签。然而,在许多视觉任务,尤其是生物医学图像处理领域,目标输出应该包括目标类别的位置,并且每个像素都应该有类标签。另外,在生物医学图像往往缺少训练图片。所以,Ciresan等人训练了一个卷积神经网络,用滑动窗口提供像素的周围区域(patch)作为输入来预测每个像素的类标签。
JOYCE_Leo16
2024-05-24
370
深度学习500问——Chapter09:图像分割(1)
图像分割是预测图像中每一个像素所属的类别或者物体。基于深度学习的图像分割算法主要分为两类:
JOYCE_Leo16
2024-05-24
600
深度学习500问——Chapter08:目标检测(10)
VOC数据集是目标检测经常用的一个数据集,自2005年起每年举办一次比赛,最开始只有4类,到2007年扩充为20个类,共有两个常用的版本:2007和2012。学术界常用的5k的train/val 2007和 16k 的train/val 2012作为训练集,test 2007 作为测试集,用10k 的train/val 2007+test 2007和 16k的train/val 2012作为训练集,test2012作为测试集,分别汇报结果。
JOYCE_Leo16
2024-05-24
450
深度学习500问——Chapter08:目标检测(9)
验证是否过拟合的方法:画出loss曲线,如果训练集loss持续减小但是验证集loss增大,就说明是过拟合了。
JOYCE_Leo16
2024-05-24
340
深度学习500问——Chapter08:目标检测(8)
在目标检测领域可以划分为了人脸检测与通用目标检测,往往人脸这方面会有专门的算法(包括人脸检测、人脸识别、人脸和其他属性的识别等等),并且可以和通用目标检测(识别)有一定的差别,这主要来源于人脸的特性(有时候目标比较小、人脸之间特征不明显、遮挡问题等),下面将从人脸检测和通用目标检测两个方面来讲解目标检测。
JOYCE_Leo16
2024-05-24
420
AttributeError: module ‘PIL.Image‘ has no attribute ‘ANTIALIAS‘
修改图片大小的时候,代码报错:AttributeError: module 'PIL.Image' has no attribute 'ANTIALIAS'
JOYCE_Leo16
2024-05-24
370
ImportError: cannot import name ‘compare_mse‘ from ‘skimage.measure‘
在复现模型代码的时候遇到错误:ImportError: cannot import name 'compare_mse' from 'skimage.measure' 。
JOYCE_Leo16
2024-05-24
440
深度学习中损失函数和激活函数的选择
本篇博客的目的是根据业务目标,为大家提供关于在构建神经网络时,如何根据需求选择合适的最终层激活函数和损失函数的指导和建议。
JOYCE_Leo16
2024-05-05
970
深度学习500问——Chapter08:目标检测(7)
RFBNet主要想利用一些技巧使得轻量级模型在速度和精度上达到很好的trade-off的检测器。灵感来自人类视觉的感受野结构Receptive Fields(RFs),提出了新奇的RF block(RFB)模块,来验证感受野尺寸和方向性的对提高有鉴别器鲁棒特征的关系。RFBNet是以主干网络(backbone)为VGG 16的SSD来构建的,主要是在Inception的基础上加入了dilated卷积层(dilated convolution),从而有效增大了感受野(receptive field)。整体上因为是基于SSD网络进行改进,所以检测数据还是比较快,同时精度也有一定的保证。
JOYCE_Leo16
2024-05-05
850
深度学习500问——Chapter08:目标检测(6)
作者对one-stage检测器准确率不高的问题进行探究,发现主要问题在于正负类别不平衡(简单-难分类别不均衡)。
JOYCE_Leo16
2024-05-05
1170
深度学习500问——Chapter08:目标检测(5)
YOLOv1虽然检测速度快,但在定位方面不够准确,并且召回率较低。为了提升定位准确度。改善召回率,YOLOv2在YOLOv1的基础上提出了几种改进策略,如下图所示。可以看到,一些改进方法能有效提高模型的mAP。
JOYCE_Leo16
2024-05-05
1840
一文搞懂 One-Hot Encoding(独热编码)
本文将从独热编码的原理、独热编码的分类、独热编码的应用三个方面,来展开介绍独热编码 One-Hot Encoding。
JOYCE_Leo16
2024-05-04
4040
深度学习500问——Chapter08:目标检测(4)
我们将对单次目标检测器(包括SSD系列和YOLO系列等算法)进行综述。我们将分析FPN以理解多尺度特征图如何提高准确率,特别是小目标的检测,其在单次检测器中的检测效果通常很差。然后我们将分析Focal loss和RetinaNet,看看它们是如何解决训练过程中的类别不平衡问题的。
JOYCE_Leo16
2024-05-04
2590
一文搞懂深度学习:神经网络基础部分
本文将从神经网络定义、深度学习定义、深度学习历史、基础神经网络来简单介绍神经网络的基础部分。
JOYCE_Leo16
2024-04-25
2320
为什么大模型训练需要GPU,以及适合训练大模型的GPU介绍
今天偶然看到一篇关于介绍GPU的推文,我们在复现代码以及模型训练过程中,GPU的使用是必不可少的,那么大模型训练需要的是GPU,而不是CPU呢。现在市面上又有哪些适合训练的GPU型号呢,价格如何,本文将会将上述疑问的回答一一分享给大家。
JOYCE_Leo16
2024-04-25
3840
深度学习网络训练,Loss出现Nan的解决办法
模型的训练不是单纯的调参,重要的是能针对出现的各种问题提出正确的解决方案。本文就训练网络loss出现Nan的原因做了具体分析,并给出了详细的解决方案,希望对大家训练模型有所帮助。
JOYCE_Leo16
2024-04-25
4210
深度学习500问——Chapter08:目标检测(3)
DetNet是发表在ECCV2018的论文,出发点是现有的检测任务backbone都是从分类任务衍生而来的,因此作者想针对检测专用的backbone做一些讨论和研究而设计了DetNet,思路比较新奇。
JOYCE_Leo16
2024-04-25
500
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com