计算机视觉-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

计算机视觉

专栏成员

146

文章

38503

阅读量

26

订阅数

深度学习500问——Chapter09：图像分割（5）

图像分割深度学习框架数据网络

卷积神经网络结构的设计主要朝着两个方向发展，一个是更宽的网络（代表：GoogleNet、VGG），一个是更深的网络（代表：ResNet）。但是随着层数的加深会出现一个问题——梯度消失，这将会导致网络停止训练。到目前为止解决这个问题的思路基本都是在前后层之间加一个identity connections(short path)。

2024-05-26

1080

深度学习500问——Chapter09：图像分割（4）

深度学习监督学习数据网络图像分割

其中黑色部分为原来的Faster-RCNN，红色部分为在Faster 网络上的修改：

2024-05-24

400

深度学习500问——Chapter09：图像分割（3）

连接论文模型图像分割深度学习

场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的。本文使用文中的 pyramid pooling module 实现基于不同区域的上下文集成，提出了PSPNet，实现利用上下文信息的能力来进行场景解析。

2024-05-24

350

深度学习500问——Chapter09：图像分割（2）

连接网络图像分割深度学习编码

卷积网络被大规模应用在分类任务中，输出的结果是整个图像的类标签。然而，在许多视觉任务，尤其是生物医学图像处理领域，目标输出应该包括目标类别的位置，并且每个像素都应该有类标签。另外，在生物医学图像往往缺少训练图片。所以，Ciresan等人训练了一个卷积神经网络，用滑动窗口提供像素的周围区域（patch）作为输入来预测每个像素的类标签。

2024-05-24

370

深度学习500问——Chapter09：图像分割（1）

图像分割深度学习连接数据网络

图像分割是预测图像中每一个像素所属的类别或者物体。基于深度学习的图像分割算法主要分为两类：

2024-05-24

600

深度学习500问——Chapter08：目标检测（10）

数据算法深度学习工具视频

VOC数据集是目标检测经常用的一个数据集，自2005年起每年举办一次比赛，最开始只有4类，到2007年扩充为20个类，共有两个常用的版本：2007和2012。学术界常用的5k的train/val 2007和 16k 的train/val 2012作为训练集，test 2007 作为测试集，用10k 的train/val 2007+test 2007和 16k的train/val 2012作为训练集，test2012作为测试集，分别汇报结果。

2024-05-24

450

深度学习500问——Chapter08：目标检测（9）

模型设计数据网络深度学习

验证是否过拟合的方法：画出loss曲线，如果训练集loss持续减小但是验证集loss增大，就说明是过拟合了。

2024-05-24

340

深度学习500问——Chapter08：目标检测（8）

深度学习卷积神经网络模型算法网络

在目标检测领域可以划分为了人脸检测与通用目标检测，往往人脸这方面会有专门的算法（包括人脸检测、人脸识别、人脸和其他属性的识别等等），并且可以和通用目标检测（识别）有一定的差别，这主要来源于人脸的特性（有时候目标比较小、人脸之间特征不明显、遮挡问题等），下面将从人脸检测和通用目标检测两个方面来讲解目标检测。

2024-05-24

420

AttributeError: module ‘PIL.Image‘ has no attribute ‘ANTIALIAS‘

module resize 解决方案 attributeerror image

修改图片大小的时候，代码报错：AttributeError: module 'PIL.Image' has no attribute 'ANTIALIAS'

2024-05-24

370

ImportError: cannot import name ‘compare_mse‘ from ‘skimage.measure‘

importerror 解决方案模型 compare import

在复现模型代码的时候遇到错误：ImportError: cannot import name 'compare_mse' from 'skimage.measure' 。

2024-05-24

440

深度学习中损失函数和激活函数的选择

深度学习函数模型数据神经网络

本篇博客的目的是根据业务目标，为大家提供关于在构建神经网络时，如何根据需求选择合适的最终层激活函数和损失函数的指导和建议。

2024-05-05

970

深度学习500问——Chapter08：目标检测（7）

网络深度学习连接设计统计

RFBNet主要想利用一些技巧使得轻量级模型在速度和精度上达到很好的trade-off的检测器。灵感来自人类视觉的感受野结构Receptive Fields（RFs），提出了新奇的RF block（RFB）模块，来验证感受野尺寸和方向性的对提高有鉴别器鲁棒特征的关系。RFBNet是以主干网络（backbone）为VGG 16的SSD来构建的，主要是在Inception的基础上加入了dilated卷积层（dilated convolution），从而有效增大了感受野（receptive field）。整体上因为是基于SSD网络进行改进，所以检测数据还是比较快，同时精度也有一定的保证。

2024-05-05

850

深度学习500问——Chapter08：目标检测（6）

深度学习测试函数基础网络

作者对one-stage检测器准确率不高的问题进行探究，发现主要问题在于正负类别不平衡（简单-难分类别不均衡）。

2024-05-05

1170

深度学习500问——Chapter08：目标检测（5）

基础模型数据网络深度学习

YOLOv1虽然检测速度快，但在定位方面不够准确，并且召回率较低。为了提升定位准确度。改善召回率，YOLOv2在YOLOv1的基础上提出了几种改进策略，如下图所示。可以看到，一些改进方法能有效提高模型的mAP。

2024-05-05

1840

一文搞懂 One-Hot Encoding（独热编码）

数据 encoding 编码二进制模型

本文将从独热编码的原理、独热编码的分类、独热编码的应用三个方面，来展开介绍独热编码 One-Hot Encoding。

2024-05-04

4040

深度学习500问——Chapter08：目标检测（4）

深度学习对象函数算法网络

我们将对单次目标检测器（包括SSD系列和YOLO系列等算法）进行综述。我们将分析FPN以理解多尺度特征图如何提高准确率，特别是小目标的检测，其在单次检测器中的检测效果通常很差。然后我们将分析Focal loss和RetinaNet，看看它们是如何解决训练过程中的类别不平衡问题的。

2024-05-04

2590

一文搞懂深度学习：神经网络基础部分

开发神经网络深度学习函数基础

本文将从神经网络定义、深度学习定义、深度学习历史、基础神经网络来简单介绍神经网络的基础部分。

2024-04-25

2320

为什么大模型训练需要GPU，以及适合训练大模型的GPU介绍

性能优化机器学习 gpu 模型

今天偶然看到一篇关于介绍GPU的推文，我们在复现代码以及模型训练过程中，GPU的使用是必不可少的，那么大模型训练需要的是GPU，而不是CPU呢。现在市面上又有哪些适合训练的GPU型号呢，价格如何，本文将会将上述疑问的回答一一分享给大家。

2024-04-25

3840

深度学习网络训练，Loss出现Nan的解决办法

解决方案网络深度学习 nan 函数

模型的训练不是单纯的调参，重要的是能针对出现的各种问题提出正确的解决方案。本文就训练网络loss出现Nan的原因做了具体分析，并给出了详细的解决方案，希望对大家训练模型有所帮助。

2024-04-25

4210

深度学习500问——Chapter08：目标检测（3）

深度学习论文模型设计网络

DetNet是发表在ECCV2018的论文，出发点是现有的检测任务backbone都是从分类任务衍生而来的，因此作者想针对检测专用的backbone做一些讨论和研究而设计了DetNet，思路比较新奇。

2024-04-25

500

点击加载更多

社区活动

AI代码助手快速上手训练营

鹅厂大牛带你玩转AI智能结对编程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态