10分钟学会使用YOLO及Opencv实现目标检测（下）

文章来源：企鹅号 - AI科技时讯

在上一节内容中，介绍了如何将YOLO应用于图像目标检测中，那么在学会检测单张图像后，我们也可以利用YOLO算法实现视频流中的目标检测。

将YOLO应用于视频流对象检测

首先打开文件并插入以下代码：

同样，首先从导入相关数据包和命令行参数开始。与之前不同的是，此脚本没有参数，取而代之的是量个视频路径：

：输入视频文件的路径；

：输出视频文件的路径；

视频的输入可以是手机拍摄的短视频或者是网上搜索到的视频。另外，也可以通过将多张照片合成为一个短视频也可以。本博客使用的是在PyImageSearch上找到来自imutils的类的示例。

下面的代码与处理图形时候相同：

在这里，加载标签并生成相应的颜色，然后加载YOLO模型并确定输出层名称。

接下来，将处理一些特定于视频的任务：

在上述代码块中：

打开一个指向视频文件的文件指针，循环读取帧；

初始化视频编写器（）和帧尺寸；

尝试确定视频文件中的总帧数（），以便估计整个视频的处理时间；

之后逐个处理帧：

上述定义了一个循环，然后从第一帧开始进行处理，并且会检查它是否是视频的最后一帧。接下来，如果尚未知道帧的尺寸，就会获取一下对应的尺寸。

接下来，使用当前帧作为输入执行YOLO的前向传递：

在这里，构建一个并将其传递通过网络，从而获得预测。然后继续初始化之前在图像目标检测中使用过的三个列表：、、：

在上述代码中，与图像目标检测相同的有：

循环输出层和检测；

提取并过滤掉弱预测；

计算边界框坐标；

更新各自的列表；

接下来，将应用非最大值抑制：

同样的，在上述代码中与图像目标检测相同的有：

使用函数用于抑制弱的重叠边界框，可以在此处阅读有关非最大值抑制的更多信息；

循环遍历由NMS计算的，并绘制相应的边界框+标签；

最终的部分代码如下：

总结一下：

初始化视频编写器（），一般在循环的第一次迭代被初始化；

打印出对处理视频所需时间的估计；

将帧（）写入输出视频文件；

清理和释放指针；

现在，打开一个终端并执行以下命令：

图6：YOLO应用于车祸视频对象检测

在视频/ GIF中，你不仅可以看到被检测到的车辆，还可以检测到人员以及交通信号灯！

YOLO目标检测器在该视频中表现相当不错。让现在尝试同一车追逐视频中的不同视频：

图7：在该视频中，使用OpenCV和YOLO对象检测来找到该嫌疑人，嫌疑人现在已经逃离汽车并正位于停车场

YOLO再一次能够检测到行人！或者嫌疑人回到他们的车中并继续追逐：

图8： YOLO是一种快速深度学习对象检测器，能够在使用GPU的情况下用于实时视频

最后一个例子，让我们看看如何使用YOLO作为构建流量计数器：

图9：立交桥交通视频表明，YOLO和OpenCV可准确、快速地检测汽车

下面汇总YOLO视频对象检测完整视频：

Quaker Oats汽车追逐视频；

Vlad Kiraly立交桥视频；

“White Crow”音频；

YOLO目标检测器的局限和缺点

YOLO目标检测器的最大限制和缺点是：

它并不总能很好地处理小物体；

它尤其不适合处理密集的对象；

限制的原因是由于YOLO算法其本身：

YOLO对象检测器将输入图像划分为网格，其中网格中的每个单元格仅预测单个对象；

如果单个单元格中存在多个小对象，则YOLO将无法检测到它们，最终导致错过对象检测；

因此，如果你的数据集是由许多靠近在一起的小对象组成时，那么就不应该使用YOLO算法。就小物体而言，更快的R-CNN往往效果最好，但是其速度也最慢。在这里也可以使用SSD算法， SSD通常在速度和准确性方面也有很好的权衡。

值得注意的是，在本教程中，YOLO比SSD运行速度慢，大约慢一个数量级。因此，如果你正在使用预先训练的深度学习对象检测器供OpenCV使用，可能需要考虑使用SSD算法而不是YOLO算法。

因此，在针对给定问题选择对象检测器时，我倾向于使用以下准则：

如果知道需要检测的是小物体并且速度方面不作求，我倾向于使用faster R-CNN算法；

如果速度是最重要的，我倾向于使用YOLO算法；

如果需要一个平衡的表现，我倾向于使用SSD算法；

想要训练自己的深度学习目标检测器？

图10：在我的书“使用Python进行计算机视觉的深度学习”中，我介绍了多种对象检测算法，包括faster R-CNN、SSD、RetinaNet。书中讲述了如何创建对象检测图像数据集、训练对象检测器并进行预测。

在本教程中，使用的YOLO模型是在COCO数据集上预先训练的.。但是，如果想在自己的数据集上训练深度学习对象检测器，该如何操作呢？

大体思路是自己标注数据集，按照darknet网站上的指示及网上博客自己更改相应的参数训练即可。或者在我的书“深度学习计算机视觉与Python”中，详细讲述了如何将faster R-CNN、SSD和RetinaNet应用于：

检测图像中的徽标；

检测交通标志；

检测车辆的前视图和后视图（用于构建自动驾驶汽车应用）；

检测图像和视频流中武器；

书中的所有目标检测章节都包含对算法和代码的详细说明，确保你能够成功训练自己的对象检测器。在这里可以了解有关我的书的更多信息（并获取免费的示例章节和目录）。

总结

在本教程中，我们学习了如何使用Deep Learning、OpenCV和Python完成YOLO对象检测。然后，我们简要讨论了YOLO架构，并用Python实现：

将YOLO对象检测应用于单个图像；

将YOLO对象检测应用于视频流；

在配备的3GHz Intel Xeon W处理器的机器上，YOLO的单次前向传输耗时约0.3秒；但是，使用单次检测器（SSD），检测耗时只需0.03秒，速度提升了一个数量级。对于使用OpenCV和Python在CPU上进行基于实时深度学习的对象检测，你可能需要考虑使用SSD算法。

如果你有兴趣在自己的自定义数据集上训练深度学习对象检测器，请务必参阅写的“使用Python进行计算机视觉深度学习”，其中提供了有关如何成功训练自己的检测器的详细指南。或者参看本人之前的博客。

发表于: 2018-11-252018-11-25 21:52:01
原文链接：https://kuaibao.qq.com/s/20181125G1H1L700?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

10分钟学会使用YOLO及Opencv实现目标检测（下）

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐