当前位置：主页 > 查看内容

使用深度学习从视频中估计车辆的速度

发布时间：2021-05-25 00:00| 有位朋友查看

简介：我想要解决的问题是：在一辆车里有一个摄像头，我想知道车开得有多快。你显然不能看速度表，只能看视频片段本身。深度学习魔法应该能帮助我们。数据我有两个不同的视频。一个用于训练，另一个用于测试。训练视频有20399帧，测试视频有10797……

我想要解决的问题是：在一辆车里有一个摄像头，我想知道车开得有多快。你显然不能看速度表，只能看视频片段本身。深度学习魔法应该能帮助我们。

数据

我有两个不同的视频。一个用于训练，另一个用于测试。训练视频有20399帧，测试视频有10797帧。视频下载地址：https://github.com/commaai/speedchallenge。下面是一些例子：

视频中的样本图像

训练视频的标签是a .txt文件，其中每一行对应于特定帧的速度。

方法

这个问题最有趣的地方是你的神经网络输入会是什么样子。仅从一个静态图像计算速度是不可能的。一种有效的方法是将两个或更多的图像堆叠在一起，或者像LSTM或Transformer那样连续地堆叠。另一个是计算光流，我决定用它。

什么是光流?它基本上是一种为每个像素计算矢量的方法，告诉你两幅图像之间的相对运动。有一个很棒的computerphile视频：https://www.youtube.com/watch?v=4v_keMNROv4，你可以了解更多细节。有一些“经典”的计算机视觉算法可以用来计算光流，但深度学习已经变得更好了(这一点也不奇怪)。那么什么是SOTA方法，让我们看看paperswithcode：

RAFT 看起来不错，它还有PyTorch的实现。我forked原始存储库，并使其更简单一些。我不需要训练，评估等等。我只会用它来推理。

计算光流

为了进行推断，网络将两幅图像拼接起来，并预测了一个维度为*(2, image_height, image_width)*的张量。如前所述，图像中的每个像素对应一个二维向量。我们将在实际训练中使用这些文件，因此我们将它们保存为.npy文件。如果你想象光流图像它会是这样的：

训练

记住我们训练的目的：

光流→模型→车速估计

我选择的模型是EfficientNet。我非常喜欢它，因为它的可扩展性。它有8个不同的版本供你选择，最大的一个，EfficientNet-B7仍然非常非常好。你可以从一个像B0这样的小变体开始，然后如果一切工作正常，你有一个足够好的GPU，你可以选择一个更大的。还有一个PyTorch库，我会使用它来非常容易地加载预先训练好的网络模型，地址：https://github.com/lukemelas/effecentnet-PyTorch。如果你打开[train.ipynb](https://github.com/sharifelfouly/vehicle-speed - estimate)，你就可以看到训练是如何运作的。

我总是从B0开始，然后放大到B3，因为我的GPU只有6 GB内存。经过训练，我得到如下结果(loss为均方误差)：

训练损失

验证损失

很好，看起来一切都很正常!训练和验证损失都在降低，网络没有过拟合。

结果如下：

虽然不完美，但它确实有一些用

总结

我通常不太喜欢特征工程，但我认为在这种情况下它做得很好。下一步是尝试一些序列化的东西，比如Transformer或LSTM。

【责任编辑：华轩 TEL：（010）68476606】
本文转载自网络，原文链接：https://www.toutiao.com/i6913065469197189645/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：10个最新且有希望的UI设计趋势 下一篇：2020年人工智能领域的最大创新

随机推荐

现在学习AI是否为时已晚？

AI饱和我定期分享资源来学习AI和数据科学，无论是Google或哈佛的课程，还是YouT...
微信8.0将好友和朋友圈可见人数上限提至1

在一份网络上流传的微信8.0完整更新日志中提到，腾讯似乎将好友数量和可访问朋友...
微信最新版更新，修复了这些问题

按照正常的更新节奏，微信iOS版又迎来了最新版本的更新，版本号为7.0.21正式版。...
机器学习和AIOps在网络性能管理中的作用

在疫情给世界带来业务运营和金融不稳定的转变之前，企业就要求IT团队少花钱多办...
2020 年深度学习发展大盘点

紧跟近些年的趋势，2020年深度学习依然是发展最快的领域之一，直奔未来工作。其...
教你自定义 iOS 14 APP 图标

自从 iOS 14 发布后，桌面小工具和快捷指令又带火了一把 DIY 桌面的热潮，今天就...
微信输入法正在研发张小龙：从来不会分

1月19日，以激发WeBuild为主题，2021微信公开课PRO正式在广州开讲。昨晚，微信创...
智能机器人技术应用与发展趋势

王耀南院士在2020国家机器人发展论坛作报告作者简介：王耀南，中国工程院院士...
iOS14.3正式版来了，到底要不要升级，纠

只要苹果的IOS系统更新了，我一般都是第一时间更新。我只想体验一下IOS的最新版...
2021开工大吉！这5个提高效率的宝藏APP，

新的一年开始了，我们又回到了自己的工作岗位上。2021年开工大吉!下面这5个提高...

使用深度学习从视频中估计车辆的速度

推荐图文

为什么效率在现代数据中心很重要

iOS14.3正式版来了，到底要不要升级，纠结的小伙伴

微信接收消息延迟？原来是他们在搞鬼，教你一键轻松

亲属卡被当成诈骗工具微信详解：这三点要注意

系统中的大管家—SystemServer进程

5G甚嚣尘上，4G用户难以偏安一隅

随机推荐

现在学习AI是否为时已晚？

微信8.0将好友和朋友圈可见人数上限提至1

微信最新版更新，修复了这些问题

机器学习和AIOps在网络性能管理中的作用

2020 年深度学习发展大盘点

教你自定义 iOS 14 APP 图标

微信输入法正在研发张小龙：从来不会分

智能机器人技术应用与发展趋势

iOS14.3正式版来了，到底要不要升级，纠

2021开工大吉！这5个提高效率的宝藏APP，

关于我们