计算机视觉在工业4.0发挥重要作用

文章来源：企鹅号 - 二蛋说自动化

如今，人工智能在工业领域正在快速发展，因为自动化和优化仍然是数字革命的主要焦点。

人工智能社区中最热点话题尖端计算机视觉技术，该技术被认为与行业兼容，并对行业用例产生严重而现实的影响。其中一些技术已超过人类可实现的性能水平，达到了令人难以置信的性能水平，并超出了大多数行业所期望的准确性和可靠性标准。图像分类等基本计算机视觉任务的惊人进步确保将多种技术相结合，创建一种新的复合技术，从而实现迄今为止在工业环境中从未探索过的新用例你可以。

尽管如此，这些新技术证明了结果与只能通过高密度硬件专用系统实现的结果相当。安装这些专用系统和安装与之相关的硬件存在实际困难和限制，但由于可以立即使用相机，因此用例的范围将大大扩展。通过AI增强的计算机视觉系统不断加速工业4.0，真正的数字化和逼真的现实增强，从而进入一个新的领域。

计算机视觉

计算机视觉是在让计算机理解图形和视频信息的科学。一种自动化视觉任务的功能，例如计算机视觉，从图形和视频中提取有用信息以及分析。

机器学习和深度学习

机器学习不是基于规则的方法，而是依赖于数据驱动的决策方法的算法和统计模型的科学研究。鉴于高质量数据和改进算法的大量，机器学习系统可以逐步提高特定任务的性能。深度学习是机器学习的子类，完全专注于一组可以表示为网络的数学算法。类似地，人工神经网络具有数百万个单独的突触，这些突触在数学上由数百万个简单的线性代数方程表示。

深度学习促进计算机视觉

自2012年以来，深度学习神经网络是计算机视觉的主要焦点。具有深度学习神经网络的计算机视觉系统的优点更加准确和灵活，并且在照明条件、视点、比例、方向、背景、混合、类别、差异、失真以及视觉遮挡方面存在许多变化。是的。更高的容忍度但最重要的是，它们影响了新的用例。

早期的计算机视觉模型依赖于原始像素数据作为机器学习模型的输入。但是，单个原始像素数据不足以包含图像中不断变化的对象。基于深度神经网络的深度学习驱动计算机视觉自动在训练阶段提取和创建特定任务的特征，并使用它们执行计算机视觉任务。

在深度学习和计算机视觉是过去6年中最重要的事件之一。

由于2012年引入深度神经网络引入的创新功能，图像分类误差减少了约10％（从2011年的25.8％降至2012年的16.4％）。

2015年，最先进的算法在图像分类方面优于人类，正确答案率为3.57％（Russakovsky等人，5.1％）。

总体而言，由于深度神经网络的引入，图像分类误差减少了1/10（从2011年的25.8％降至2017年的2.3％）。

值得注意的是，上述结果在ImageNet数据集中实现。 20,000个类别具有典型的类别，例如由数百个低分辨率469×387像素图像组成的“气球”和“草莓”。当应用于具有较少类别，较少变化和较高数量的较高分辨率图像的特定任务时，计算机视觉系统可以99.9％准确。这使得可以完全独立且自信地运行系统。

图像关键字和字幕

该技术处于计算机视觉和自然语言处理（NLP）最有趣的领域的交叉点。关键字是描述照片和图像元素的单词。关键字是向照片添加描述性术语的过程。图像字幕是指基于图像内的对象和运动从图像或视频生成文本描述的过程。

目标检测

目标检测是一种计算机视觉技术，用于识别和识别图像或视频中的对象。这通常通过将对象封装在盒装框中来完成。目标检测是自动驾驶车辆背后的一项重要技术，可以识别其他车辆并区分行人和路灯。它可用于各种目的，如工业检查和机器人视觉。由于ImageNet的争用，定位误差（42.5％至25.3％）仅在2010年至2014年间减少了1.7倍。

关键点检测和姿势估计

关键点被视为图像的有趣或重要部分的特征。它们是图像中的空间位置或点，用于定义图像中的有趣内容或突出内容。关键点是特殊的，因为它们允许您跟踪修改后的图像中的相同关键点。图像或图像中的对象旋转、以缩小/放大或变换。姿势估计是计算机视觉中的常见问题，其目的是检测对象的位置和方向。这通常意味着检测对象关键点的位置。该技术可用于创建高度精确的2D / 3D模型，其描述对象的关键点的位置，然后可用于创建数字双胞胎。

例如，在姿势估计问题中，可以检测一般方形家庭对象的角点，因此可以深入地理解对象在环境中的三维位置。也可以以相同的方式检测人体的姿势，并且检测诸如肩部、肘部、手、的人体关键点。

超级分辨率

此任务的目的是在提高细节水平的同时提高图像的分辨率。最近，非常深的神经网络在图像的超分辨率方面非常成功。放大2倍

夜视

低照度下的成像是一项挑战。如果曝光时间短，则会产生噪音。如果曝光时间很长，可能会出现运动模糊。特别是在手持摄影的情况下，后者通常是不切实际的。已经提出了各种降噪、模糊去除和增强技术，但是它们的效果在诸如夜间高速摄影的极端条件下受到限制。为了提高现有标准，研究人员介绍了基于深度网络端到端训练的低光图像处理技术。该网络直接用原始传感器数据取代了许多传统的图像处理技术。

Super SloMo

视频插值被设计为在两个连续帧之间生成中间帧。这些人工生成的图像具有与原始图像无法区分的视觉特征。该技术是提高相机系统性能的理想方式。多个数据集的实验结果表明，深度学习方法比现有方法更加一致。可以在下面的视频剪辑中看到此技术的结果，在原始帧期间添加7个中间帧以创建平滑的慢动作视频。

我认为这些技术处于技术的最前沿，并且通过提高速度、精度、的可靠性和灵活性，远远优于以前的技术。不断进步不断研究发展能推动计算机视觉领域人工智能研究的迅速发展，更重要的是最大限度地提高技术进步，以改善行业的最新趋势。

发表于: 2019-01-172019-01-17 03:04:36
原文链接：https://kuaibao.qq.com/s/20190117A02L2A00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

计算机视觉在工业4.0发挥重要作用

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐