这家初创企业靠强化学习就玩转了自动驾驶还把老牌玩家都diss了一遍

文章来源：企鹅号 - 前瞻经济学人APP

自动驾驶技术哪家强?Waymo当仁不让!

但是近日，一家初出茅庐的初创企业对一些老牌自动驾驶企业的技术提出质疑，还在其官网上说：“传统的自动驾驶技术昂贵、繁冗，多年来雷声大雨点小，但我们新开创的技术可以让汽车“自己教自己开车”，最主要的是“花最少的钱办最好的事”。”

这家如此“大言不惭”的企业名为 Wayve ，是一家英国公司。Wayve 的班底都是来自剑桥大学工程学院的大牛。

早在2018年8月，这家初创企业通过在视频上展示“在20分钟内教会一辆汽车沿着道路标线行驶”的“神技”而一时声名大噪，在业界引起不小的轰动。

而他们能完成这项壮举主要靠的是“强化学习”(Reinforcement Learning)算法。

所谓的强化学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。此前，就有许多公司就展现过这项技术的高效，最好的例子就是耳熟能详的 DeepMind 旗下横扫人类棋手的 AlphaGo 和 OpenAI 旗下迅速进步的 Dota 2 AI 机器人。

不可否认的是，让 AI 在复杂的棋类和即时战略类游戏中击败人类已经让人惊掉下巴了，而在短时间内教会一辆车如何自我控制更是让人惊叹。

该团队在 2018年上传到YouTube 上的车辆学习过程时，他们强调，这是世界上第一个将“强化学习应用在自动驾驶汽车的范例”。

从视频可以看出，最初车辆会像婴儿一样蹒跚学步，在路上蜿蜒前行，但当车辆开始偏离标线，安全驾驶员就会及时介入，将车辆拉回原来的轨道。这样一来，车载算法就知道自己犯了错误，而如果算法长时间不犯错，它们还会拿到奖励的“糖豆”。

为什么取得这样的成绩确实会令人惊叹不已?如果你了解目前自动驾驶汽车运作的原理，就能明白一二了。

当前搭载冗余的传感器的自动驾驶汽车，是一辆行走的“钞票粉碎机”

目前的自动驾驶汽车都是靠雷达、摄像头、传感器等堆砌出来的。

眼下，半自动驾驶系统已经用到了多种雷达和摄像头系统。在大多汽车行业专家看来，想要实现真正的全自动驾驶，雷达、摄像头和激光雷达这三套系统都必不可少，此外还需要搭载大量的冗余传感器系统。

后置和 360 度摄像头

摄像头提供的清晰图像不但能让人类驾驶员看到更多细节，还非常适合作为自动驾驶汽车的输入参数。后置和 360 度摄像头能帮助司机再现车外的复杂环境。如今，2D 摄像头已经可以在中控屏上投射车外图像甚至车辆的转弯角度了，而豪华车上能提供虚拟和 3D 图像的摄像头正逐渐成为标配。

要想提供栩栩如生的 3D 图像，一般车辆至少要安装 4-6 个摄像头。

前置摄像头系统

这些摄像头系统(中远程)都是“火眼金睛“，它的视野范围覆盖了车辆前部 100-275 码(约合 91.44-251.46 米)的区域。它会利用算法自动探测物体，进行分类并判断与车辆间的距离。除了探测行人、自行车、机动车、马路牙子、桥墩和隔离带，算法还能看懂交通标志和信号灯。

雷达

ADAS 系统需要雷达传感器的支持，而雷达也是实现自动驾驶功能的一大功臣。值得一提的是，雷达其实是个缩写，而其全称 Radio Detection And Ranging 其实已经说明了它的作用，即利用无线电波对物体进行探测和定位。其中应用的雷达包括近程雷达和远程雷达。

近程雷达应用设计之初是为了替换超声波传感器并对高度自动驾驶提供辅助。因此，传感器会被安装在车辆四角。此外，车辆前部还会安装用于远程探测的前视传感器。当然，车辆每一边还要安装其他辅助传感器。

激光雷达

激光雷达借助激光的反射探测四周物体，得到准确的立体位置关系，生成三维的点云数据，是绝大多数自动驾驶技术和机器人技术的感知核心。

而现阶段的自动驾驶均构建于高精地图之上。为了实现广泛可用的自动驾驶技术，厂商需要让自己的数据采集车高频率地在自己的运营道路上巡游，更新自身的高精地图信息，以保障数据的有效性。

长期以来，仅有 Velodyne、Quanergy 等少数厂商具有镭达的研发与制造能力，其价格亦长期高居不下，成为自动驾驶汽车上远超汽车本体，最为昂贵的部件。以 Velodyne 的 64 线镭达为例，其售价高达 75000 美元，和宝马 7 系的售价相差不远，而一辆自动驾驶汽车上往往需要多个镭达协同工作，确保感知的准确性、实时性，这使得自动驾驶来的更为昂贵。

照此算下来，单配置一部自动驾驶汽车，将计算单元、雷达、相机、激光雷达等等硬件成本包括在内，一部自动驾驶汽车的成本至少也要在 25 万美元以上，和顶级跑车兰博基尼的价格相当。

价格贵还是其一，现阶段的自动驾驶汽车技术进展还缓慢。

自自动驾驶大火以来，其中不乏鼓吹“自动驾驶已经到来”的声音，但公众迟迟未见实际应用技术落地。

即便是像Waymo这样的领导者也一直在该领域“摸爬滚打”。自2009年以来，其自动驾驶总里程可能已经超过了2000万公里。

直到2018年Waymo公司才在凤凰城推出了其第一个“商业化”无人驾驶出租车项目——Waymo One，开始向用户收费。不过据了解该项目其实很难称之为一个“商业化”项目，只有当地的少部分试验乘客可以使用这一平台。其性质更多的是一场试水，而远非面向公众的正式运营。

至于其他自动驾驶企业，基本都处于路测状态，甚至能达到L3水平的企业都数得过来。

相较之下，Wayve能在20分钟内在基本仅靠机器学习的情况下，让自动驾驶汽车学会直线行驶，着实让人惊艳。

不过最近，又有消息传来Wayve又来放大招了!

只靠卫星导航路线图和普通摄像头就能玩转自动驾驶汽车

当前的自动驾驶汽车依靠大量传感器捕获数据，这使得汽车能够在相对受控的环境中表现得更好，但是具有不能实时灵活地适应快速变化的环境的缺点。

Wayve在它们新发布的自动驾驶汽车视频中表示：在他们自身机器学习平台上运行的自动驾驶汽车能够在其训练期间从未见过的道路上安全行驶，除了卫星导航路线图和普通摄像头外不需要借助任何高清环境地图、昂贵的传感器和经过编码的规则。

他们声称这是世界首例。

根据Wayve的说法：“诀窍在于使用人工智能，我们的汽车通过模仿和强化来学习像人类一样的驾驶经验，用机器学习来驱动数据。每当安全驾驶员介入并接管时，车载算法就能知道自己犯了错误，并能从中习得驾驶经验。这比现在的任何其他自动驾驶方法更安全和可扩展。”

“此外，我们的模型通过端到端的深度学习学习车辆的转向和加速。我们在整个模型中决策不确定性。这允许我们从输入数据中学习与控制最相关的特性，使计算非常高效。事实上，所有的操作都相当于一台现代笔记本电脑。这大大降低了我们的传感器和计算成本(和电力需求)，花费不到传统方法的10%。”

总而言之，Wayve能做到这点还是靠上述提及的“强化学习”。

具体来说，这家公司认为制造真正的自动驾驶汽车的关键在于软件的自学能力，而其他公司使用更多的传感器并不能解决问题，它需要的是更好的协调。

强化学习采用的是边获得样例边学习的方式，在获得样例之后更新自己的模型，利用当前的模型来指导下一步的行动，下一步的行动获得奖励之后再更新模型，不断迭代重复直到模型收敛。

举个很简单的例子，还记得小时候学骑自行车的情景吗?是不是又兴奋，但又有点害怕。第一次骑自行车的时候，你可能还需要教导者跟随在你身边，帮你扶稳自行车，跌跌撞撞几次之后，你可能就可以自己独立骑行，再经过一段时间的练习，你或许就能在马路上像“风一般”飞驰。练习期间教导者只会给你一些简短的提示，或者帮你纠错。我们还没有见过谁靠一张密集的3D 地图或者激光摄像头来学习骑自行车。教导者只是为你提供了一个安全的环境，让你学会如何根据你所见来决定你的行为，最终让你成功学会骑车。

Wayve遵循的也是这个原则。他们让汽车从零开始学会如何通过试错法来学会自动驾驶，就像我们学习骑自行车一样。

如果其他独立观察人士能够证实这些说法，那么这家英国初创企业创新的方法可能会超越整个自动驾驶汽车领域目前的局限。

发表于: 2019-04-042019-04-04 16:49:39
原文链接：https://kuaibao.qq.com/s/20190404A0I1OL00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

这家初创企业靠强化学习就玩转了自动驾驶还把老牌玩家都diss了一遍

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

这家初创企业靠强化学习就玩转了自动驾驶 还把老牌玩家都diss了一遍

相关快讯

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

这家初创企业靠强化学习就玩转了自动驾驶还把老牌玩家都diss了一遍