机器学习加持：OpenAI机械手操控灵活性有了大幅提升

文章来源：企鹅号 - Science科学探索

虽然机器人的灵活性还没有达到接近人手的水平，但伊隆·马斯克等科技大佬携手创立的非营利组织 OpenAI，正在努力向这个目标抵近。最近，OpenAI 研究人员正在借助人工智能，来教导机器人像人类一样灵巧地操纵物体。通常情况下，科学家们需要通过强化学习来实现这一目标，即让 AI 反复试验学习过程，但这么做相当耗费时间。

如果只是让 AI 去学习怎么玩视频游戏，只需要让它以更快的速度玩游戏就行了。但涉及真实任务时，就有些抓瞎了。

你不能等待机械手臂经过多年的练习，且它难以模拟世界上足够准确的训练课目。

有鉴于此，OpenAI 自行设定了一个任务，教机器人手来操纵一个六面立方体 —— 将它从一个位置移动到另一个位置，期间保持特定的一面朝上。

与早期研究一样，他们首先尽可能地准确模拟这种环境，但下一步，他们会制造差异来搞乱模拟。

首先，研究人员添加了随机的‘视觉噪音’，改变虚拟机械手和立方体的颜色。

然后，随机化立方体的大小、表面滑腻程度、重量、甚至模拟了不同的引力参数。

所有这一切，都是为了让 AI 更好地理解在现实世界中操纵立方体的可能性。

虽然模拟无法将真实情况完全考虑进去，但有了足够的变化，就允许它系统地学习针对意外事件的处理方法。参与 OpenAI 项目的 Matthias Plappert 解释到：

改变模拟的引力，是一件相当有趣的事情。当 AI 系统（Dactyl）在控制真实的机器人手时，手的基部可能每次都处于不同的位置和角度。

如果较低偏低，意味着立方体更容易从手中掉落。为了教 Dactyl 处理这种变化，研究人员决定将模拟中的重力参数也随机化。

如果不这样，它就会因为不习惯而一直掉落物体。事实上，Dactyl 必须积累大约 100 年的经验，才能达到最佳的表现。

反之，研究团队必须耗费大量的计算能力 —— 大约 6144 个 CPU 和 8 组强大的 Nvidia V100 GPU 。

显然，需求如此高的硬件，只有极少数的研究机构才能用上。不过 Plappert 表示，最终的结果，依然是相当值得的：

完成训练后，Dactyl 能够将立方体从一个位置移动到另一个位置，连续执行 50 次动作而不会出现掉落 —— 即便中位数的次数要小得多（只有 13 次）。

在学习移动立方体的过程中，Dactyl 甚至开发出了类似真人的行为，而所有这些都是在没有人为知道的情况下习得的（只是几十年如一日般的反复试验）。

Plappert 表示，这表明 OpenAI 的已经为仿真操控做到了极佳的优化。当你看到一台机器人试图解决问题，本身就是一件很有趣的事情。

[编译自：TheVerge]

稿源：cnBeta.COM

发表于: 2018-07-312018-07-31 17:14:37
原文链接：https://kuaibao.qq.com/s/20180731A18HZG00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

机器学习加持：OpenAI机械手操控灵活性有了大幅提升

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐