Deepmind“好奇心”强化学习新突破！改变奖励机制，让智能体不再“兜圈子”

文章来源：企鹅号 - TalkingData数据学堂

Deepmind“好奇心”强化学习新突破！改变奖励机制，让智能体不再“兜圈子”

Google、Deepmind和苏黎世联邦理工学院的研究人员提出“好奇心学习”新方法，改变了智能体“好奇心”的生成方式和奖励机制，奖励机制不再基于智能体的“意外”，而是其记忆和所在情景。研究人员称，新方法可以有效降低智能体“原地兜圈子”、“拖延”等不良行为，有效提升模型性能。强化学习是机器学习中最活跃的研究领域之一，在该领域的研究环境下，人工智能体（agent）做到正确的事情时会获得积极的奖励，否则获得负面的奖励。

NIPS不改名引发学界大佬联名抗议，Jeff Dean领衔！

近日，NIPS董事会决定，NIPS不会改名。而就在今天，由Anima Anandkumar发起、包括Jeff Dean在内近百人联名，对NIPS董事会表示抗议。此次联名抗议是由英伟达机器学习研究负责人Anima Anandkumar发起，他在抗议声明中表示：由于NIPS名称所产生的这些事件给他们当中的一些人带来了不愉快的回忆，使其职业道路受到不友好或骚扰行为的影响。

Julia加入TPU，这是一个靠自己也要融入机器学习的编程语言

Julia 语言发展非常迅速，它可以视为同时具备了 Python 的灵活性与 C 的速度，但目前 TensorFlow 和 PyTorch 等框架官方都不支持 Julia 语言。因此近日有研究者借助 XLA 底层编译器为 Julia 构建 TPU 支持，他们表示该方法能够将 Julia 程序编写的 VGG19 模型融合到 TPU 可执行文件中，并调用 TPU 实现高效计算。而 Google.ai 的负责人 Jeff Dean 在推特上也表示「Julia + TPUs = fast and easily expressible ML computations!」。

Facebook开源Mask R-CNN的PyTorch 1.0基准，比mmdetection更快

近日，Facebook AI Research 开源了 Faster R-CNN 和 Mask R-CNN 的 PyTorch 1.0 实现基准：MaskRCNN-Benchmark。相比 Detectron 和 mmdetection，MaskRCNN-Benchmark 的性能相当，并拥有更快的训练速度和更低的 GPU 内存占用。Detectron 是 Facebook AI Research 实现顶尖目标检测算法（包括 Mask R-CNN）的软件系统。该系统是基于 Python 和深度学习框架 Caffe 2 而构建的。Detectron 目前包含以下目标检测算法的实现：Mask R-CNN 、RetinaNet、Faster R-CNN、RPN、Fast R-CNN、R-FCN。

谷歌推机器学习标注图片中物体界面整体速度提高3倍

Google在2018 ACM多媒体会议上，推出一种使用机器学习来标注图片界面，让使用者快速为图片中物体标记出轮廓以及标签，提高整体标记速度达三倍。由于现代基于深度学习电脑视觉模型的性能，取决标签训练资料的多少，越大的资料库将能让机器学习有更好的表现。Google在许多深度学习的研究都一再提到，高品质的训练资料取得并不容易，而这个问题已经成为发展电脑视觉的主要瓶颈，对于诸如自动驾驶、机器人或是图片搜寻等这类以像素为辨识基础的工作更是如此。

来源：新智元、机器之心、高工智能未来等。

发表于: 2018-10-252018-10-25 17:12:43
原文链接：https://kuaibao.qq.com/s/20181025B1D7KF00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

Deepmind“好奇心”强化学习新突破！改变奖励机制，让智能体不再“兜圈子”

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐