DeepMind的AI学会了将平面图像转换为3D场景

文章来源：腾讯云开发者社区Tristan Greene

谷歌位于英国的姊妹公司DeepMind最近开发了一种人工智能，它可以在将整个场景视为平面2D图像之后以3D渲染整个场景。

大框架：在尖端的AI研究人员正在试图教机器学习像人类一样。我们不是以像素为单位看世界，而是环顾我们的环境并对其中的一切进行假设。如果我们能够看到某人的胸部，我们就会假设他们也有一个背部，即使从我们的角度来看它可能不可见。

如果你和宝宝一起玩‘’傻瓜‘’，他们会发现即使用手遮住脸，你的脸仍然存在。这基本上就是DeepMind的团队用他们的机器做的事情：他们训练了一个人工智能如何从未见的角度猜测事物的样子。

细节： DeepMind的科学家提出了一个生成查询网络（Generative Query Network，GQN），这是一个神经网络，旨在教AI如何从不同的角度想象物体的场景会是什么样子。基本上，AI观察场景的平面2D图片，然后尝试重新创建它。在这种情况下，重要的是DeepMind的人工智能不使用任何人为标记的输入或以前的知识。它只观察三幅图像，并开始预测场景的3D版本是什么样子。

想想它就像拍摄一个立方体的照片，并要求AI从不同的角度呈现相同的图像。像灯光和阴影之类的东西会改变，以及组成立方体的线条的方向。人工智能 - 使用GQN--必须想象从实际上从未实际观察过的角度，立方体会呈现什么样子，以呈现所请求的图像。

影响：研究人员正在努力实现“完全无监督的场景理解”。目前人工智能尚未接受真实世界的图像训练，因此下一步将从照片中渲染逼真的场景。

未来，DeepMind的基于GQN的AI可以生成与现实世界几乎完全相同的按需3D场景，只使用照片。

发表于: 2018-06-302018-06-30 09:10:52
原文链接：https://thenextweb.com/artificial-intelligence/2018/06/29/deepminds-ai-learned-to-turn-flat-images-into-3d-scenes
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

DeepMind的AI学会了将平面图像转换为3D场景

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐