人工智能技术进步的速度越来越快,每种细分技术所创造的价值正日益得到展现。
2013年,DeepMind发明了DQN算法,成功将深度学习和强化学习结合起来,开启了深度强化学习的新纪元。此后数年,强化学习的成果日新月异,很多非常困难的问题都被深度强化学习算法解决。
2016年,谷歌阿尔法围棋以4:1战胜围棋世界冠军、职业九段棋手李世石,不仅让深度学习为人们所知,而且掀起了人工智能的“大众热”,大家由此更加关注强化学习这一技术要点。
使用强化学习的一个很好的例子是让机器人学习如何走路。机器人首先向前迈出一大步然后跌倒。这一大步和摔倒是强化学习系统关注的响应点。由于反馈是负面的,所以继续调整,系统会根据多个负反馈的比对最终确定机器人应该把步子迈的小一点,不停地小,直到机器人走路不会摔倒为止。
通过强化学习,Boston Dynamics公司的机器人已经掌握了托举、后空翻、跳上窗台的要点。而迪斯尼幻想工程已经把这一点带到了一个新的层面,那就是让人形机器人来执行玩命的特技。
有业内人士指出,强化学习和其他的人工智能技术有一个很大的差异,那就是它的学习范式和其它技术不太一样。它不需要我们去收集数据,也不需要我们去做任何标记,而是我们把称之为智能体(Agent),放在一个环境里,就像动物或者我们自己生存的一个环境里,它会和环境自己打交道,自己学会在环境里如何完成一个任务,解决一个问题。
强化学习主要由智能体(Agent)、环境(Environment)、状态(State)和动作(Action)、奖励(Reward)组成。智能体将在环境的当前状态下,根据奖励信号做出动作,从而达到环境中的不同状态并得到奖励。
除了强化学习外,机器学习也备受关注。机器学习是AI的一个子集,是通过不同场景中的经验来训练系统的能力。随着车辆变得越来越自动化,开发人员可以使用机器学习训练系统来识别对象,并用更少的数据更好地解释其环境。
再来看一下深度学习。深度学习就是从有限样例中通过算法总结出一般性的规律,并可以应用到新的未知数据上。例如,我们可以从一些历史病例的集合中总结出症状和疾病之间的规律。这样,当有新的病人到来时,我们可以利用总结出来的规律来判断这个病人得了什么疾病。
那么,强化学习、机器学习、深度学习三者的区别是什么?简单说,人工智能范围最大,涵盖机器学习、深度学习和强化学习。如果把人工智能比喻成孩子大脑,那么机器学习是让孩子去掌握认知能力的过程,而深度学习是这种过程中很有效率的一种教学体系。
由强化学习、机器学习等技术构成的人工智能,其良好的发展前景引人期待。从全国来看,据艾瑞咨询测算,2022年国内人工智能核心产业规模有望达到1573亿元,复合增速达58%,产业将持续快速增长。如此广阔的市场空间,吸引着社会各界投资者的关注。
值得一提的是,发展“以人为本”的人工智能是全社会的课题,需要政府、商界、学界及所有利益相关方共担责任,协力推动。作为技术应用与推广的主体,企业负有不可推卸的社会责任。在研究强化学习相关技术时,企业要自觉遵守法规制度和社会公约,以此促进其有序、可持续应用。
未来,全球的可持续发展越来越依赖于数据创造的价值,而人工智能是数字经济中应用十分广泛的技术之一。或许再过几年,AI将在精准农业、智能家居、远程医疗、自动驾驶等领域发挥更加重要的作用。
从全球范围来说,韩国是最早全国商用5G的国家,早在2018年12月就已抢先全球商用...
1.如果流言蜚语能打击爱情,那说明我真的不爱你。 2.最好的爱情,就是将错就错...
前段时间,iOS系统已经开始推送测试版的新版微信了,但是安卓却迟迟没有动静。 ...
不久前,此前一直高举免费大旗的360,旗下浏览器传出了即将推出收费会员的消息,...
对于消费者和组织而言,人工智能是一项巨大的革命性进步。它带来了一些更重要和...
无人驾驶的概念已经出来很长一段时间了,相关的无人驾驶汽车更是时不时出现在新...
仿生体感-视觉关联学习框架。 可伸缩应变传感器。 techxplore.com网站7月14日报...
近期围绕老年人移动支付的话题不断,昔日一个老人冒雨交社保的画面再次浮现在眼...
有数据显示,近半数的商家在使用人脸识别功能时没有征得用户同意,在大数据大规...
新华社记者 张辛欣 累计建设开通5G基站超70万个,终端连接数超过1.8亿,5G手机累...