人工智能专家称:深度强化学习正成为通往通用AI的关键

深科技2018-04-12 10:13742

深度强化学习( DRL ) 是人工智能研究的一个令人兴奋的领域,这个领域在许多问题上都具有潜在的适用性,有些人认为DRL是通往通用人工智能(AGI)的一条道路,因为它是通过探索和接收环境的反馈来反映人类学习的。


最近,DRL成功击败人类视频游戏玩家,以及双足智能体学习在模拟环境中行走,这些进展都提高了人们对该领域的热情。


与基于已知标签训练模型的监督学习不同,在强化学习中,研究人员通过让智能体与环境交互来训练模型。当智能体的行为产生期望的结果时,例如智能体获得奖励得分或赢得一场比赛,它会得到积极的反馈。简单地说,研究人员加强了智能体的良好行为。


将 DRL 应用于实际问题的关键挑战之一是构造一个激励函数,该函数鼓励期望的行为而不存在副作用。


也许值得注意的是,尽管深度强化学习(“深层”指的是底层模型是一个深层神经网络)仍然是一个相对较新的领域,但强化学习自上世纪70年代或更早就出现了。


图丨Andrej Karpathy


正如计算机视觉领域大牛之一、李飞飞高徒、曾在OpenAI任研究科学家、现任特斯拉AI总监的 Andrej Karpathy 在他2016的博文中所指出的那样,像AlphaGo和Atari Deep Q-Learning这样关键的 DRL 研究都是基于已经存在了一段时间的算法,但是深度学习取代了其他近似函数的方法。当然,他们能够使用深度学习归功于过去20多年中廉价计算能力的爆炸式增长。


谷歌工程师 Alex Irpan 最近发表了一篇题为“深度强化学习还不成熟”的文章,对原因进行了解释。Irpan 列举了 DRL 所需的大量数据、大多数 DRL 方法没有利用关于所涉及的系统和环境的先验知识、以及前面提到的提出有效的激励函数方面的困难等问题。


从研究和应用的角度来看,深度强化学习能继续成为人工智能领域的一个热门话题。它在处理复杂、多方面和决策问题方面显示出巨大的潜力,这使得它不仅对工业系统和游戏有用,而且在营销、广告、金融、教育,甚至数据科学本身等领域都很有用。

来源:深科技 ,如若转载,请注明出处。
“看完这篇文章觉得还不够?如果您关注教育行业产业链上下游动态发展,善于发现业内具备创新与机遇的公司和产品,亦或是能对行业政策及市场变化进行深入解读,那就快给我们投稿吧,投稿邮箱是:,您的来稿或许就会影响教育未来!”
2 收藏
分享

扫码分享本文章

北京决胜网教育科技股份有限公司 京ICP备13009167号-1 电信与信息服务业务经营许可证:京ICP证130407号

Copyright © 2017 决胜网 juesheng.com All Rights Reserved. 京公网安备 11010102000921号