当前位置:首页 > 玛酷动态 > 玛酷奖项
玛酷动态 玛酷奖项 玛酷视频 寒假班 暑假班
DeepMind又搞事!人工智能有记忆,“举一反三”打游戏

还惦记着我的下棋绝杀呐?!曾经的辉煌如浮云,宝宝们快来看我的新宠:打游戏!——AI OS


北京时间315日上午最新消息!


人工智能(AI)系统能够学会一款雅达利(Atari)游戏,然后利用这些知识再学习另一款游戏


时光机biu2014

 

DeepMind的机器学习系统学会玩雅达利游戏,大获公众瞩目。它可以把游戏打通关,得分直接秒杀人类,却不记得它是怎样做到的。

该系统玩每一款雅达利游戏时,都要单独创建一组神经网络,因此,如果不能同时为人工智能输入《空间入侵者》(Space Invaders)和《打砖块》(Breakout)的信息,就不能在同一个系统上玩这两款游戏。


 


(雅达利游戏)


醒醒~~醒醒

 

现在,伦敦帝国理工学院的研究人员已经给一组DeepMind创建了一种算法,允许该系统的神经网络自主学习,保留信息并再次使用它。


DeepMind的研究科学家詹姆斯·基尔克帕特里克(James Kirkpatrick和其发表在美国国家科学院学报上的小语录,解释了DeepMindAI系统如何运用监督学习和强化学习测试等方式来不断学习


1、以前我们有一个系统可以学着玩任何游戏,但它一次只能学会玩一款游戏。现在的新系统可以一个接一个地学习玩几个游戏。我们的方法是通过有选择性地减慢高权重任务的学习速度来记住旧的任务。


2、不断完成学习任务而不遗忘的能力是生物和人工智能的核心组成部分。


3、为了让AI系统拥有记忆,我们开发了一种名为“弹性权重固化”(EWC)的算法,可以选择在游戏中成功通关的做法,并把最有用的部分保留下来。


  4、我们只允许它们(在游戏间)非常缓慢地做出改变。如此一来,我们就有了学习新任务的空间,但是我们所进行的改变不会覆盖我们以前学过的东西。


 


然而,这套系统还不完美。虽然它能够学习以前的经验,并保留最有用的信息,但它的神经网络无法像只完成一个游戏那样运转良好。

 

畅想未来


已证:AI系统能够不断学习

未证:它的学习效率有所提高

下一步:利用和规范连续学习,尝试和改善它在现实世界的学习活动。


 


AlphaGo 获胜一周年