李世石扳回一局有何意义?丰富AlphaGo的数据库而已

分享到:
118
下一篇 >

在说这个话题之前,我想起了一则关于李连杰和《黑客帝国》的传闻。

据说,李连杰本来是有机会出演《黑客帝国》系列的,但出于某种原因,二者分道扬镳。关于没能合作的原因,众说纷纭。片酬说,主配角说,说法很多。

李世石扳回一局有何意义?丰富了AlphaGo的数据库而已

在2010年的时候,媒体上有一种说法是“电脑存档”。当时的报道是这样的:“李连杰和华纳方面协商拍片事宜之初,华纳方面提出一个要求,他们特别建造了一座当时*大的动作捕捉舞台,要用超级计算机记录下李连杰功夫的一招一式,用于存档,其用意十分明显,利用计算机模拟李连杰的拳脚风格,达到用虚拟人*终替代演员的目的,这意味着,李连杰练了三十年的武功,在美国那儿,只需要电脑工作几个小时就可以做到同样的效果,而且任何时候都可以用,既可用于《黑客帝国》这部影片,也可以用于其它的影片,对此,李连杰二话不说予以拒绝。”

这种说法是真是假,我们不得而知。但是,目前电脑特效对动作片的作用却是有目共睹的。用现在的话讲,“电脑存档”说法的背后,其实是电影公司对武打动作大数据的采集。

从李连杰那里拉回我们的视线,继续说李世石和阿尔法围棋的人机大战。

无关*终结果的人机大战第四盘,李世石竟然赢了。

3月13日下午,谷歌人工智能AlphaGo与李世石对战第四场在韩国首尔四季酒店举行,李世石**战胜AlphaGo,总比分扳回至3:1。

对于李世石的这场胜利,业界可谓一片欢呼。

有声音认为李世石替人类挽回了尊严,有声音认为李世石抓住了Alpha Go的“命门”,有声音认为Alpha Go有缺陷。

但是,这场胜利的意义究竟有多大呢?

赛后,我和北京图灵机器人技术负责人陆羽皓在**时间内进行了交流。对于AlphaGo的失利,他是这样认为的。

首先,“AlphaGo并不是神,应该还有很大提升空间。”

接着,他这样说:“之前的基于纯mcts算法的围棋程序会有一些定势的漏洞,只要人类棋手熟悉了这些机器的漏洞就能轻易击败机器。但我认为这次并不是这样。 AlphaGo输了一局应该是由于估值网络还不够完善,遇到一些没见过的局面产生了错误的估值。(以后),它是可以通过学习更多的对局做出改进和提升的。并不是什么‘命门’或定势的弱点。”

听完他的话,我对李世石的这局胜利有了新的看法。

我明白了他的意思。很通俗地说,在第四盘对决中,李世石的某些招数以及这些招数造成的局面是AlphaGo没有见过的。也就是说,它的数据库中并没有存储这样的招数数据,以及类似的数据。它的设计者,也没有见识过这种局面。并且,AlphaGo还不具备随心所欲应对这种局面的能力。也就是说,它的“估值网络”还不够完善。在这个不够完善的“估值网络”指导下,造成了AlphaGo的判断失误和*终失利。

这个结果,固然值得欣喜。可是,从另一个角度讲,笔者认为这也直接促成了AlphaGo在数据信息库上的“丰富”以及“估值网络”的完善。

之前,AlphaGo的数据库中可能没有3月13日对弈的那种棋局。但是,那次对弈输了之后,它的***肯定会让它记住这盘棋,它的数据库也随之丰富。根据其自主学习能力,甚至会触类旁通、举一反三。在我看来,这次胜利,无非是增加了人工智能数据库的信息,提供了人工智能学习另一种棋局的机会。有了这次的经验,那也就意味着今后它可以应对这种局面了。

说到这里,我们再回过头想想我文章开头讲的李连杰与《黑客帝国》的传闻,您马上就能明白,这是一个道理。电脑收集动作明星的武打动作,为自己今后的虚拟明星做动作储备;人工智能收集新的棋谱,提升人工智能的能力。二者不同的是科技水平的差别,但实质意义是一样的。

而近一段时间以来,中国棋手非常积极的要挑战人工智能。这种精神值得鼓励,但会有什么结果?其实也是给人家增加数据信息罢了。

对于我的观点,陆羽皓基本认同,他说:“(除了收集数据),数据信息也是可以通过机器自我对局提升的,(在围棋方面)机器完胜人类是迟早的事。”是啊,自我对局尚且可以提高水平,更何况有“人”这个老师呢!

我又想起李世石扳回一局后,一种比较理性的观点认为:李世石赢棋无关人类尊严,只是对未知领域的探索。

这种观点在理性上是正确的,但说的很不**。人机大战,当然是人类对未知领域的探索,但又何尝不是人工智能对“未知领域”的探索呢?对于自己数据库中没有的棋局,AlphaGo见到了、对弈了,这也是一种另类的探索。所以,这种对未知领域探索是双向的——人类如此,机器亦如此。

我并不是人工智能威胁论的支持者,但我依然认为李世石扳回一局并无太大意义,这一局的胜利只是丰富了AlphaGo的数据库而已!

你可能感兴趣: 企业动态 图片 电脑 黑客
无觅相关文章插件,快速提升流量