欧冠

田渊栋AI还不是围棋之神但终将造福全人类

2019-02-02 23:57:26来源:励志吧0次阅读

田渊栋:AI还不是围棋之神 但终将造福全人类

2018年06月22日独家专访:

AI科学家田渊栋 2018腾讯世界人工智能围棋大赛的举办,为全世界的开发者提供了面对面交流探讨的平台。借此机会,我们亦有幸请到了全世界最顶级人工智能科学家,作为访谈对象。

从谷歌的无人车组到Facebook的人工智能实验室,一度是FAIR唯一能打中文的全职研究员的田渊栋博士,带领一个团队重复了AlphaGoZero的算法,在一个月前发布了ELF OpenGo,并宣布开源。围棋AI的格局也因此发生了天翻地覆的变化。

然而取得如此成就的田先生,却在访谈的一开始就表示“原则上本次参赛我们倒数第一”。看完本期访谈后,相信您的收获将不仅限于围棋,更会对人工智能拥有更深刻的认识。

——野狐:田博士您好,很荣幸能够借这次腾讯世界人工智能围棋大赛的机会,聆听世界级人工智能大牛的传道解惑。早在2015年您便从事过围棋AI的开发,并且比谷歌早三个月发表文章,证明了用深度学习破解围棋的可行性。

一个多月前您的ELF OpenGo再次震惊围棋界。经广泛评测,目前公认ELF OpenGo是普通人能接触到的最强AI。可能会有人下意识认为这是“三年不鸣,一鸣惊人”,事实上ELF OpenGo达到如此水平仅用了不到4个月时间。可否向棋迷们分享开发过程和感想?

——田渊栋:其实并没有“三年不鸣,一鸣惊人”,作为研究员肯定还是要每隔一段时间鸣一次的。在DarkForest这个项目在2016年4月停止之后,这两年还是做了很多事情,包括设计Doom AI,做深度学习梯度下降算法的理论分析,ELF框架的提出及在NIPS大会上的演讲,House3D环境的发布及算法设计,还有这次ELF的改进和OpenGo,等等。两年可以做很多事的,只是大部分都没有涉及到围棋,所以棋迷们可能不知道我们的工作。

其实在去年10月AlphaGoZero文章出来之后我就想动手,不过那时正是赶会议论文及开会的时间,忙的不可开交,只能看不能动手的感觉是很不爽的。ELF OpenGo大约在今年1月才开始做,这个项目的目的并不是只为了围棋,而是作为ELF这个框架的一个测试和推广。去年ELF出来之后,尽管我在各种地方做了大量的演讲,推广仍不是很顺利,自然地我就想到需要一个具体应用,正好AlphaGoZero出来,配上以前的围棋代码,再合适不过了。于是我就花一周重写了一遍ELF的核心,增加了分布式系统的部分,然后按照论文把系统做了一遍。基本上二月中就可以跑了,接下来就是比较痛苦的调参和找bug的过程,一直到三月下旬我们才看到希望,然后才有了CGOS上的王朝系列和美国总统系列,和最后五月份的发布版。

田渊栋与李喆 ——野狐:可否进一步透露一下达到这样一个水平,背后调动的硬件资源,是一个怎样的概念?

——田渊栋:我们用了两千块V100的显卡训练两到三周。两千块卡其实还好,没有特别多。对比谷歌,我们的资源还是比较有限的。当然这个对于大部分人来说还不能接触到,不过我相信随着算法的改进和硬件的进步,说不定过几年每位棋迷都可以亲手训练了。

——野狐:您认为借助CNN,通过堆砌资源,或者资源+时间的方式,能否帮助我们触摸到想象中的“围棋之神”境界?

——田渊栋:不觉得如此。首先围棋状态还是太多,现在探索到的只是很小一部分。大家可以做个算数,四百九十万局乘上每局平均250步,能够覆盖多少围棋的局面,而所有可能的围棋局面又有多少,就知道拿“沧海一粟”这个成语来形容,实在是太无力了。另外人类在学围棋的时候会形成很多概念,但目前CNN还做不到,而且通过堆砌资源可能永远做不到。这个是人类智能优于CNN的地方,也是算法可以继续改进的地方。

——野狐:那么除了围棋,其他一切领域是否都有可能通过这种方式取得突破。

——田渊栋:AlphaGoZero系列算法虽然通用,但远不是能解决一切问题的灵丹妙药。概念上来说它需要一个完美及快速的模拟环境,还需要神经络与具体问题相容。去年我写博客的时候,能看到它的问题;在复现完这个算法之后,我们知道得要多得多,也对它的局限性有更深刻的认识。总的来说,对AI不能过于乐观,想要让它在一切领域都有突破,还早,需要大家共同努力。

——野狐:ELF OpenGo宣布开源,对正在做AI、做围棋AI以及从事围棋相关行业的人群,带来了强烈而迥异的震动。耗费如此昂贵的资源让ELF OpenGo达到这样一个水平,又免费提供给所以人借鉴使用,能否向我们科普这种“极客”范儿十足的做法的出发点?

——田渊栋:这些资源确实不便宜,但“昂贵”实在谈不上,应该没有北京一套房贵,所需的人力和耗时也并不多。一开始一两个月基本上都是我一个人在推动,等到看到了希望,就自然会有更多的同事加入。

做这个项目的目的,一是去了解DeepMind提出的AlphaGoZero及AlphaZero算法为什么能工作,有什么优缺点,如何去改进;二是借此机会完善和推广我们的ELF平台,以后可以用于其它目的;最后是借此磨练项目组,这次参与的组员有些新人,一起做成一个项目,对大家都是有好处的。

至于开源是我们一向的方针,科研要服务全人类,这是科研的最终目的。我相信就算没有我们,像LeelaZero也会逐渐达到目前OpenGo的水平,甚至更高。

——野狐:宣布开源后,ELF在围棋上的研究是继续进行,还是再度终止?未来打算探索哪些领域?

——田渊栋:ELF框架会继续改进,下一步计划还在讨论中,目前暂不透露。两年前DarkForest终止主要是因为当时科研上再做一个单独的围棋AI价值不大了。这次是用通用算法训练出来的,所以会继续思考其它各种想法,围棋模型作为一个明确客观的测试方案,当然会尝试,但是不一定只用在围棋上,也不一定以性能为导向。

——野狐:如果将来,人们发现一种深度学习以外的算法,也能适用于围棋,甚至比深度学习的效果更佳,围棋会再次吸引人工智能领域的科学家们开发新一代AI么?

——田渊栋:那是必然的。职业棋手们一辈子没有下过几百万局棋,却达到了很高的水准,并且能解释每一步的下法,对围棋有自己的世界观和方法论。这些都是人工智能目前完全达不到的,也是作为科学家的我们一直努力研究的目标。如果能只用几万局自对弈棋谱训练出强AI,或者让一个挂在上的小白AI通过和对手对下来成长,或者设计出能够抽象出围棋各种基本概念的AI,将会是很有意思的事情。

——野狐:ELF这三个字母对于棋界即便不是人尽皆知,也即将在人尽皆知的路上。然而绝大多数棋迷对“ELF”的认知,还仅仅停留在一款单卡碾压人类高手的围棋AI上,并不知道ELF是一个开源游戏平台。身为开发者,您在命名时赋予了“ELF”非常浪漫的想象和希冀,可否为大家介绍一下作为开源游戏平台的“ELF”?

——田渊栋:ELF是一个通用的强化学习训练平台,第一版在去年六月的时候发布,当时带了一个微缩版的即时战略游戏,可以用强化学习训练AI打即时战略游戏,这里是一些演示视频,后来我们在上面做了大量改进,这次随OpenGo发布的是第二版的ELF还有分布式训练代码,这些都是通用的,和围棋无关,之后ELF还会继续改进,名字很浪漫,不过脚印还是要一步一步走的。

——野狐:我想棋迷和参赛者,都是以看待绝顶高手的眼光,来评价本次ELF团队的参赛的,您对于本次参赛抱有怎样的预期?

——田渊栋:首先这次我们还是以团队身份,作为基线算法参赛的,以推广我们的OpenGo。我们已经开源,所以原则上我们是倒数第一。

——野狐:倒数第一……对我们围棋迷来说,您和您的ELF OpenGo是宛如世外高人一般的存在。“倒数第一”这个说法会不会让其他参赛者们亚历山大

——田渊栋:我们开源后一直鼓励大家使用,这一个半月以来我相信很多团队已经找到改进的方案,比如说加一些额外的条件防止出现征子bug,这些都会让OpenGo变得更强。这次参赛,能让大家用我们的平台,那就是达到目的了。团队还有很多任务要完成,我们不会为这次比赛的胜负花太多力气在上面,所以我们并不期望OpenGo可以获得很高的名次。当然啦,我们还是希望它能赢。

——野狐:围棋进入AI时代以来,棋迷与棋手们诞生过许多有趣的、神化AI的说法。比方说公众目前普遍将AI看作“围棋之神”,还有人认为其实两年前第一次人机战时,AI已经拥有让人类三子的实力。有些人连CNN和RNN都分不清,却深信AI可以解决一切问题,对此您怎么看待?AI对围棋、乃至对当前人类社会意味着什么?

——田渊栋:对于棋手们来说,围棋AI已经可以让他们大幅度提高平时训练的效率,对于棋迷们来说,有一个顶尖高手时刻陪着自己下棋,并且能不停指出落子的问题所在,这种感觉可能是之前从未体验过的。《棋魂》里面小光和佐为的梦幻组合,现在已经实现了。虽然我个人认为AI离围棋之神还有距离的,但可以确定的是,将来AI会成为进一步提高大家效率的必要工具,甚至成为水和空气那样的必需品,谁能用得好,谁就可以变得更强。至于AI将来能不能解决一切问题,现在回答这个问题还为时过早,还需要大家的努力。

——野狐:在您的心目中,围棋的未来是怎样的?它的意义、价值该如何体现?

——田渊栋:我自己围棋大概是18k的水平,所以这个问题不好回答。围棋的未来大概可以参照现在的国象,大家用软件训练及评测,会有更多的人成为爱好者参与进来,会有更多的人自学成材,会有更多人发现新的着法。我想作为一个有着三千年历史、浓厚中国文化底蕴和无穷变化的游戏,围棋可能会变得更加繁荣吧。

(责编:樊璐璐)

分享到: