公告:服务器迁移已顺利完成! 网址全面启用 https

服务器2号 服务器3号 服务器4号 服务器5号

申请VIP无广告,支付宝,微信,USDT!
在线客服请尝试以下不同链接如果进不了的话在线客服(1) (2) (3) (4) (5) (6)
(7) (8) (9) 实时开通

查看完整版本: 碾压人类!Deepmind拆解定式玩星际2![31P]

更深的藍 2017-8-14 19:47

碾压人类!Deepmind拆解定式玩星际2![31P]

1需要点基础围棋知识
        【中关村在线原创】在乌镇围棋大会之后直到最近几天,Deepmind的AlphaGo项目负责人之一Aja Huang博士结束了休假,又恰逢欧洲围棋大会,带给了全世界围棋爱好者一个“上帝视角”看三大复杂定式的解说,定式就此改写。然后,Deepmind宣布与暴雪联合弄出了机器学习打星际的API,连游戏也要沦陷了……
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNhVGIZAojAAUKVZTxzxEAAflnwIqhIYABQpt458.jpg[/img]
[b]需要点围棋基础知识[/b]
        在理解本文之前,我们需要铺垫一些基础知识。关于围棋基本规则的,大家可以通过网上的几分钟教学视频大致了解一下,简单来说,就是无气要被提子,两个眼才是活期。那么什么是定式呢?
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNgDeIbOP-AABsS0tbp-YAAflkgPelmEAAGxj147.gif[/img]
[b]定式的落子位置、方向、次序不能错[/b]
        定式这个词起源于中国古代。古代围棋对弈前要在四个角的星位放上黑白各两个子,然后再对弈,规则与今天的并不一样。围棋素有“金角银边草肚皮”的说法,角部可以用更少的子围出更多的空地,但是围绕角部的战斗也更激烈。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNgOqILl-tAAQPEib7NVcAAfllQNEszwABA8q032.jpg[/img]
要想不吃亏,学棋这种定式大全要能熟背很多[/b]
        在以千百年计的对弈中,人们总结出来了很多对双方看起来“五五开”的落子位置与顺序,这个称之为定式。但围棋盘的交叉点很多,所以定式也多,《定式大全》是厚厚的2本书,而随着规则的进化,定式也在变化。在众多定式当中,有三个定式公认的难解,人类棋手表示搞不清复杂的变化,着三个定式分别是大雪崩定式、定式以及大斜定式。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNgUiIHmNmAADjz1f02qsAAfllwDc5CMAAOPn063.jpg[/img]
[b]最接近上帝的AlphaGo是怎么评估定式的呢?[/b]
        那么作为最强的围棋AI的AlphaGo,是怎么看待这些定式的呢?最近几天,Aja Huang在脸书上公布了AlphaGo的看法,让人耳目一新,千百年来我们的定式居然下的不对!
2AlphaGo VS 大雪崩定式
[b]AlphaGo VS 大雪崩定式[/b]
        大雪崩定式是常见的复杂定式,学围棋的时候要背好久。因为这个定式复杂变化多。我们先来看常见的:
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNVzCIcn31AAH_rTMfl2kAAflPwNdK9gAAf_F625.jpg[/img]
[b]白16内拐常见变化[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNVy6IZKgyAAIDnpkn52sAAflPwNSyQwAAgO2024.jpg[/img]
[b][color=rgb]黑1拐再3立之后黑9扳是最简明的下法,本图是内拐最简明并且最常见的下法[/color][/b]
[color=rgb][/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNV6CIZ5qyAAIVvFNIGBwAAflQAGy5R0AAhXU239.jpg[/img]
[b][color=rgb]黑9扳出也是一种下法,本图也是大雪崩中常见的一型[/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNVy6IZKgyAAIDnpkn52sAAflPwNSyQwAAgO2024.jpg[/img]
[b][color=rgb]白8不在10位粘先爬,是防止黑棋A位扳简明转身的下法,但是黑棋可以在11先贴,本图也是一直被认为大致两分[/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNWOaIEG9OAAIFuLWgKd8AAflQgDIBKgAAgXQ521.jpg[/img]
[b]这个变化AlphaGo认为黑棋亏了,但人类认为是两分的[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNWTGIPiQoAAH6sTauYuAAAflQgPzAAEAAfrJ343.jpg[/img]
[b][color=rgb]黑11打是阿法狗认为的最佳下法[/color][/b]
[color=rgb][/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNWVKIbRcqAAH66pnWaH4AAflQwI0yGwAAfsC954.jpg[/img]
[b][color=rgb]如果让AlphaGo强行下成大雪崩,给出的答案是:黑1立完以后5冷静的跳[/color][/b]
[color=rgb][/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNWZCIMGXGAAIAYisXMxsAAflRAGRtYEAAgB6907.jpg[/img]
[b][color=rgb]后续阿法狗认为,白棋不让黑棋7先手便宜到是关键,白8一定要反击,如此双方可战黑将不利减到最小[/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNWf2IU_k4AAIBMZEEZuUAAflRQFLESIAAgFJ843.jpg[/img]
[b][color=rgb]黑如先手7位挡住,再9逼的话白棋会10位反击,如此也是白棋好一点的战斗[/color][/b]
        那么AlphaGo是怎么认为的呢?AlphaGo并不会下大雪崩定式,于是给出了上门的判断,至此,困扰棋界多年的大雪崩定式被AlphaGo交易了一下,宣告新的走法,并且应该是基于全局的目前最优解。
3AlphaGo VS 妖刀定式
AlphaGo VS 妖刀定式
        AlphaGo对于妖道定式的全新理解与观念,是Aja Huang博士在自己的脸书上公布的,并且可以随意引用。在欧洲围棋大会,樊麾老师谈到了AlphaGo对大雪崩定式的看法。AlphaGo对妖刀定式又有什么看法呢?图1就是妖刀定式的基本型。在Master与职业棋士的对局中出现过图2的变化,AlphaGo认为白4靠不好,至黑19拆边,白棋的胜率下降近15个百分点。图3是AlphaGo所认为的双方最佳下法。如果图3中的黑5选择图4的挡下,至白12将形成战斗,AlphaGo认为白棋稍微有利。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNY5CIWP3CAAHFXPF-6cYAAflWQL7Oy0AAcV0364.jpg[/img]
[b]妖刀定式的基本型[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNY46IHfb2AAHXPSHW9asAAflWQL43h0AAddV534.jpg[/img]
[b]这是Master年初对局的变化,AlphaGo认为白4不好,胜率下降15%!!![/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNY4qIOFnjAAHd1YnPtWsAAflWQL0NLQAAd3t656.jpg[/img]
[b]AlphaGo认为的正解,这是五子棋吗?[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNY4iIaoQSAAHS_XkcMyIAAflWQLvlokAAdMV829.jpg[/img]
[b]这个变化认为白子有利一点[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZEiISN0pAADPYr8sBZYAAflXAC-JXkAAM96778.jpg[/img]
[b]人类棋手的实战[/b]
        图3的三路跳已经有职业棋手在正式比赛中下过(图5)。在这个局部,AlphaGo的下法(白1至11)与党毅飞九段是一致的,并且AlphaGo认为全局仍然是双方均势。胜率下降15%是什么概念?保守估计换算成日韩规则,要亏一目以上,以后妖道将不再妖刀……
4AlphaGo VS 大斜定式
AlphaGo VS 大斜定式
        大斜定式是黄博士最后一个公布的AlphaGo眼中的“定式”,其实在AlphaGo眼中,就没有大斜定式,因为白的大飞它认为并不好。大家好,之前我们公布了AlphaGo对大雪崩定式与妖刀定式的看法,接着我们想向大家分享AlphaGo对大斜定式的看法。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZSGIGVSMAACSqoHurN0AAflXgHY0BgAAJLC994.jpg[/img]
[b]1,大斜定式基本型[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNZUaIGUcMAACUfobAMX0AAflXgNnJ78AAJSW345.jpg[/img]
[b]AlphaGo的选择,注意白3的位置,和大斜定式的落子位置不同……[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZZSIPFKkAACUGrRS6egAAflYADTWt8AAJQy129.jpg[/img]
[b]在这个场合下,AlphaGo会下大斜的走法,是一种场合下法而非定式[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZceIQVV5AACYHNfPEG4AAflYAKD-mwAAJg0130.jpg[/img]
[b]AlphaGo认为双方的理想下法,白4飘逸灵动的布局让人耳目一新[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZgyID7wqAACjQMdq-SkAAflYQHEi-UAAKNY328.jpg[/img]
[b]AlphaGo认为双方均势的一个变化[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZjOIWfISAACm2RNmqKgAAflYQOqmNAAAKbx966.jpg[/img]
[b]另外一个均势的下法,强调黑8、10的手段[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNZnmITrAMAACdQVsoVqAAAflYgL-kPUAAJ1Z818.jpg[/img]
[b]这个变化白稍好[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZpiIEDnrAACg19-eHcMAAflYgNOCuUAAKDv672.jpg[/img]
[b]黑稍差[/b]
        图1是大斜定式的基本型。简单来说,在一般的情况下AlphaGo认为大斜不如A位飞压,所以AlphaGo并不会下大斜定式。在这个局面,AlphaGo会选择图2的下法。不过,在三间低夹的情况下(图3),AlphaGo是会下大斜的,这个局部的棋形在Master与职业棋士的对局中也出现过。接下来形成很多种可能的变化,图4至图7都是AlphaGo所认为双方可能的下法,并且AlphaGo都认为双方均势。其中,图6与图7的黑8扳再黑10挡是AlphaGo所强调的手段。在图3的局面如果黑棋选择尖顶,会形成图8的变化,AlphaGo认为白棋稍好。图5的黑7如果扳,则会形成图9的变化,AlphaGo认为黑棋稍差。
        至此,人类认为三大难解的定式,AlphaGo都给出了自己的答案……
5如果你看过《棋魂》
如果你看过《棋魂》
        《棋魂》是曾经风靡一度的漫画和动画片。让人最伤心的莫过于随着虎次郎棋盘血迹的变淡,Sai也感知到自己要消失,这段当年的笔者看的直落泪……然而现在,作为围棋爱好者,也要怀着一样的心情送别AlphaGo.
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNaI6IVcJsAAT_VKFF8tcAAflZQH8rz8ABP9s469.jpg[/img]
[b]黄博士脸书上伤感的告白[/b]
        在今年乌镇的围棋峰会上,Deepmind就宣布中止了AlphaGo关于围棋项目的研究,AlphaGo进入倒计时。与柯洁三盘棋的复盘纪录片、新的论文以及AlphaGo的教学工具将给是AlphaGo的绝唱,江湖将只剩下一个需要仰望的高大背影离去。
        在谷歌第一篇论文的参考下,腾讯绝艺团队的围棋AI有了很大的进步,现在野狐平台上对职业棋手已经是胜多负少,甚至让子棋都有很高的胜率,这就是AlphaGo带给我们的变革,而在两年前,计算机围棋水平不过业余六段左右,被一线职业杀的落花流水,并且普遍认为计算机围棋距离赢职业九段还太远,现在这一切都已经被颠覆了。
6Deepmind改玩星际了!
Deepmind改玩星际了!
        前几天,Deepmind宣布,为了让全世界的开发者能够更好的开发出对抗即时战略游戏的AI,和暴雪娱乐一起,推出了关于星际2的机器学习开发套装。在Github上可以下载。
这些工具包括:
        脚本 AI API
        基于图像 AI API (功能图层):
        文档,示例代码和示例机器人
        支持离线AI与AI播放
        1v1天梯游戏的replay套件*
        支持Windows与Mac
        API完整功能的Linux软件包
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJ1mNejiIJpGLAAM5CnfKeAgAAflhgJP66oAAzki248.jpg[/img]
[b]人的动作行为与机器(Agent)模仿,非常难[/b]
        对于星际2的研究还处于很早期的阶段。由于玩家可以采用超过300种的基本行动,与Atari游戏相比,Atari游戏只有大约10个动作(例如上,下,左,右等),所以这对《星际争霸2》的空间研究带来了巨大挑战。除此之外,《星际争霸》中的操作动作是分级的,人们可以自由修改和扩充操作路径,即使是84x84的小屏幕尺寸,也可能有大约1亿个可能的动作。在新公布的API中,你可以自己动手来构建任务与模型,减少研发难度。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNexSIMo1nAAgKbsB1cjIAAfliACB3LEACAqG505.jpg[/img]
[b]AI实现的小区域操作[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNeqOIcRQeAAQhmWZtx_QAAflhwD1Qu0ABCGx927.jpg[/img]
[b]AI眼中不同层的行动,非常复杂,目前只能在一个小区域里进行操作[/b]
        Deepmind声明,感谢暴雪提供的百万份天梯比赛录像,目前研发的自主学习AI尚处初级阶段,甚至在完整地图中,连脚本程式的简单电脑都打不过。而执行微操与预判战术只能在小地图中完成,并且需要耗费大量时间运算才能进行下一步。
        不过这就是Deepmind研究的动力,同过机器学习来解决复杂的问题,并且实现方式是通过模拟人大脑的神经,不难不复杂的问题解决起来也没有成就感。年初在Deepmind的招聘广告上,要求的都是神经科学的博士以及计算机的博士,前不久还发表了相关的论文,认为这是实现通用型AI(比如既能下围棋、打星际,也能自动驾驶)的实现方式。我们迫不及待的期待这些AI研究机构能够开发出更多强力的AI、早日实现通用型AI,以解放我们的生产力。

luorowe 2017-8-14 23:14

感觉人类迟早被AI秒杀,AI的觉醒只是时间问题了

bugrider 2017-8-15 10:12

从此以后下棋不走定势——虽然不能做到和狗神似,至少也可以形似嘛,嘿嘿。

bwwarmouse1 2017-8-15 21:09

就是昨天的新闻,OPENAI制做的AI,学了几天DOTA2之后,赢了国外一个知名选手,而且只用了15分钟。
有时候看到这种新闻,觉得还是很可怕的,说不定哪天机器人就统治地球了

i0i0l9l9 2017-8-15 21:42

其实 星际这类的游戏,电脑要碾压人类很正常,理由就是
人类的操作是有限的,电脑的操作可以同时几路操作,而且战斗时微操到200以上的时候
基本上没有人能够抗住电脑了
更不用说几线作战,但是电脑能够做到,它可用控制每一个兵力
人类很难很难做到

wgzyd 2017-8-17 23:55

标题党啦……不过星际怎么看都没什么难度,比围棋差远了
页: [1]
查看完整版本: 碾压人类!Deepmind拆解定式玩星际2![31P]