SexInSex! Board » IT新闻科技最前线(关闭) » 碾压人类！Deepmind拆解定式玩星际2！[31P]

查看完整版本: 碾压人类！Deepmind拆解定式玩星际2！[31P]

更深的藍 2017-8-14 19:47

碾压人类！Deepmind拆解定式玩星际2！[31P]

1需要点基础围棋知识
      【中关村在线原创】在乌镇围棋大会之后直到最近几天，Deepmind的AlphaGo项目负责人之一Aja Huang博士结束了休假，又恰逢欧洲围棋大会，带给了全世界围棋爱好者一个“上帝视角”看三大复杂定式的解说，定式就此改写。然后，Deepmind宣布与暴雪联合弄出了机器学习打星际的API，连游戏也要沦陷了……
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNhVGIZAojAAUKVZTxzxEAAflnwIqhIYABQpt458.jpg[/img]
[b]需要点围棋基础知识[/b]
      在理解本文之前，我们需要铺垫一些基础知识。关于围棋基本规则的，大家可以通过网上的几分钟教学视频大致了解一下，简单来说，就是无气要被提子，两个眼才是活期。那么什么是定式呢？
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNgDeIbOP-AABsS0tbp-YAAflkgPelmEAAGxj147.gif[/img]
[b]定式的落子位置、方向、次序不能错[/b]
      定式这个词起源于中国古代。古代围棋对弈前要在四个角的星位放上黑白各两个子，然后再对弈，规则与今天的并不一样。围棋素有“金角银边草肚皮”的说法，角部可以用更少的子围出更多的空地，但是围绕角部的战斗也更激烈。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNgOqILl-tAAQPEib7NVcAAfllQNEszwABA8q032.jpg[/img]
要想不吃亏，学棋这种定式大全要能熟背很多[/b]
      在以千百年计的对弈中，人们总结出来了很多对双方看起来“五五开”的落子位置与顺序，这个称之为定式。但围棋盘的交叉点很多，所以定式也多，《定式大全》是厚厚的2本书，而随着规则的进化，定式也在变化。在众多定式当中，有三个定式公认的难解，人类棋手表示搞不清复杂的变化，着三个定式分别是大雪崩定式、定式以及大斜定式。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNgUiIHmNmAADjz1f02qsAAfllwDc5CMAAOPn063.jpg[/img]
[b]最接近上帝的AlphaGo是怎么评估定式的呢？[/b]
      那么作为最强的围棋AI的AlphaGo，是怎么看待这些定式的呢？最近几天，Aja Huang在脸书上公布了AlphaGo的看法，让人耳目一新，千百年来我们的定式居然下的不对！
2AlphaGo VS 大雪崩定式
[b]AlphaGo VS 大雪崩定式[/b]
      大雪崩定式是常见的复杂定式，学围棋的时候要背好久。因为这个定式复杂变化多。我们先来看常见的：
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNVzCIcn31AAH_rTMfl2kAAflPwNdK9gAAf_F625.jpg[/img]
[b]白16内拐常见变化[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNVy6IZKgyAAIDnpkn52sAAflPwNSyQwAAgO2024.jpg[/img]
[b][color=rgb]黑1拐再3立之后黑9扳是最简明的下法，本图是内拐最简明并且最常见的下法[/color][/b]
[color=rgb][/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNV6CIZ5qyAAIVvFNIGBwAAflQAGy5R0AAhXU239.jpg[/img]
[b][color=rgb]黑9扳出也是一种下法，本图也是大雪崩中常见的一型[/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNVy6IZKgyAAIDnpkn52sAAflPwNSyQwAAgO2024.jpg[/img]
[b][color=rgb]白8不在10位粘先爬，是防止黑棋A位扳简明转身的下法，但是黑棋可以在11先贴，本图也是一直被认为大致两分[/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNWOaIEG9OAAIFuLWgKd8AAflQgDIBKgAAgXQ521.jpg[/img]
[b]这个变化AlphaGo认为黑棋亏了，但人类认为是两分的[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNWTGIPiQoAAH6sTauYuAAAflQgPzAAEAAfrJ343.jpg[/img]
[b][color=rgb]黑11打是阿法狗认为的最佳下法[/color][/b]
[color=rgb][/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNWVKIbRcqAAH66pnWaH4AAflQwI0yGwAAfsC954.jpg[/img]
[b][color=rgb]如果让AlphaGo强行下成大雪崩，给出的答案是：黑1立完以后5冷静的跳[/color][/b]
[color=rgb][/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNWZCIMGXGAAIAYisXMxsAAflRAGRtYEAAgB6907.jpg[/img]
[b][color=rgb]后续阿法狗认为，白棋不让黑棋7先手便宜到是关键，白8一定要反击，如此双方可战黑将不利减到最小[/color][/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNWf2IU_k4AAIBMZEEZuUAAflRQFLESIAAgFJ843.jpg[/img]
[b][color=rgb]黑如先手7位挡住，再9逼的话白棋会10位反击，如此也是白棋好一点的战斗[/color][/b]
      那么AlphaGo是怎么认为的呢？AlphaGo并不会下大雪崩定式，于是给出了上门的判断，至此，困扰棋界多年的大雪崩定式被AlphaGo交易了一下，宣告新的走法，并且应该是基于全局的目前最优解。
3AlphaGo VS 妖刀定式
AlphaGo VS 妖刀定式
      AlphaGo对于妖道定式的全新理解与观念，是Aja Huang博士在自己的脸书上公布的，并且可以随意引用。在欧洲围棋大会，樊麾老师谈到了AlphaGo对大雪崩定式的看法。AlphaGo对妖刀定式又有什么看法呢？图1就是妖刀定式的基本型。在Master与职业棋士的对局中出现过图2的变化，AlphaGo认为白4靠不好，至黑19拆边，白棋的胜率下降近15个百分点。图3是AlphaGo所认为的双方最佳下法。如果图3中的黑5选择图4的挡下，至白12将形成战斗，AlphaGo认为白棋稍微有利。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNY5CIWP3CAAHFXPF-6cYAAflWQL7Oy0AAcV0364.jpg[/img]
[b]妖刀定式的基本型[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNY46IHfb2AAHXPSHW9asAAflWQL43h0AAddV534.jpg[/img]
[b]这是Master年初对局的变化，AlphaGo认为白4不好，胜率下降15%！！！[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNY4qIOFnjAAHd1YnPtWsAAflWQL0NLQAAd3t656.jpg[/img]
[b]AlphaGo认为的正解，这是五子棋吗？[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNY4iIaoQSAAHS_XkcMyIAAflWQLvlokAAdMV829.jpg[/img]
[b]这个变化认为白子有利一点[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZEiISN0pAADPYr8sBZYAAflXAC-JXkAAM96778.jpg[/img]
[b]人类棋手的实战[/b]
      图3的三路跳已经有职业棋手在正式比赛中下过(图5)。在这个局部，AlphaGo的下法(白1至11)与党毅飞九段是一致的，并且AlphaGo认为全局仍然是双方均势。胜率下降15%是什么概念？保守估计换算成日韩规则，要亏一目以上，以后妖道将不再妖刀……
4AlphaGo VS 大斜定式
AlphaGo VS 大斜定式
      大斜定式是黄博士最后一个公布的AlphaGo眼中的“定式”，其实在AlphaGo眼中，就没有大斜定式，因为白的大飞它认为并不好。大家好，之前我们公布了AlphaGo对大雪崩定式与妖刀定式的看法，接着我们想向大家分享AlphaGo对大斜定式的看法。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZSGIGVSMAACSqoHurN0AAflXgHY0BgAAJLC994.jpg[/img]
[b]1，大斜定式基本型[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNZUaIGUcMAACUfobAMX0AAflXgNnJ78AAJSW345.jpg[/img]
[b]AlphaGo的选择，注意白3的位置，和大斜定式的落子位置不同……[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZZSIPFKkAACUGrRS6egAAflYADTWt8AAJQy129.jpg[/img]
[b]在这个场合下，AlphaGo会下大斜的走法，是一种场合下法而非定式[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZceIQVV5AACYHNfPEG4AAflYAKD-mwAAJg0130.jpg[/img]
[b]AlphaGo认为双方的理想下法，白4飘逸灵动的布局让人耳目一新[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZgyID7wqAACjQMdq-SkAAflYQHEi-UAAKNY328.jpg[/img]
[b]AlphaGo认为双方均势的一个变化[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZjOIWfISAACm2RNmqKgAAflYQOqmNAAAKbx966.jpg[/img]
[b]另外一个均势的下法，强调黑8、10的手段[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJlmNZnmITrAMAACdQVsoVqAAAflYgL-kPUAAJ1Z818.jpg[/img]
[b]这个变化白稍好[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNZpiIEDnrAACg19-eHcMAAflYgNOCuUAAKDv672.jpg[/img]
[b]黑稍差[/b]
      图1是大斜定式的基本型。简单来说，在一般的情况下AlphaGo认为大斜不如A位飞压，所以AlphaGo并不会下大斜定式。在这个局面，AlphaGo会选择图2的下法。不过，在三间低夹的情况下(图3)，AlphaGo是会下大斜的，这个局部的棋形在Master与职业棋士的对局中也出现过。接下来形成很多种可能的变化，图4至图7都是AlphaGo所认为双方可能的下法，并且AlphaGo都认为双方均势。其中，图6与图7的黑8扳再黑10挡是AlphaGo所强调的手段。在图3的局面如果黑棋选择尖顶，会形成图8的变化，AlphaGo认为白棋稍好。图5的黑7如果扳，则会形成图9的变化，AlphaGo认为黑棋稍差。
      至此，人类认为三大难解的定式，AlphaGo都给出了自己的答案……
5如果你看过《棋魂》
如果你看过《棋魂》
      《棋魂》是曾经风靡一度的漫画和动画片。让人最伤心的莫过于随着虎次郎棋盘血迹的变淡，Sai也感知到自己要消失，这段当年的笔者看的直落泪……然而现在，作为围棋爱好者，也要怀着一样的心情送别AlphaGo.
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/08/ChMkJ1mNaI6IVcJsAAT_VKFF8tcAAflZQH8rz8ABP9s469.jpg[/img]
[b]黄博士脸书上伤感的告白[/b]
      在今年乌镇的围棋峰会上，Deepmind就宣布中止了AlphaGo关于围棋项目的研究，AlphaGo进入倒计时。与柯洁三盘棋的复盘纪录片、新的论文以及AlphaGo的教学工具将给是AlphaGo的绝唱，江湖将只剩下一个需要仰望的高大背影离去。
      在谷歌第一篇论文的参考下，腾讯绝艺团队的围棋AI有了很大的进步，现在野狐平台上对职业棋手已经是胜多负少，甚至让子棋都有很高的胜率，这就是AlphaGo带给我们的变革，而在两年前，计算机围棋水平不过业余六段左右，被一线职业杀的落花流水，并且普遍认为计算机围棋距离赢职业九段还太远，现在这一切都已经被颠覆了。
6Deepmind改玩星际了！
Deepmind改玩星际了！
      前几天，Deepmind宣布，为了让全世界的开发者能够更好的开发出对抗即时战略游戏的AI，和暴雪娱乐一起，推出了关于星际2的机器学习开发套装。在Github上可以下载。
这些工具包括：
      脚本 AI API
      基于图像 AI API （功能图层）：
      文档，示例代码和示例机器人
      支持离线AI与AI播放
      1v1天梯游戏的replay套件*
      支持Windows与Mac
      API完整功能的Linux软件包
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJ1mNejiIJpGLAAM5CnfKeAgAAflhgJP66oAAzki248.jpg[/img]
[b]人的动作行为与机器（Agent）模仿，非常难[/b]
      对于星际2的研究还处于很早期的阶段。由于玩家可以采用超过300种的基本行动，与Atari游戏相比，Atari游戏只有大约10个动作（例如上，下，左，右等），所以这对《星际争霸2》的空间研究带来了巨大挑战。除此之外，《星际争霸》中的操作动作是分级的，人们可以自由修改和扩充操作路径，即使是84x84的小屏幕尺寸，也可能有大约1亿个可能的动作。在新公布的API中，你可以自己动手来构建任务与模型，减少研发难度。
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNexSIMo1nAAgKbsB1cjIAAfliACB3LEACAqG505.jpg[/img]
[b]AI实现的小区域操作[/b]
[img]http://article.fd.zol-img.com.cn/t_s640x2000/g5/M00/0A/09/ChMkJlmNeqOIcRQeAAQhmWZtx_QAAflhwD1Qu0ABCGx927.jpg[/img]
[b]AI眼中不同层的行动，非常复杂，目前只能在一个小区域里进行操作[/b]
      Deepmind声明，感谢暴雪提供的百万份天梯比赛录像，目前研发的自主学习AI尚处初级阶段，甚至在完整地图中，连脚本程式的简单电脑都打不过。而执行微操与预判战术只能在小地图中完成，并且需要耗费大量时间运算才能进行下一步。
      不过这就是Deepmind研究的动力，同过机器学习来解决复杂的问题，并且实现方式是通过模拟人大脑的神经，不难不复杂的问题解决起来也没有成就感。年初在Deepmind的招聘广告上，要求的都是神经科学的博士以及计算机的博士，前不久还发表了相关的论文，认为这是实现通用型AI（比如既能下围棋、打星际，也能自动驾驶）的实现方式。我们迫不及待的期待这些AI研究机构能够开发出更多强力的AI、早日实现通用型AI，以解放我们的生产力。

luorowe 2017-8-14 23:14

感觉人类迟早被AI秒杀，AI的觉醒只是时间问题了

bugrider 2017-8-15 10:12

从此以后下棋不走定势——虽然不能做到和狗神似，至少也可以形似嘛，嘿嘿。

bwwarmouse1 2017-8-15 21:09

就是昨天的新闻，OPENAI制做的AI，学了几天DOTA2之后，赢了国外一个知名选手，而且只用了15分钟。
有时候看到这种新闻，觉得还是很可怕的，说不定哪天机器人就统治地球了

i0i0l9l9 2017-8-15 21:42

其实星际这类的游戏，电脑要碾压人类很正常，理由就是
人类的操作是有限的，电脑的操作可以同时几路操作，而且战斗时微操到200以上的时候
基本上没有人能够抗住电脑了
更不用说几线作战，但是电脑能够做到，它可用控制每一个兵力
人类很难很难做到

wgzyd 2017-8-17 23:55

标题党啦……不过星际怎么看都没什么难度，比围棋差远了

页: [1]

查看完整版本: 碾压人类！Deepmind拆解定式玩星际2！[31P]