1,令人惊愕的AlphaZero
2017年12月6日再次传来Deepmind的消息,通用 棋类AI AlphaZero诞生,翻篇之快令人惊诧。
Deepmind的围棋AI不必细述,就在去年的三月15日之前人们还普遍认为,围棋棋软要战胜人类顶端棋手还尚需时日,有的甚至认为要50年、100年。而事实是在三日以内AlphaGo战胜围棋世界冠军,让人类“脱帽致敬”。然而,AlphaGo并没止步2017年初,它的升级版maste连续辗轧世界级顶尖围棋高手60人无有败绩,而后马不停蹄十月份推出AlphaGoZero,能够自学围棋,不需要人类知识,并轻松战胜之前所有级别的AlphaGo,令世人惊愕不已。而今天的是通用的棋类AI,自学一天搞定所有棋类。
DeepMind团队描述了一个通用棋类AI“AlphaZero”,在不同棋类游戏中,战胜了所有对手,而这些对手都是各自领域的顶级AI:
<!--[if !supportLists]-->· <!--[endif]-->战胜最强国际象棋AI Stockfish:28胜,0负,72平;
<!--[if !supportLists]-->· <!--[endif]-->战胜最强将棋AI Elmo:90胜,2平,8负;
<!--[if !supportLists]-->· <!--[endif]-->战胜最强围棋AI AlphaGo Zero:60胜,40负
显然,它轻松战胜了所有棋类的强AI,而这些AI即便是人类顶尖棋手也是望尘莫及的,所以,无疑AlphaZero统治了所的棋类。因为,在AlphaZero看来,这些棋类只是规则不同而已,均属于“完全信息博弈”,应对如出一辙。
至此我们可以清楚的认识到人类在主要棋种的对弈已经彻底不是机器的对手,将来也不会有另外的结果。至此也可以证明棋类进入到历史的一个新阶段。
2,奇袭象棋,是当今首款经过科学设计的“不完全信息博弈类”棋种,不论从形式上还是从对弈的过程上与象棋都只有微小差异。会下象棋的一分钟上手:
(奇袭象棋外观和象棋无异)
棋的改进:只对车马炮做正反面互为标异名的改革,奇袭子的具体设计。
1, 两个“车”的背面,一个标“马”、一个标“炮”。
2, 两个“马”的背面,一个标“车”、一个标“炮”。
3, 两个“,炮”的背面,一个标“车”、一个标“马”。
4,“车、马”子两只; “车、炮”子两只; “马、炮”子两只。仍然是成双成对。
改进后的这些棋子 称之为奇袭子,布子彼此暗面保密,可以翻子使用,原位翻子并记作一步棋,走子按明面标名同原象棋。
规则:只有在奇袭子有损失(比如被吃掉一只炮)后才产生翻子权力(是否翻子、何时翻子棋手自定),每一方任何时候盘面上的车、马、炮数不得超出两个(保证除翻子过程外看上去就是原象棋),一局棋一方翻子次数在3(有建议两次的)次以内,可以反复翻子。(规则要实践中不断完善)
产生的效果:在表面和原象棋无丝毫差异的前提下,可以产生100种不同的暗面布局,每一种布局的变化是原来的3的12次方倍(大概50多万倍,自己计算的或不准确)。象棋原来的招法、棋谱可以或明、或暗、或明暗结合地运用。总的讲,就是只有在翻子的瞬间才可以看出来是一种新棋,不翻子或翻子过后看上去就是原象棋。可以减少和棋出现,可以贴切运用兵法,有了更多一些的心理较量。
3.奇袭象棋或可结束AI对人类棋手的碾压
从去年三月中旬开始,围棋AI阿尔法狗的热度一波高过一波,直到2017年12月6号,通用棋类的AI
AlphaZero问世,标志者人工智能彻底占领了棋类游戏这一过去人们认为的与人类智慧关系最为密切的高地。标志着棋类的发展进入一个新的历史时代。
AlphaZero,虽然没有学习对弈其他棋类,但是目前所有的棋种几乎都是属于“完全信息博弈”,都是和围棋、国际象棋、日本将棋相类似的,而其中公认最为复杂的就是围棋。所有,其他的棋种被
AlphaZero轻松征服,顺理成章。
奇袭象棋的最突出特征就是可以意图隐蔽,是一款“不完全信息博弈”棋,在对弈过程中,按照规则只要具有“翻子权利”,只要盘面上还有车、马、炮这三种棋子,就可以有隐蔽意图可能。
意图隐蔽将形成 一个 或 多个 “节点” 存在 “不可知”,虽然AI极其强大,但是仍然依靠的对庞大局面数量的搜索完成决策,而搜索过程中一点遇上“不可知”,必将搜索进程“中断”,而中断会限制机器的搜索深度。
另一方面,由于每一个“奇袭子” 都处于一种“不确定状态”或者叫“概率性的可变功能状态”,面对的是“表里都相同、表同里不同、里同表不同、表里都不同”的可以模拟“真真假假、虚虚实实”的复杂状态。很多时候,可以说是因人而异,没有规则可寻,依靠直觉走棋。
限制搜索深度会给人类棋手带来一定的抗衡机会,而靠直觉走棋会充分发挥人类智慧的灵活性,对同一局面可以迅速作出完全不同甚至相反决策,这或许是AI望尘莫及的地方。