当前位置:   article > 正文

人工智能之MinMax算法-MinMax算法实现三子棋_本关任务:学习人工智能博弈算法中的 minmax 算法,并实现三子棋在人机对战中的下一

本关任务:学习人工智能博弈算法中的 minmax 算法,并实现三子棋在人机对战中的下一

头歌题目

任务描述

本关任务:学习人工智能博弈算法中的 MinMax 算法,并实现三子棋在人机对战中的下一步棋的预测。

三子棋,相当有意思的传统民间游戏,又名九宫棋、圈圈叉叉等。在一个3×3的棋盘上,初始为空,每次 X 先下一棋子,然后 O 下一棋子,例如下图棋盘状态,下一步轮到 X 下棋子,落在中间,第2列的 X 形成了一条直线,则判定执 X 棋子的选手获得了胜利(胜利的状态为 X 或者 O 率先由3个棋子完成一条直线,可以是水平、垂直和对角线)。

在本关卡中,空白3×3棋盘先下 X 棋子,然后 O 棋子,给定一个中间棋盘状态,预测下一步 X 的落子位置,使得执 X 棋子的选手必定能获得胜利。

相关知识

为了完成本关任务,你需要掌握:1. MinMax 搜索,2.评估函数,3.构造函数,4.求解思路。

MinMax 搜索

类似三子棋的游戏都是两人参与的游戏,假设 MAX 选手先行,随后 MIN 选手,两人轮流出招,直到游戏结束,其中游戏可以用形式化方法表示为如下的一类搜索问题:

  • S0​:初始状态,规范游戏开始时的情况;

  • PLAYER(s):定义此时该谁行动;

  • ACTION(s):返回此状态下的合法移动集合;

  • RESULT(s,a):转移模型,定义行动的结果;

  • TERMINAL−TEST(s):终止测试,游戏结束返回真,否则返回假。游戏结束的状态称为终止状态;

  • UTILITY(s,p):效用函数(也可以称之为评估函数或收益函数),定义游戏者p在终止状态s下的数值。一般的,在国际象棋或三字棋的游戏中,结果是赢、输或平,分别赋予数值+1、−1或0。

初始状态、ACTION和RESULT定义了游戏的博弈树,其中结点是状态,边是移动。如下图三字棋的部分博弈树,初始状态下 MAX 有九种可能的棋招,游戏轮流进行, MAX 下 X , MIN 下 O ,直到博弈树达到了树的终止状态,叶子结点上的数字是该终止状态下对于 MAX 来说的效用值,值越大对 MAX 越有利。

给定一棵博弈树,最优策略可以通过检查每个结点的 极小极大值 来决定,记为 MINMAX(n) 。假设两个游戏者始终按照最优策略行棋,那么结点的极小极大值就是对应状态的效用值(对于 MAX 而言)。显然,最终状态的极小极大值就是它的效用值自身。进一步,对于给定的选择, MAX 喜欢移动到有极大值的状态,而 MIN 喜欢移动到有极小值的状态,因此算法得名为极大极小值算法(或极小极大值算法),所以得到如下公式:

极小极大值算法从当前状态计算极小极大决策,借助递归算法计算每个后继的极小极大值,可以实现上图公式的定义。递归算法自上而下一直前进到树的叶子结点,然后随着递归回溯通过搜索树把极小极大值回传。算法伪代码如下:

极小极大值算法对博弈树执行完整的深度优先搜索,如果树的最大深度为m,在每个结点合法的行棋有b个,那么极小极大值算法的时间复杂度为O(bm),空间复杂度为O(bm)。显然,这种指数级的时间开销是非常巨大的,通常需要制定一些剪枝策略。

评估函数

根据上面效用值的定义,评估函数实际上就是计算终止状态下 MAX 的效用值,不同的游戏有着不同的评估策略,在本关的三子棋中,一个简单的评估策略就是MAX赢了效用值为+1,输了效用值为−1,平局则是0。

构造函数

在行棋的游戏博弈中,每一次行棋都会改变棋盘的状态,棋盘中的空闲格子也会随之减少,直接对应着博弈树中的结点的子结点的变换,因此在构造博弈树时需要考虑结点的后继的产生,另外,一个合理的后继序列会很大程度上减少时间开销,例如在围棋等大的棋盘游戏中,处于边缘的空闲棋子可以忽略不计。

求解思路

本关卡为三子棋博弈,给定某个棋盘状态,当前 X 行棋, O 随后轮流行棋,因此,该棋盘状态为博弈树的根结点,以空闲格子为根结点的后继子结点,对每个子结点改变棋盘的状态,即 X 落子(随后在递归建树的过程中,判断是 X 还是 O 落子可以借助博弈树的深度的奇偶性来决定),依次类推,递归建树。

然后实现 MINMAX 算法,计算博弈树中各个结点的效用值。对于根结点来说,效用值为+1,则说明 X 有必胜策略,该策略的下一步行动为子结点中效用值为+1的落子,此时的棋盘状态即为本关所求。

编程要求

本关的编程任务是补全右侧代码片段 buildTree 、minmax 、max_value 、 min_value 、get_value 和 isTerminal 中 Begin 至 End 中间的代码,具体要求如下:

  • 在 buildTree 中,以递归的方式创建一棵博弈树,初始传入参数为博弈树的根结点;

  • 在 minmax 中,完成 MinMax 算法主体部分,初始传入参数为博弈树的根结点,返回下一步 X 棋子落位后的棋盘状态(特别的,该棋子落位情况使得执 X 棋子的选手必定能获得胜利)。另外,可能有多个解,所以将所有解存入列表并作为函数返回值,无解则是返回一个空列表; 例如以下测试案例,X 落位于中间位置,不管之后 O 如何下棋子,X 都能获得胜利。

  • 在 max_value 中,计算该博弈树结点的子结点中的最大的评估值,并返回;

  • 在 min_value 中,计算该博弈树结点的子结点中的最小的评估值,并返回;

  • 在 get_value 中,计算最终棋盘状态执 X 棋子的评估值并返回( 1 表示胜利,-1 表示失败,0 表示平局);

  • 在 isTerminal 中,判断该博弈树结点的棋盘状态是否为最终棋盘状态,即无空位可以下棋子(或该博弈树结点无子结点)。

测试说明

平台将自动编译补全后的代码,并生成若干组测试数据,接着根据程序的输出判断程序是否正确。

以下是平台的测试样例:

测试输入: xox o_o x 预期输出: best move way: x o x
o x o
_ x _

特别提醒,注意对象的深拷贝和浅拷贝的使用!!!

  1. # -*- coding:utf-8 -*-
  2. import copy # 注意对象的深拷贝和浅拷贝的使用!!!
  3. class GameNode:
  4. '''博弈树结点数据结构
  5. 成员变量:
  6. map - list[[]] 二维列表,三子棋盘状态
  7. val - int 该棋盘状态对执x棋子的评估值,1表示胜利,-1表示失败,0表示平局
  8. deepID - int 博弈树的层次深度,根节点deepID=0
  9. parent - GameNode,父结点
  10. children - list[GameNode] 子结点列表
  11. '''
  12. def __init__(self, map, val=0, deepID=0, parent=None, children=[]):
  13. self.map = map
  14. self.val = val
  15. self.deepID = deepID
  16. self.parent = parent
  17. self.children = children
  18. class GameTree:
  19. '''博弈树结点数据结构
  20. 成员变量:
  21. root - GameNode 博弈树根结点
  22. 成员函数:
  23. buildTree - 创建博弈树
  24. '''
  25. def __init__(self, root):
  26. self.root = root # GameNode 博弈树根结点
  27. def buildTree(self, root):
  28. '''递归法创建博弈树
  29. 参数:
  30. root - GameNode 初始为博弈树根结点
  31. '''
  32. #请在这里补充代码,完成本关任务
  33. #********** Begin **********#
  34. ##创建root的子节点
  35. ###fuc用来调用判断是否最终状态的函数
  36. mm=MinMax(False)
  37. if mm.isTerminal(root):
  38. root.val=mm.get_value(root)
  39. return
  40. ##递归遍历创造新的节点
  41. li=root.map
  42. val=0
  43. for i in range(3):
  44. for j in range(3):
  45. if li[i][j]=='x' or li[i][j]=='o':
  46. continue
  47. newLi=copy.deepcopy(li)
  48. newLi[i][j]='o' if root.deepID%2>0 else 'x'
  49. newNode=GameNode(map=newLi,parent=root,deepID=(root.deepID+1),children=[],val=0)
  50. root.children.append(newNode)
  51. self.buildTree(newNode)
  52. if root.deepID%2>0:
  53. root.val=mm.min_value(root)
  54. else:
  55. root.val=mm.max_value(root)
  56. #********** End **********#
  57. class MinMax:
  58. '''博弈树结点数据结构
  59. 成员变量:
  60. game_tree - GameTree 博弈树
  61. 成员函数:
  62. minmax - 极大极小值算法,计算最优行动
  63. max_val - 计算最大值
  64. min_val - 计算最小值
  65. get_val - 计算某棋盘状态中:执x棋子的评估值,1表示胜利,-1表示失败,0表示平局
  66. isTerminal - 判断某状态是否为最终状态:无空闲棋可走
  67. '''
  68. def __init__(self, game_tree):
  69. self.game_tree = game_tree # GameTree 博弈树
  70. def minmax(self, node):
  71. '''极大极小值算法,计算最优行动
  72. 参数:
  73. node - GameNode 博弈树结点
  74. 返回值:
  75. clf - list[map] 最优行动,即x棋子的下一个棋盘状态GameNode.map
  76. 其中,map - list[[]] 二维列表,三子棋盘状态
  77. '''
  78. #请在这里补充代码,完成本关任务
  79. #********** Begin **********#
  80. val=node.val
  81. result=[]
  82. if val>0:
  83. for i in node.children:
  84. if i.val==val:
  85. result.append(i.map)
  86. return result
  87. #********** End **********#
  88. def max_value(self, node):
  89. '''计算最大值
  90. 参数:
  91. node - GameNode 博弈树结点
  92. 返回值:
  93. clf - int 子结点中的最大的评估值
  94. '''
  95. #请在这里补充代码,完成本关任务
  96. #********** Begin **********#
  97. li=node.children
  98. max=-1
  99. for i in node.children:
  100. max=i.val if i.val>max else max
  101. return max
  102. #********** End **********#
  103. def min_value(self, node):
  104. '''计算最小值
  105. 参数:
  106. node - GameNode 博弈树结点
  107. 返回值:
  108. clf - int 子结点中的最小的评估值
  109. '''
  110. #请在这里补充代码,完成本关任务
  111. #********** Begin **********#
  112. li=node.children
  113. min=1
  114. for i in node.children:
  115. min=i.val if i.val<min else min
  116. return min
  117. #********** End **********#
  118. def get_value(self, node):
  119. '''计算某棋盘状态中:执x棋子的评估值,1表示胜利,-1表示失败,0表示平局
  120. 参数:
  121. node - GameNode 博弈树结点
  122. 返回值:
  123. clf - int 执x棋子的评估值,1表示胜利,-1表示失败,0表示平局
  124. '''
  125. #请在这里补充代码,完成本关任务
  126. #********** Begin **********#
  127. li=node.map
  128. isEndI=1
  129. isEndJ=1
  130. ##判断行列上是否存在直线
  131. for i in range(3):
  132. isEndI=0 if li[i][0]=='_' else 1
  133. isEndJ=0 if li[0][i]=='_' else 1
  134. for j in range(3):
  135. if li[i][j]=='_' or (isEndI>0 and li[i][j]!=li[i][0]):
  136. isEndI=0
  137. if li[j][i]=='_' or (isEndJ>0 and li[j][i]!=li[0][i]):
  138. isEndJ=0
  139. if isEndI+isEndJ<1:
  140. break
  141. if isEndI>0:
  142. return 1 if li[i][0]=='x' else -1
  143. if isEndJ>0:
  144. return 1 if li[0][i]=='x' else -1
  145. ##判断斜线上是否存在直线
  146. isEndR=0 if li[0][0]=='_' else 1
  147. isEndL=0 if li[2][0]=='_' else 1
  148. for i in range(3):
  149. if li[i][i]=='_' or (isEndR>0 and li[i][i]!=li[0][0]):
  150. isEndR=0
  151. if li[2-i][i]=='_' or (isEndL>0 and li[2-i][i]!=li[2][0]):
  152. isEndL=0
  153. if isEndR+isEndL<0:
  154. break
  155. if isEndR>0:
  156. return 1 if li[0][0]=='x' else -1
  157. if isEndL>0:
  158. return 1 if li[2][0]=='x' else -1
  159. return 0
  160. #********** End **********#
  161. def isTerminal(self, node):
  162. '''判断某状态是否为最终状态:无空闲棋可走(无子结点)
  163. 参数:
  164. node - GameNode 博弈树结点
  165. 返回值:
  166. clf - bool 是最终状态,返回True,否则返回False
  167. '''
  168. #请在这里补充代码,完成本关任务
  169. #********** Begin **********#
  170. li=node.map
  171. ##判断是否还有空位
  172. isFull=1
  173. for i in range(3):
  174. for j in range(3):
  175. if li[i][j]=='_':
  176. isFull=0
  177. break
  178. if isFull==0:
  179. break
  180. if isFull>0:
  181. return True
  182. isEndI=1
  183. isEndJ=1
  184. ##判断行列上是否存在直线
  185. for i in range(3):
  186. isEndI=1
  187. isEndJ=1
  188. for j in range(3):
  189. if li[i][j]=='_' or (isEndI>0 and li[i][j]!=li[i][0]):
  190. isEndI=0
  191. if li[j][i]=='_' or (isEndJ>0 and li[j][i]!=li[0][i]):
  192. isEndJ=0
  193. if isEndI+isEndJ<1:
  194. break
  195. if isEndI+isEndJ>0:
  196. return True
  197. ##判断斜线上是否存在直线
  198. isEndR=1
  199. isEndL=1
  200. for i in range(3):
  201. if li[i][i]=='_' or (isEndR>0 and li[i][i]!=li[0][0]):
  202. isEndR=0
  203. if li[2-i][i]=='_' or (isEndL>0 and li[2-i][i]!=li[0][2]):
  204. isEndL=0
  205. if isEndR+isEndL<0:
  206. break
  207. if isEndR+isEndL>1:
  208. return True
  209. return False
  210. #********** End **********#

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/786145
推荐阅读
相关标签
  

闽ICP备14008679号