当前位置:   article > 正文

基于C的α-β剪枝算法实现的AI五子棋游戏_c++基于博弈树五子棋算法

c++基于博弈树五子棋算法
源码下载  http://www.byamd.xyz/hui-zong-1/

  • 1
  • 2

对抗问题

对抗问题:顾名思义,博弈双方是带有对抗性质的。博弈的任何一方都希望局面尽量对自己有利,同时局面也应该尽量令对方不利。通常这一类问题可以通过 Minimax 算法解决。

Minimax 算法又名极小化极大算法,是一种找出失败的最大可能性中的最小值的算法。

Minimax 算法常用于棋类等由两方较量的游戏和程序,这类程序由两个游戏者轮流,每次执行一个步骤。

为了执行Minimax 算法,我们可以通过穷举的方式,枚举所有的状态空间,从而使得我们可以在游戏刚一开始,就预测到输赢。

但是,在实际情况下,游戏的状态空间都是异常庞大的。很显然,我们不能将以穷举方式实 现的Minimax 算法用于实际应用。

α-β 减枝

通过分析可以发现,在利用穷举方法执行 Minimax 算法中有许多的无效搜索,也就是说,许多明显较劣的状态分支我们也进行搜索了。

我们在进行极大值搜索的时候,我们仅仅关心,下面最大的状态,对于任何小于目前值 的分支也都是完全没有必要进行进一步检查的。(α 减枝)

通过上图,我们可以发现,我们可以减去大量无用的状态检查,从而降低我们的运算量。

同时,我们在进行极小值搜索的时候,我们仅仅关心,下面最小的状态,对于任何大于 目前值的分支都是完全没有必要进行进一步检查的。(β 减枝)

通过上图,我们可以发现,我们可以减去大量无用的状态检查,从而降低我们的运算量。 将上述所提到的 α 减枝与 β 减枝进行综合就可以得到 α-β 减枝。

对于对抗搜索而言,我们需要精心设计其估值函数,不然我们的 α-β 减枝将毫无用武之地。

五子棋问题

五子棋:**是一种两人对弈的纯策略型棋类游戏,通常双方分别使用黑白两色的棋子,下在棋 盘直线与横线的交叉点上,先形成 5 子连线者获胜。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mAP1sahi-1617337657924)(media/4e9ed78b0312128f30ed0dde6f043b13.jpeg)]
这里,我们采用了极大极小博弈树(MGT),来实现AI

这里用一张井字棋的搜索示意图来说明。

上图很清晰的展示了对局可能出现的所有情况(已经去除了等价的情况),如果让这个图延展下去,我们就相当于穷举了所有的下法,如果我们能在知道所有下法的情况下,对这 些下法加以判断,我们的AI 自然就可以选择具有最高获胜可能的位置来下棋。
极大极小博弈树就是一种选择方法,由于五子棋以及大多数博弈类游戏是无法穷举出所有可能的步骤的(状态会随着博弈树的扩展而呈指数级增长),所以通常我们只会扩展有限的层数,而 AI 的智能高低,通常就会取决于能够扩展的层数,层数越高,AI 了解的信息就越多, 就越能做出有利于它的判断。
为了让计算机选择那些获胜可能性高的步骤走,我们就需要一个对局面进行打分的算法, 越有利,算法给出的分数越高。在得到这个算法过后,计算机就可以进行选择了,在极大极小博弈树上的选择规则是这样的:
AI 会选择子树中具有最高估值叶子节点的路径;
USER 会选择子树中具有最小估值叶子节点的路径。
这样的原则很容易理解,作为玩家,我所选择的子一定要使自己的利益最大化,而相应 的在考虑对手的时候,也不要低估他,一定要假设他会走对他自己最有利,也就是对我最不 利的那一步。
接下来,我们实现关键的局面评分步骤:
直接分析整个棋面是一件很复杂的事情,为了让其具备可分析性,我们可以将其进行分 解,分解成易于我们理解和实现的子问题。
对于一个二维的期面,五子棋不同于围棋,五子棋的胜负只取决于一条线上的棋子,所 以根据五子棋的这一特征,我们就来考虑将二维的棋面转换为一维的,下面是一种简单的思 考方式,对于整个棋盘,我们只需要考虑四个方向即可,所以我们就按照四个方向来将棋盘 转换为 15 * 6 个长度不超过 15 的一维向量(分解斜向的时候,需要分为上下两个半区),参考下图:

我们的目的是为了为其评分,那么我们就还需要评估每个线状态,将每个线状态的评分进行汇总,当做我们的棋面评分:

接下来我们所要做的就是评价每一条线状态,根据五子棋的规则,我们可以很容易穷举出各种可能出现的基本棋型,我们首先为这些基本棋型进行识别和评价, 并且统计每个线状态中出现了多少种下面所述的棋型,并据此得出评价值,得到如下图所示的静态估值表:

根据这个表以及我们之前所谈到的规则,我们就可以得到一个可以运行的AI 了。

进一步的优化

注意到,如果我们搜索到第四层,总共需要搜索:

224 + 224 * 223 + 224 * 223 * 222 + 224 * 223 * 222 * 221 = 2 461 884 544 个 状

态节点,搜索如此多的状态节点的开销是十分可观的,因此,我们提高效率的方式就锁定到了:如何减少需要搜索的状态节点。

我们可以采取以下方法来减少需要搜索的状态节点:

我们可以利用经典的α-β剪枝算法对博弈树剪枝。
我们可以每次搜索仅搜索落子点周围 2*2 格范围内存在棋子的位置,这样可以避免搜索一些明显无用的节点,而且可以大幅度提升整体搜索速度。
避免对必胜/负局面搜索,当搜索过程中出现了必胜/负局面的时候直接返回不再搜索, 因为此时继续搜索是没有必要的,直接返回当前棋局的估价值即可。
加入随机化AI 的下棋方式,普通的AI 算法对于给定的玩家下棋方式会给出固定的回应, 这就导致玩家获胜一次之后只要此后每次都按此方式下棋,都能够获胜。为了避免这种 情况,可以在 AI 选择下子位置的时候,在估值相差不多的几个位置中随机挑选一个进行放置,以此增加AI 的灵活性。
规划搜索顺序,有很多有价值的下子点存在于更靠近棋盘中央的地方,如果从棋盘中央 向外搜索的话,则能够提高α-β剪枝的效率,让尽可能多的分支被排除。

实验成果

(游戏中间界面)

(游戏中间界面)

实验总结

通过本次实验,加强了组员之间的沟通协调能力,同时也提高了我们对αβ减枝算法的 了解。我们更了解了五子棋相关的游戏规则以及一些技巧,拓宽了我们的知识面,有助于我 们在未来的生活中更好的与人交流。
同时,经过此次实验,我们深入了解了棋类人工智能算法,进一步的提升了我们的专业 水平,有助于我们在未来的就业与科研岗位上走的更远。
虽然αβ减枝实现起来非常容易,但是五子棋的局势估计却十分的有挑战性,其局势估 计的准确与否直接影响了程序的运行结果是否令人满意,AI 是否能够展现出足够的智能。
本次实验,由周宇星(1352652)和蔡乐文(1353100)完成。其中,周宇星设计并完成 了五子棋布局的估价函数,与蔡乐文共同完成了αβ减枝算法的研究与实现。蔡乐文设计并 完成了有关程序界面以及操作的功能。

源代码

#include “opencv2/imgproc/imgproc.hpp” #include “opencv2/imgcodecs.hpp”
#include “opencv2/videoio/videoio.hpp” #include “opencv2/highgui/highgui.hpp”

#include <iostream>

#include <iostream> #include <cstdio> #include <cstring> #include
<cstdio> #include <cstdlib> #include <iomanip>

using namespace std; using namespace cv;

//sro 菜神 Orz

cv::Mat chessboard, whiteChess, blackChess, tmp, BGS;

int is_red(Vec3b X) {

// cout << (int)X[1] << ’ ’ << (int)X[2] << ’ ’ << (int)X[3] <<
endl;

return X[0] < 200 && X[1] < 200 && X[2] > 230;

}

cv::Mat BG;

//将棋子复制到背景画面上

void imageCopyToBG(cv::Mat chess, int x, int y) {

x *= 35;

y *= 35;

int rows = chess.rows;

int cols = chess.cols;

for (int i = 0; i < rows; ++i) {

for (int j = 0; j < cols; ++j) {

if (!is_red(chess.at<Vec3b>(i, j))) {

BG.at<Vec3b>(x + i + 8, y

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/336393
推荐阅读
相关标签
  

闽ICP备14008679号