当前位置:   article > 正文

Python辅助-找图功能(你还在用pyautogui?)_python屏幕找图

python屏幕找图

前言

在游戏的脚本类辅助中,避免不了一个功能,那就是找图返回图像在屏幕上的坐标,对于找图功能,现成的方法,现成的脚本工具数不胜数,但是至于精度那就不好说了。举个现成方法的例子,在python自动化中,pyautogui有个方法为locateOnScreen(image="图片路径"),其作用为在桌面上找到路径中设置的图片,并返回坐标元组,这个方法能找到图的前提是所传路径图和桌面图完全一致,即必须100%匹配,这是一个缺点也是优点,例如找桌面图标,我图标换个地方摆,它可能就找不到了,因为背景变了。另外举个现成工具例子,在按键精灵中自带找图功能,而且很方便,一般的找图完全适用,且可以设置图像匹配率,但是在某些情况下他还是无法胜任,也是因为某些游戏背景是处于一个动态变换的原因。这里分享一个通过python完成一个可多参数控制的识图功能。

涉及的算法

不要怕,最后我会将自己封装的工具方法发出来,直接复制粘贴传参就行,要传的参数见下方可控参数。

本文章的图像识别主要用到的是基于SIFT检测算法,在图像识别这块,浅度的识别比较知名的有SIFT、SURF、ORB,而SIFT是精度最高的一种,他能在不同尺度、旋转、光照变化和视角变化的情况下都能保持较好的检测性能。

可控参数

max_init_num:最大搜索系数,范围0.1~1,系数越小精度越高,建议不要高于0.5(我给你建议那就是因为自己测试过),当然我们这里会做成一个从0.1循环搜索图片,自增到我们设置的最大系数。

trees:索引树数量,数量越大,精度越高,但相应的耗时越高,建议100

checks:索引树遍历次数,数量越大,精度越高,但相应耗时越高,建议1000

img_url:即要匹配的图像的路径(注意路径不可含有中文,图片名也不可含有中文)

功能目的

即在屏幕上找到我们期望的图片,并返回位置信息

所需库

  1. import os
  2. import cv2
  3. import pyautogui

正文

第一步:获取两张图片数据

因为是要在屏幕找图,所以直接用pyautogui直接全屏截图对比即可,截下来的图会自动保存到当前目录,最后面用os删掉就行了

语句解释:通过screenshot截取了全屏图片命名为screen.png并放在当前目录下,然后通过cv2.imread分别读取截取的屏幕图的图像数据和我们期望寻找的图像的数据,返回的数据是一个numpy数组,若为彩色图像则是一个三维的numpy数组。

  1. pyautogui.screenshot(imageFilename="screen.png")
  2. screenPic=cv2.imread("screen.png")
  3. img_url=r"C:\testpic\wx.png"
  4. myPic=cv2.imread(img_url)

第二步:获取两张图关键点和描述符

要获取图像的关键点和描述符就需要SIFT对象,通过cv2创建即可,然后经过sift对象的检测和计算获取到两张图的监测点和描述符。

  1. sift=cv2.SIFT_create()
  2. screenPicKP,screenPicDES=sift.detectAndCompute(screenPic,None)
  3. myPicKP,myPicDES=sift.detectAndCompute(myPic,None)

第三步:准备匹配器

这里就用到了我们所说的可控参数,索引树数量,索引树遍历次数。

这里我选择了Flann匹配器,因为简单且直接,对于小型数据集或实时应用运算速度较快。

语句解释:

如下indexParams表示定义索引数量,searcheParams表示定义单个索引遍历次数,这两个参数是构成Flann匹配器的基本条件,因此再通过cv2.FlannBasedMatcher传入参数就得到了flann匹配器了。

  1. trees=100
  2. checks=1000
  3. indexParams=dict(algorithm=0,trees=int(trees))
  4. searcheParams=dict(checks=int(checks))
  5. flann=cv2.FlannBasedMatcher(indexParams,searcheParams)

第四步:开始匹配获取匹配结果集

解释:调用flann匹配器的knn匹配法,传入两张图的描述符数据,k表示要返回的最近邻的数量。然后通过sorted方法根据描述符中特征点的距离distance进行一个排序,因为后面会取中位数作为最优匹配

  1. matches=flann.knnMatch(screenPicDES,myPicDES,k=2)
  2. matches=sorted(matches,key=lambda x:x[0].distance)

第五步:筛选最优匹配输出坐标

解释:

x,y用于存放最后找到图返回的坐标,没找到就是None

max_init_num是我们的可控参数,表示期望最大的匹配率,建议0.3~0.5,过小会找不到,过大会找错。

如下定义的循环条件是当初始匹配系数小于我们设置的最大系数时,就不断进行循环查找最优匹配并填充坐标值

最后我们通过os移除了截屏的图片

  1. x, y = None, None
  2. max_init_num=0.4
  3. init_num=0.1
  4. init_num=float(init_num)
  5. while init_num<=max_init_num:
  6. goodMatches=[]
  7. for m,n in matches:
  8. if m.distance<init_num*n.distance:
  9. goodMatches.append(m)
  10. index=int(len(goodMatches)/2)
  11. try:
  12. x,y=screenPicKP[goodMatches[index].queryIdx].pt
  13. break
  14. except:
  15. init_num=init_num+0.1
  16. os.remove("screen.png")
  17. print("图像在屏幕上的x坐标为:"+str(x))
  18. print("图像在屏幕上的y坐标为:"+str(y))

测试:

初步测试

首先测试能否找图,可以看到找到图并获取到了坐标,然后用pyautogui.moveTo将鼠标自动移上去了。

模糊测试

我向图片添加了三次马赛克进行了模糊处理,这种识图方法依旧能够识别到,可见其识别能力还是很不错的,这里用的最大搜索系数为0.1

封装为方法:

  1. import os
  2. import cv2
  3. import pyautogui
  4. """
  5. 全屏幕找图,返回图坐标x,y,没找到图则返回None,None
  6. max_init_num:最大搜索系数,0.1~1.0,越低越精确,建议不要高于0.5,
  7. trees:索引树数量,建议100
  8. checks:索引树遍历次数,建议1000
  9. img_url:要找的图的文件路径(路径不能含有中文,图片名不能含有有中文)
  10. """
  11. def FindImgOnScreen(max_init_num,trees,checks,img_url):
  12. init_num=0.1
  13. #截取屏幕图
  14. pyautogui.screenshot(imageFilename="screen.png")
  15. #读取屏幕图
  16. screenPic=cv2.imread("screen.png")
  17. #要匹配的图
  18. myPic=cv2.imread(img_url)
  19. #获取两图关键点和描述符
  20. sift=cv2.SIFT_create()
  21. screenPicKP,screenPicDES=sift.detectAndCompute(screenPic,None)
  22. myPicKP,myPicDES=sift.detectAndCompute(myPic,None)
  23. #获取FLANN匹配器
  24. indexParams=dict(algorithm=0,trees=int(trees))
  25. searcheParams=dict(checks=int(checks))
  26. flann=cv2.FlannBasedMatcher(indexParams,searcheParams)
  27. #FLANN匹配器进行KNN匹配
  28. matches=flann.knnMatch(screenPicDES,myPicDES,k=2)
  29. #根据描述符距离排序
  30. matches=sorted(matches,key=lambda x:x[0].distance)
  31. #筛选优秀匹配
  32. x, y = None, None
  33. init_num=float(init_num)
  34. while init_num<=max_init_num:
  35. goodMatches=[]
  36. for m,n in matches:
  37. if m.distance<init_num*n.distance:
  38. goodMatches.append(m)
  39. #获取最佳坐标
  40. index=int(len(goodMatches)/2)
  41. try:
  42. x,y=screenPicKP[goodMatches[index].queryIdx].pt
  43. return x,y
  44. except:
  45. init_num=init_num+0.1
  46. os.remove("screen.png")
  47. return x,y

附上自己的资源站

源码资源尽在https://www.tbszyw.com 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/787575
推荐阅读
相关标签
  

闽ICP备14008679号