赞
踩
日常使用计算机,命令行程序可以说是为批量操作文件而生,但作为普通用户,最多的还是通过鼠标键盘操作形形色色的图形界面程序。试想下面一个场景:有成千上万个文件,都需要通过图形界面进行同样的一套编辑、保存工作,靠手工一遍一遍地重复做,累死人不说,时间久了必然出现错误,作为程序猿,怎么能忍重复3次以上的工作,必须利用程序自动化。要想图形界面也能像命令行程序那样精确控制,就需要GUI自动化工具了。不得不赞Python生态之丰富,GUI自动化自动化工具也有多种库可选,比如Windows平台的pywin32
,以及本文主角——跨平台的PyAutoGUI
。
目录
pywin32
直接包装了几乎所有的Windows API,可以方便地从Python直接调用,把Windows API按照功能分了一些大类,每一个大类作为一个模块,常见如win32api
、win32gui
、win32com
等,其中win32com
使用微软独门的COM
接口技术进行进程间通信,可以实现控制GUI程序。但前提是,这些程序得支持COM
接口。win32api
则更加原始,完全通过Win32 API调用获得/生成窗口句柄、发送消息事件,十分繁琐。
PyAutoGUI
的思路与此完全不同,它是接管了鼠标、键盘使用权,基本上完全照搬人的操作,底层不必套牢在Windows系统,没错,它是跨平台的。官网地址:https://github.com/asweigart/pyautogui。原本,这类GUI自动化工具的初衷是给GUI程序自动化测试用,产生点击鼠标、敲击键盘的行为,在日志中记录下消息事件和GUI程序的响应结果,事后分析GUI程序可能存在的bug。不过,既然能产生点击鼠标、敲击键盘的行为,我们就可以用来控制GUI程序批量完成文件编辑、保存工作。
按照官方的说法,PyAutoGUI
给人类用的GUI自动化神器,简单高效、函数分类清晰,它被awesome-python、awesome-python-cn收录。
推荐通过pip安装,一行命令搞定。
python -m pip install -U pyautogui
PyAutoGUI
依赖于pyscreeze
、pymsgbox
、pytweening
,上述命令会自动安装这3个库。安装完成后可以发现,在site-packages\pyautogui
有6个文件,名字带java、osx、win、x11的是在不同平台的实现方案,再在__init__.py
和__main__.py
中检测当前系统平台进行封装。其中,java平台的实现文件为空,猜测是未来计划支持的,先占个坑。
- __init__.py
- __main__.py
- _pyautogui_java.py # 空文件,猜测是未来支持
- _pyautogui_osx.py
- _pyautogui_win.py
- _pyautogui_x11.py
PyAutoGUI
设计简洁,相关符号经过内部import之后,被封装在pyautogui
单个模块中,因此Python程序中只要import pyautogui
之后便可通过.
符号访问pyautogui
中的函数、变量。pyautogui
中函数大致分为通用功能、鼠标控制、键盘控制、消息窗口、截图5大类。
- import pyautogui
-
- a = pyautogui.size() # 获取屏幕尺寸(分辨率×分辨率)
- print(a)
- #输出:Size(width=1920, height=1080)
-
- a = pyautogui.position() # 获取鼠标当前位置
- print(a)
- #输出:Point(x=960, y=540)
-
- a = pyautogui.onScreen(100,200) # 判断坐标是否在屏幕范围内
- print(a)
- #输出:True
-
- a = pyautogui.onScreen(100,2000) # 判断坐标是否在屏幕范围内
- print(a)
- #输出:False
坐标体系至关重要,后续鼠标位置、图片大小都根据这套体系定义。PyAutoGUI
沿用了传统的坐标体系,并未重新定义,如下图所示。x的取值范围是[0, 宽度分辨率-1],y的取值范围是[0, 高度分辨率-1]。
鼠标移动,包括绝对位置移动和相对位置移动。
- import pyautogui
-
- x,y = pyautogui.size() # 保存屏幕尺寸
-
- # 绝对位置移动,移动至屏幕正中心,鼠标移动过渡时间duration设为1秒
- pyautogui.moveTo(x/2,y/2,duration = 1)
-
- # 相对位置移动,向右100、向上200,鼠标移动过渡时间duration设为0.5秒
- pyautogui.moveRel(100, -200, duration = 0.5)
鼠标点击,一个click()
函数把点鼠标的活包干,过程也可分解为mouseDown()
、mouseUp()
;另有在click()
之上封装的rightClick()
、middleClick()
、doubleClick()
、tripleClick()
等函数。鼠标点击之前允许指定要移动的目标位置,若目标位置不在运行当前Python程序的终端/IDE范围内,则可能对其他GUI程序触发鼠标点击事件,从而引起其响应,即焦点移动至其他GUI程序。
- # 移动至屏幕中心点击一下左键,过渡时间0.5秒
- pyautogui.click(x/2,x/2, duration=0.5)
-
- # 不指定x、y,在当前位置点击一下右键
- pyautogui.click(button = 'right')
-
- # 移动至(100,100)点击3次左键,点击间隔0.1s,鼠标移动过渡时间0.5秒
- pyautogui.click(100,100, clicks = 3,interval = 0.1,duration = 0.5)
-
- # 移动至(100,100)点击2次右键,点击间隔0.5s,鼠标移动过渡时间0.2秒
- pyautogui.click(100,100, clicks = 2,interval = 0.5,button =' right',duration = 0.2)
滚动鼠标滚轮。
- # 鼠标位置不动,向上回滚2个单位,项目文档对滚动量参数说明不详
- pyautogui.scroll(2)
-
- # 鼠标移动至(1000,700),前下滚动10个单位
- pyautogui.scroll(-10,1000,700)
- # 运行发现鼠标并没有动
鼠标拖曳,指从当前位置按下鼠标,移动至目标位置再释放的过程,指定目标位置同样有绝对位置和相对位置两种方式,和移动鼠标函数很像。另外,试用下来,未发现drag()
函数和dragRel()
的差异。
- # 将鼠标从当前位置拖至屏幕中心,默认左键
- pyautogui.dragTo(x/2,x/2)
-
- # 将鼠标从当前位置向左100像素、向右200像素拖动,过渡时间0.5秒,指定右键
- pyautogui.dragRel(-100,200,duration = 0.5,button = 'right')
控制按键,也是一个press()
函数基本把活包干,按键动作往细分解包含keyDown()
和keyUp()
两个过程;在此基础上封装,有typewrite()
和hotkey()
两个高阶一点的函数,分别用于输入字符串和按快捷键。
- # 键名用字符串表示,支持的所有键名,存在pyautogui.KEYBOARD_KEYS变量中,包括26个字母、数字、符号、F1~F20、方向等等所有按键
- pyautogui.press('a') # 按字母A键,字母支持大小写
-
- # 程序向终端输入了字符a,若程序运行时输入法为中文状态,由于没有继续输入空格或回车,输入法仅列出候选字,并不会输入到终端
- 打字输出:a
-
- # 传入键名列表(按键p、按键y、空格),按键之间间隔0.1秒(默认0)
- pyautogui.press(['p','y','space'], interval = 0.1)
-
- # 运行前将输入法切换到中文状态,往终端直接输入了“便宜”
- 打字输出:便宜
-
-
- # typewrite方式一:传入字符串,不支持中文字符,因为函数无法知道输入法需要什么按键才能得到中文字符
- pyautogui.typewrite('hello,\n PyAutoGUI')
-
- # 程序把字符串"'hello, PyAutoGUI!"和换行符输入到了终端
- 打字输出:hello,
- PyAutoGUI
-
-
- # typewrite方式二:传入键名列表,按键之间间隔0.1秒(默认0)
- pyautogui.typewrite(['s','r','f','space'], interval=0.1)
-
- # 运行前将输入法切换到中文状态,往终端直接输入了“输入法”3个字
- 打字输出:输入法
-
- # 大小写字母是自动支持的,仍然尝试一次切换到大写
- pyautogui.typewrite(['capslock','p','y'])
-
- # CapsLock按键灯被点亮,程序往终端输入了"PY"
- 打字输出:PY
-
-
- # hotkey屏蔽了需要反复keyDown、keyUp的细节,参数是任意个键名,而非列表
- pyautogui.hotkey('ctrl', 'shift', 'esc') #调出任务管理器
-
- pyautogui.hotkey('alt','ctrl','delete') #调出重启界面,但运行未调出
PyAutoGUI
利用pymsgbox
的功能,以JavaScript风格函数提供消息框功能,包括alert()
、confirm()
、prompt()
、password()
,连参数都是一致的,熟悉JavaScript的朋友不会陌生。
- import pyautogui
-
- a = pyautogui.alert(text = '警告',title = 'PyAutoGUI消息框',button = 'OK')
- print(a)
- 输出: OK # 点击的按键被返回
- a = pyautogui.confirm(text = '请选择',title = 'PyAutoGUI消息框',buttons = ['1','2','3'])
- print(a)
- 输出:2 #选择的按键被返回
- a = pyautogui.prompt(text='请输入',title='PyAutoGUI消息框',default='请输入')
- print(a)
- 输出:by anou.
- a = pyautogui.password(text = '输入密码',title = 'PyAutoGUI消息框',default = '',mask = '*')
- 输出:anmou.
前文只是PyAutoGUI
相关函数的说明,要真正熟悉它,必须结合具体任务。现有这样一个任务,成千上万个CAD图分布在几十个文件夹中,需要对每个图进行编辑操作,假使这个操作就是简单旋转下视角,再保存。AutoCAD程序本身是有脚本功能的,因此可以利用AutoCAD来完成本任务,综合考虑以下原因促使我转向PyAutoGUI
的路线上来:
PyAutoGUI
更花时间;PyAutoGUI
熟悉GUI控制后,可以套在别的GUI程序上,未来仍有使用价值,如果使用AutoCAD则始终被限定在AutoCAD的操作范围内,价值低,而且与第一条相悖。决定走PyAutoGUI
的路线,做了如下工作:
操作函数代码。
- import os
- import pyautogui as pag
-
- __sizex__, __sizey__ = pag.size() #获得屏幕尺寸
-
- def cad_turn(cad_file, outd):
- '''
- cad_file : 要操作的CAD文件
- outd : 文件输出路径
- '''
-
- c = pag.locateCenterOnScreen(__icon_open__, region=(0,0,__sizex__/10,__sizey__/20) ) # 打开图标,图标事先截图保存
- pag.moveTo(*c, duration=0.05)
- pag.click( button="left") # 点击打开按钮
-
- pag.moveRel(__sizex__/4, __sizey__/4) # 确保文件打开窗口获得焦点
- pag.typewrite(message=cad_file,interval=0.1) # 输入文件路径
- pag.press('enter')
-
- c = pag.locateCenterOnScreen(__icon_view__, region=(__sizex__/4, 0,__sizex__/2, __sizey__/10) ) # 旋转视图图标
- pag.moveTo(*c, duration=2)
- pag.click(clicks=7, interval=1, button="left") # 点击旋转视角按钮
-
- c = pag.locateCenterOnScreen(__icon_saveas__, region=(0, 0, __sizex__/10, __sizey__/20) ) # 另存为图标
- pag.moveTo(*c, duration=0.2)
- pag.click( button="left") # 点击另存为按钮
-
- pag.moveRel(__sizex__/4, __sizey__/4) # 确保文件打开窗口获得焦点
- pag.typewrite(message=os.path.join(out, fbase+'-se'), interval=0.1) # 输入保存路径
- pag.press('enter')
-
- # 关闭所有可能存在的窗口,避免占用太多内存
- while( True ):
- try :
- pag.moveTo(__sizex__/2, __sizey__/2, duration=0.3) # 延时
- c = pag.locateCenterOnScreen(__icon_close__, region=(__sizex__/5, 0, __sizex__*3/5, __sizey__/20) )
- pag.moveTo(*c, duration=0.1) # 移到“x”按钮
- pag.click( button="left") # 点击“x”按钮
- except TypeError:
- break
主函数代码。
- if __name__ == "__main__":
- p = r'x/y/z/CAD文件所在路径'
- cad_src = glob_file_list( p, r"*.DXF") # 匹配出要操作的文件
- total = len(cad_src)
- if(total == 0):
- print('无文件需处理,退出...')
- try:
- for idx,x in enumerate(cad_src, start=1):
- print("[{}/{}] 处理{}...".format(idx, total, x))
- cad_turn(x, "out")
- except Exception as e:
- print("错误:{}".format(e))
开启看图软件,输入法切换到英文状态,再运行Python程序。
PyAutoGui仅支持控制键鼠,想要检测键鼠,需要另一个库PyHook3
安装过程较复杂 建议查看我的另一篇博文
Python小白·暗某人的博客:PyHook3安装(亲测有用)
相关文章:
At5uto的博文:PyHook3简明教程
- import pythoncom
- import PyHook3
-
- hm = PyHook3.HookManager()
-
-
- # 鼠标事件处理函数
- def OnMouseEvent(event):
- print('MessageName:',event.MessageName) #事件名称
- print('Message:',event.Message) #windows消息常量
- print('Time:',event.Time) #事件发生的时间戳
- print('Window:',event.Window) #窗口句柄
- print('WindowName:',event.WindowName) #窗口标题
- print('Position:',event.Position) #事件发生时相对于整个屏幕的坐标
- print('Wheel:',event.Wheel) #鼠标滚轮
- print('Injected:',event.Injected) #判断这个事件是否由程序方式生成,而不是正常的人为触发。
- print('---')
-
- # 返回True代表将事件继续传给其他句柄,为False则停止传递,即被拦截
- return True
-
- #键盘事件处理函数
- def OnKeyboardEvent(event):
- print('MessageName:',event.MessageName) #同上,共同属性不再赘述
- print('Message:',event.Message)
- print('Time:',event.Time)
- print('Window:',event.Window)
- print('WindowName:',event.WindowName)
- print('Ascii:', event.Ascii, chr(event.Ascii)) #按键的ASCII码
- print('Key:', event.Key) #按键的名称
- print('KeyID:', event.KeyID) #按键的虚拟键值
- print('ScanCode:', event.ScanCode) #按键扫描码
- print('Extended:', event.Extended) #判断是否为增强键盘的扩展键
- print('Injected:', event.Injected)
- print('Alt', event.Alt) #是某同时按下Alt
- print('Transition', event.Transition) #判断转换状态
- print('---')
-
- # 同上
- return True
-
- #绑定事件处理函数
- hm.MouseAllButtonsDown = OnMouseEvent #将OnMouseEvent函数绑定到MouseAllButtonsDown事件上
- hm.KeyDown = OnKeyboardEvent #将OnKeyboardEvent函数绑定到KeyDown事件上
-
- hm.HookMouse() #设置鼠标钩子
- hm.HookKeyboard() #设置键盘钩子
-
- pythoncom.PumpMessages()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。