当前位置:   article > 正文

Python selenium

Python selenium

1.搭建环境

1.安装:

pip install msedge-selenium-tools

不要使用pip install selenium,我的电脑上没法运行

2.下载驱动  

Microsoft Edge WebDriver |Microsoft Edge 开发人员

edge浏览器点设置---关于即可找到版本号,一定要下载对应版本的驱动 

我的电脑是64位的,下载了x64的,但是运行时报错:OSError: [WinError 216] 该版本的 %1 与你运行的 Windows 版本不兼容。请查看计算机的系统信息,然后联系软件发布者。

下载win32的selenium解决

又报错:ValueError: Timeout value connect was <object object at 0x000001C609CC8630>, but it must be an int, float or None.

python selenium报错ValueError: Timeout value connect was <...>, but it must be an int, float or None._raise valueerror( valueerror: timeout value connec-CSDN博客

python selenium报错ValueError: Timeout value connect was <...>, but it must be an int, float or None._raise valueerror( valueerror: timeout value connec-CSDN博客 

 继续报错:ModuleNotFoundError: No module named 'urllib3.packages.six.moves'
  1. pip show selenium
  2. Name: selenium
  3. Version: 3.141.0
  4. Summary: Python bindings for Selenium
  5. Home-page: https://github.com/SeleniumHQ/selenium/
  6. Author: UNKNOWN
  7. Author-email: UNKNOWN
  8. License: Apache 2.0
  9. Location: C:\Users\15269\AppData\Local\Programs\Python\Python312\Lib\site-packages
  10. Requires: urllib3
  11. Required-by: msedge-selenium-tools

重装1.26.12的urllib3解决(我使用的是python3.12)如果还不行就多换几个试试 

测试代码
  1. from msedge.selenium_tools import Edge, EdgeOptions
  2. options = EdgeOptions()
  3. options.use_chromium = True
  4. options.add_experimental_option('excludeSwitches',['enable-automation']) # 开启开发者模式
  5. options.add_argument('--disable-blink-features=AutomationControlled') # 禁用启用Blink运行时的功能
  6. options.binary_location = r'C:\Program Files (x86)\Microsoft\EdgeCore\113.0.1774.50\msedge.exe'
  7. url = 'https://www.baidu.com/'
  8. driver = Edge(options=options, executable_path='./msedgedriver.exe')
  9. driver.get(url)

二、带有用户数据的爬虫参考

以下内容转载自这位大佬的博客:

使用 Selenium 启动的 Chrome 浏览器,默认是无法使用本地数据的,如表单项、密码、Cookies 等。

原因分析

这是由于 Selenium 在启动 Chrome 时,默认将命令行参数 --user-data-dir(该参数用于设置用户数据目录)设为了一个“临时目录”,如下图所示:

在 Selenium 启动的 Chrome 浏览器的地址栏中输出 chrome://version 并回车,就可以打开上图这个界面。

查看默认的用户数据目录的

手动打开一个 Chrome 浏览器,在地址栏中输出 chrome://version 并回车,找到 Profile Path: 后面的路径,去掉最后的 \Default,就是默认的用户数据目录,它一般都是:C:\Users\Your_User_Name\AppData\Local\Google\Chrome\User Data

将默认的用户数据目录设为 Selenium 启动的 Chrome 的用户数据目录

代码如下:

  1. import time
  2. from selenium import webdriver
  3. from selenium.webdriver.chrome.service import Service
  4. options = webdriver.ChromeOptions()
  5. options.add_argument(r'user-data-dir=C:\Users\Your_User_Name\AppData\Local\Google\Chrome\User Data')
  6. # --user-data-dir 前的两个短杠似乎有没有均可
  7. browser = webdriver.Chrome(
  8. options=options,
  9. service=Service() # 需要将 Chrome 驱动放在此文件的同一目录下
  10. )
  11. browser.get('https://mail.163.com/') # 此处以 163 邮箱为例,因为 163 邮箱的 Cookies 可以在本地保存 30 天。
  12. time.sleep(120)

对于edge浏览器:edge://version/

三、实战应用

stm官网登录

登陆界面网址:登录注册 (stmicroelectronics.cn)

右键检查,找到用户名&密码&登录按钮的路径,并写出相应js代码。之后在控制台测试

  1. document.getElementById("username").value = "你的用户名"
  2. document.getElementById("password").value = "你的密码"
  3. document.querySelector(".an_lan").click() //登录

 完整代码

  1. from msedge.selenium_tools import Edge, EdgeOptions
  2. class Demo:
  3. def __init__(self) -> None:
  4. #keep alive为True,即处理完后不会关闭edge
  5. options = EdgeOptions()
  6. options.use_chromium = True
  7. options.add_experimental_option('excludeSwitches',['enable-automation']) # 开启开发者模式
  8. #用户数据
  9. #options.add_argument(r'user-data-dir=C:\Users\15269\AppData\Local\Microsoft\Edge\User Data')
  10. options.add_argument('--disable-blink-features=AutomationControlled') # 禁用启用Blink运行时的功能
  11. options.binary_location = r'C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe'
  12. self.webdriver = Edge("./msedgedriver.exe", keep_alive=True, options=options)
  13. self.login_url = r"https://sso.stmicroelectronics.cn/User/LoginByPassword"
  14. self.username = "。。。"
  15. self.password = "@。。。"
  16. def login(self):
  17. payload = f"""
  18. document.getElementById("username").value = "{self.username}"
  19. document.getElementById("password").value = "{self.password}"
  20. document.querySelector(".an_lan").click() //登录
  21. """
  22. self.webdriver.get(self.login_url)
  23. self.webdriver.execute_script(payload)
  24. def run(self):
  25. self.login()
  26. if __name__ == "__main__":
  27. Demo().run()

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/527312
推荐阅读
相关标签
  

闽ICP备14008679号