赞
踩
已解决(selenium模块操作浏览器报错)selenium.common.exceptions.TimeoutException: Message: script timeout
粉丝群里面的一个粉丝用selenium模块操作浏览器爬取网页数据,但是发生了报错(跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错信息和代码如下:
chrome_options.add_argument('--proxy-server=http://%s' % proxies['http']) # 添加代理
# chrome_options.add_argument('--headless')
# chrome_options.add_argument('--disable-gpu')
# 添加请求头伪装浏览器
chrome_options.add_argument(
'user-agent=%s' % random.choice(ua_list))
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.implicitly_wait(20)
# 启动浏览器,获取网页源代码
driver = webdriver.Chrome(chrome_options=chrome_options)
with open(r'E:\Python\stealth.min.js') as f:
js = f.read()
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": js
})
driver.get(url)
html_str = driver.page_source
print(html_str)
# 翻页
for i in range(2, 20):
page = str(i)
# print(html_str)
js = "pageSkip('%s')" % page
driver.execute_script(js)
time.sleep(10)
html_str = driver.page_source
报错信息截图如下所示:
报错信息翻译:
硒。超时异常:消息:脚本超时
报错原因:
跟等待时间挂钩的,然后就是元素定位问题,所以问题可能出在定位元素找不到上了。小伙伴按下面的方式解决即可!!!
1. 浏览器元素加载的等待时间设置久一点:
driver.implicitly_wait(60)
2. Selenium希望在异步脚本完成后触发回调。如果没有返回任何内容,则脚本超时开始并抛出一个错误,重复运行:
try:
js = "pageSkip('%s')" % page
driver.execute_script(js)
time.sleep(10)
html_str = driver.page_source
get_data(html_str, page)
time.sleep(30)
except:
js = "pageSkip('%s')" % page
driver.execute_script(js)
time.sleep(10)
html_str = driver.page_source
get_data(html_str, page)
time.sleep(30)
以上是此问题报错原因的解决方法,欢迎评论区留言讨论是否能解决,如果有用欢迎点赞收藏文章谢谢支持,博主才有动力持续记录遇到的问题!!!
由于博主时间精力有限,每天私信人数太多,没办法每个粉丝都及时回复,所以优先回复VIP粉丝,可以通过订阅限时9.9付费专栏《100天精通Python从入门到就业》进入千人全栈VIP答疑群,获得优先解答机会(代码指导、远程服务),白嫖80G学习资料大礼包,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html
优点:作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会),此专栏文章是专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试!
专栏福利:简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等
注意:如果希望得到及时回复,订阅专栏后私信博主进千人VIP答疑群
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。