赞
踩
看到很多人需要,但网上现成的代码都不能直接使用,所以特意分享一下。也可以用于获取各种跳转链接跳转后或者重定向后的url。
需要先安装selenium、chrome、chromedriver,具体教程可查看https://mp.csdn.net/console/editor/html/106006255,windows上的安装教程可自行上网搜索。
- #引入必需的模块
- from selenium import webdriver
- from selenium.webdriver.chrome.options import Options
-
-
-
-
- #原始url,链接是网上找的,这里只做演示
- req_url = "https://s.click.taobao.com/t?spm=a2e15.11083356.10000.ds4&e=m%3D2%26s%3DdwyjpkBnBGlw4vFB6t2Z2jAVflQIoZeptCNrm84%2FxJjdZa3YWKemDSBJoITJzRi64BBTQD61PRo%2FmLO%2F5foB9eoryUtqIh4%2B4jMnl1H7sdsBIemyEo5Eni3koJeyBea1llI%2BPk4Lhm2ZK%2F1uLgiYdLC7x5S3JRj3kU17skPPPze%2FX1sIsjoYVnEqY%2Bakgpmw"
-
-
-
- #设置chrome浏览器无界面模式
- chrome_options=Options()
- chrome_options.add_argument('--headless')
-
-
-
-
- #初始化
- browser = webdriver.Chrome(options=chrome_options)
-
-
-
- #设置超时时间,3秒足够了,因为只是需要获取url,所以无需等待js和图片的加载
- browser.set_page_load_timeout(3)
-
-
-
- # 开始请求,这边必须要用try来忽略错误,因为淘宝的网页在3秒内根本无法全部加载完,但实际最终url我们已经获取到了
- try:
- browser.get(req_url)
- except:
- pass
-
-
-
- #打印页面网址
- print(browser.current_url)
-
-
-
- #关闭浏览器和chromedriver进程
- browser.close()
- browser.quit()
-
-
- #运行后获取到的最终url为:https://runbensx.tmall.com/shop/view_shop.htm?user_number_id=3159551725&ali_trackid=2%3Amm_33231688_7050284_23466709%3A1588947742_128_1310820941&spm=a2e15.11083356.10000.ds4
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。