赞
踩
忘了爬取动态图片花了多长时间了,现在终于成功爬取百度图片了,从安装selenium开始,出了好多bug,也参考了一些up主的视频代码,现在终于成功了,但这只是最最基本,简单的,但有了这个基础,我想其他的要求再努力很快就能出来,现在我就将我从配置过程一步一步讲起。
1)在window系统找到“命令指示符”,在框内输入"pip install selenium",按回车键,就可以开始下载selenium了(这种方法速度应该比较慢,但我觉得方便,下载安装包的方法应该也不难)
2)在这里我用的是Google Chrome浏览器,所以这就需要下载Chromedriver,来驱动浏览器打开。在网上下载了自己电脑Chrome对应的Chromedriver后,将Chromedriver放置在和Ghrome.exe同一目录下,同时将Chromedriver复制在安装python中的Scripts文件夹中,如下图所示
然后还要将这两个路径,添加到环境变量里面去,在这里不详述了,有需要的再说,但弄清楚原理后其实不难。
到这里基本上环境就配置好了,可以开始写代码了!
我参考了这几个up主的视频以及代码,有兴趣的可以去看一看
https://www.bilibili.com/video/BV1FK4y1v78f
https://www.bilibili.com/video/BV1fK411p7YN
https://www.bilibili.com/video/BV1Va4y1Y7fK
现在简单说说我写的代码的思路
打开浏览器——找到搜索框输入内容——点击搜索——点击第一张图片——找到图片的链接——下载——点击下一张图片——下载。这个思路应该是借鉴了第三个up主的思路。
引入库
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time
import requests
browser = webdriver.Chrome()
url = 'https://image.baidu.com/'
打开浏览器和输入搜索内容
def openandsearch(name):#参数是要搜索的关键词
browser.get(url)
time.sleep(4)
input = browser.find_element_by_xpath('//*[@id="kw"]')#找到搜索框
input.send_keys(name)#输入搜素关键词
time.sleep(2)
sub=browser.find_element_by_xpath('//*[@id="homeSearchForm"]/span[2]/input')#点击搜索
sub
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。