当前位置:   article > 正文

记录成功用selenium爬取百度图片_selenium爬图片

selenium爬图片

在VS中用selenium爬取百度图片

忘了爬取动态图片花了多长时间了,现在终于成功爬取百度图片了,从安装selenium开始,出了好多bug,也参考了一些up主的视频代码,现在终于成功了,但这只是最最基本,简单的,但有了这个基础,我想其他的要求再努力很快就能出来,现在我就将我从配置过程一步一步讲起。

1、配置各类环境

1)在window系统找到“命令指示符”,在框内输入"pip install selenium",按回车键,就可以开始下载selenium了(这种方法速度应该比较慢,但我觉得方便,下载安装包的方法应该也不难)
2)在这里我用的是Google Chrome浏览器,所以这就需要下载Chromedriver,来驱动浏览器打开。在网上下载了自己电脑Chrome对应的Chromedriver后,将Chromedriver放置在和Ghrome.exe同一目录下,同时将Chromedriver复制在安装python中的Scripts文件夹中,如下图所示
在这里插入图片描述
在这里插入图片描述
然后还要将这两个路径,添加到环境变量里面去,在这里不详述了,有需要的再说,但弄清楚原理后其实不难。
到这里基本上环境就配置好了,可以开始写代码了!

2、代码

我参考了这几个up主的视频以及代码,有兴趣的可以去看一看
https://www.bilibili.com/video/BV1FK4y1v78f
https://www.bilibili.com/video/BV1fK411p7YN
https://www.bilibili.com/video/BV1Va4y1Y7fK
现在简单说说我写的代码的思路
打开浏览器——找到搜索框输入内容——点击搜索——点击第一张图片——找到图片的链接——下载——点击下一张图片——下载。这个思路应该是借鉴了第三个up主的思路。
引入库

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time
import requests
browser = webdriver.Chrome()
url = 'https://image.baidu.com/'
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

打开浏览器和输入搜索内容

def openandsearch(name):#参数是要搜索的关键词
    browser.get(url)
    time.sleep(4)
    input = browser.find_element_by_xpath('//*[@id="kw"]')#找到搜索框
    input.send_keys(name)#输入搜素关键词
    time.sleep(2)
    sub=browser.find_element_by_xpath('//*[@id="homeSearchForm"]/span[2]/input')#点击搜索
    sub
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/801147
推荐阅读
相关标签
  

闽ICP备14008679号