当前位置:   article > 正文

Python带你采集4K高清壁纸,超惊艳_python 批量爬取4k高清图片代码

python 批量爬取4k高清图片代码

前言

在找壁纸的时候

无意间逛到一个网站,发现里面的

图都非常精美,吸引我的眼球

于是,我决定用python批量采集一下它

环境使用:

Python 3.8 解释器

Pycharm 编辑器

模块

import re

import requests >>> pip install requests

如果安装python第三方模块:

win + R 输入 cmd 点击确定, 输入安装命令

pip install 模块名 (pip install requests)

在pycharm中点击

Terminal(终端) 输入安装命令

代码展示

( 完整源码点击此处跳转
+君羊,找管理员小姐姐领取呀~ )

导入模块

  1. # 导入数据请求模块 --> 第三方模块, 需要安装 pip install requests
  2. import requests
  3. # 导入正则模块 --> 内置模块, 不需要安装
  4. import re

多页采集

  1. for page in range(2, 11):
  2. print(f'=================正在采集第{page}页的数据内容=================')

请求图片目录页面url

    url = f'http://www.****.com/dongman/index_{page}.htm'

伪装模拟成浏览器

  1. headers = {
  2. # User-Agent 用户代理 浏览器基本身份信息
  3. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
  4. }

发送请求

    response = requests.get(url=url, headers=headers)

提取图片ID

  1. for img_id in img_id_list:
  2. # img_id变量<袋子> 给 img_id_list 列表<盒子> 里面 元素<苹果> 给装起来
  3. print(img_id)

请求详情页链接

        link = f'http://www.*****.com/desk/{img_id}.htm'

发送请求

        response_1 = requests.get(url=link, headers=headers)

获取数据内容 网页源代码

        img_url, img_title = re.findall('<img src="(.*?)" alt="(.*?)"', response_1.text)[0]

保存数据

  1. img_content = requests.get(url=img_url, headers=headers).content
  2. with open('img\\' + img_title + '.jpg', mode='wb') as f:
  3. f.write(img_content)
  4. print(img_url, img_title)

 

效果展示

尾语

好啦,本文章到这里就结束拉

有喜欢的小伙伴记得给博主一个三连哦~

希望你在学习的路上不忘初心,坚持不懈,学有所成

把时间和精力,放在自己擅长的方向,去坚持与努力,

如果不知道自己擅长什么,就尽快找到它。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/460850
推荐阅读
相关标签
  

闽ICP备14008679号