当前位置:   article > 正文

python爬虫新闻网页的浏览量转载量_用Python爬虫 爬博客访问量

新闻 爬虫阅读量

import re

import requests

from requests import RequestException

import time

import random

def get_page(url):

try:

headers = {

'Referer': 'https://blog.csdn.net', # 伪装成从CSDN博客搜索到的文章

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36'

# 伪装成浏览器

}

response = requests.get(url, headers=headers)

if response.status_code == 200:

return response.text

return None

except RequestException:

print('请求出错')

return None

def parse_page(html):

try:

read_num = int(re.compile('').search(html).group(1))

return read_num

except Exception:

print('解析出错')

return None

def main():

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/958702
推荐阅读
相关标签
  

闽ICP备14008679号