用python分分钟爬取B站视频_python爬取b站1080p视频

作者：数据流舞者 | 2024-02-04 20:35:32

踩

python爬取b站1080p视频

# 导入requests模块，模拟发送请求
import requests
# 导入json
import json
# 导入re
import re

# 定义请求头
headers = {
    'Accept': '*/*',
    'Accept-Language': 'en-US,en;q=0.5',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
}


# 正则表达式，根据条件匹配出值
def my_match(text, pattern):
    match = re.search(pattern, text)
    print(match.group(1))
    print()
    return json.loads(match.group(1))


def download_video(old_video_url, video_url, audio_url, video_name):
    headers.update({"Referer": old_video_url})
    print("开始下载视频：%s" % video_name)
    video_content = requests.get(video_url, headers=headers)
    print('%s视频大小：' % video_name, video_content.headers['content-length'])
    audio_content = requests.get(audio_url, headers=headers)
    print('%s音频大小：' % video_name, audio_content.headers['content-length'])
    # 下载视频开始
    received_video = 0
    with open('%s_video.mp4' % video_name, 'ab') as output:
        while int(video_content.headers['content-length']) > received_video:
            headers['Range'] = 'bytes=' + str(received_video) + '-'
            response = requests.get(video_url, headers=headers)
            output.write(response.content)
            received_video += len(response.content)
    # 下载视频结束
    # 下载音频开始
    audio_content = requests.get(audio_url, headers=headers)
    received_audio = 0
    with open('%s_audio.mp4' % video_name, 'ab') as output:
        while int(audio_content.headers['content-length']) > received_audio:
            # 视频分片下载
            headers['Range'] = 'bytes=' + str(received_audio) + '-'
            response = requests.get(audio_url, headers=headers)
            output.write(response.content)
            received_audio += len(response.content)
    # 下载音频结束
    return video_name


if __name__ == '__main__':
    # 换成你要爬取的视频地址
    url = 'https://www.bilibili.com/video/av76609390'
    # 发送请求，拿回数据
    res = requests.get(url, headers=headers)
    # 视频详情json
    playinfo = my_match(res.text, '__playinfo__=(.*?)</script><script>')
    # 视频内容json
    initial_state = my_match(res.text, r'__INITIAL_STATE__=(.*?);\(function\(\)')
    # 视频分多种格式，直接取分辨率最高的视频 1080p
    video_url = playinfo['data']['dash']['video'][0]['baseUrl']
    # 取出音频地址
    audio_url = playinfo['data']['dash']['audio'][0]['baseUrl']
    video_name = initial_state['videoData']['title']
    print('视频名字为：video_name')
    print('视频地址为：', video_url)
    print('音频地址为：', audio_url)
    download_video(url, video_url, audio_url, video_name)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72

作者：吴常文
出处：https://blog.csdn.net/qq_41405475
本文版权归作者和CSDN共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/blog/article/detail/59838

推荐阅读

article
Python+Django毕业设计校园食堂订餐系统（程序+LW+部署）_学校食堂菜品信息查询系统python代码
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Ma... [详细]
赞
踩
article
【python】—— python的基本介绍并附安装教程
python的基本介绍以及安装教程_pythonpython前言：今天，我将给大家讲解关于python的基本知识，让大家对其有个基本的认识并且附上相应的安装教程以供大家参考。接下来，我们正式进入今天的文章！！！目录前言（一）Py... [详细]
赞
踩
article
人工智能 | Python：易学、强大、多用途的编程语言_python编程
龟叔在1989年圣诞节期间，以由荷兰的数学和计算机研究所开发的ABC语言为蓝本，开始开发一门新的编程语言，目标让新语言即能像C语言一样能够全面调用计算机的功能接口，又可以像shell一样可以轻松的编程，并且以龟叔所挚爱的电视剧。Python... [详细]
赞
踩
article
Python 教程 | Python 简介_python -〉
Python教程|Python简介_python-〉python-〉前言在本文中，我将向你介绍Python及其特点和应用。通过阅读本文，你将能够掌握：什么是PythonPython有哪些特点Python有哪些应用场景什么是PythonPyt... [详细]
赞
踩
article
Python——函数的参数
必选参数、默认参数、可变参数、命名关键字参数和关键字参数。Python——函数的参数1.位置参数位置参数可以在函数中设置一个或者多个参数，但是必须有对应个数的值传入该函数才能成功调用，例如：defpower(x):returnx*xprin... [详细]
赞
踩
article
使用 Python 创造你自己的计算机游戏（游戏编程快速上手）第四版：第五章到第九章
五、龙之境原文：inventwithpython.com/invent4thed/chapter5.html译者：飞龙协议：CCBY-NC-SA4.0本章中您将创建的游戏名为龙之境。玩家需要在两个洞穴之间做出选择，这两个洞穴分别藏有宝藏和一... [详细]
赞
踩
article
python 3.5实现gif缩小并打包成exe_打包一个含gif的文件为exe文件
表情包泛滥的今天，有时候困于动图太大，发到微信或者QQ上太占屏幕空间，因此想着使用缩小一下，于是用python写了个脚本，并基于pyqt5写了个简单的界面。缩小前：缩小后：不过工具没那么健壮，没检查一些异常，凑合用一下吧，哈哈~下载链接：g... [详细]
赞
踩
article
【已解决】安装cv2时Building wheel for opencv-python终端卡死_building wheel for opencv-python (pep 517)
本文探究安装cv2时Buildingwheelforopencv-python终端卡死的原因并予以解决_buildingwheelforopencv-python(pep517)buildingwheelforopencv-python(p... [详细]
赞
踩
article
《Python入门到精通》webbrowser模块详解，Python webbrowser标准库，Python浏览器控制工具
webbrowser是Python的内置库，提供了访问Web浏览器的接口_pythonwebbrowserpythonwebbrowser「作者主页」：士别三日wyx「作者简介」：CSDNtop100、阿里云博客专家、华为云享专家、网络安全... [详细]
赞
踩
article
Python 与 PySpark数据分析实战指南：解锁数据洞见_python和pyspark数据分析 乔纳森·里乌 pdf
数据分析是当今信息时代中至关重要的技能之一。Python和PySpark作为强大的工具，提供了丰富的库和功能，使得数据分析变得更加高效和灵活。_python和pyspark数据分析乔纳森·里乌pdfpython和pyspark数据分析乔纳森... [详细]
赞
踩
article
python：chatGPT 写一个趋势跟踪策略量化交易程序_python 趋势跟踪策略
chatGPT：趋势跟踪策略的量化交易程序可能会因语言和框架而异，下面是一个简单的Python代码示例，用于演示如何通过量化编程来实现趋势跟踪策略。_python趋势跟踪策略python趋势跟踪策略chatGPT：趋势跟踪策略的量化交易程序... [详细]
赞
踩
article
python sqlite3 线程池封装
【代码】pythonsqlite3线程池封装。pythonsqlite3线程池封装1.封装sqlite31.1.依赖包引入#-*-coding:utf-8-*-#importosimportsysimportdatetimeimportlo... [详细]
赞
踩
article
springboot国家公务员招聘网站 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案
科技进步的飞速发展引起人们日常生活的巨大变化，电子信息技术的飞速发展使得电子信息技术的各个领域的应用水平得到普及和应用。信息时代的到来已成为不可阻挡的时尚潮流，人类发展的历史正进入一个新时代。在现实运用中，应用软件的工作规则和开发步骤，采用... [详细]
赞
踩
article
python 领英爬虫_linkin简历数据抓取
**1.**一般我们爬取领英都是想爬领英上关于那个公司的所有员工，所以我们有两种方法（我已知的），一个是百度（领英+公司名称），从中抽取个人领英页面，从而进入个人领英页面进行信息的抓取，一般百度只会提供前75页信息，so，你可能抓不全，但这... [详细]
赞
踩
article
python OSError: [Errno 24] Too many open files_scrapy to many open file
背景：scrapy启动了多个爬虫，每个爬虫都有读写文件的pipeline。发生了这一问题.原因：超出了进程同一时间最多可开启的文件数.解决办法：ulimit-n2048，将数目提高，mac默认是256，linux是1024，自行体会....... [详细]
赞
踩
article
【Python】01快速上手爬虫案例一
实战是最好的老师，直接案例操作，快速上手。【Python】01快速上手爬虫案例一文章目录前言一、VSCode+Python环境搭建二、爬虫案例一1、爬取第一页数据2、爬取所有页数据3、格式化html数据4、导出excel文件前言实战是最好的... [详细]
赞
踩
article
【人生苦短，我学 Python】（10）pass语句、match语句、异常处理以及日志记录
上一篇文章讲了分支判断、循环、enumerate函数和zip函数，流程控制也差不多结束了，但是在我们学习C语言的时候，不知道大家还记不记得C语言有个switch语句，那么Python里面有没有switch语句呢？下面就给大家揭晓谜底，当然在... [详细]
赞
踩
article
Python 变量？对象？引用？赋值？一个例子解释清楚
哈喽大家好，我是咸鱼。然后问我为什么结果是[1,[...]]，我一看这个问题有意思，我说三言两语解释不清楚，我写篇文章到时候你看下吧，于是有了今天这篇文章。在正式开始之前，让我们先弄清楚一些概念。Python变量？对象？引用？赋值？一个例子... [详细]
赞
踩
article
Python NLP深度学习进阶：自然语言处理
要学习和掌握NLP深度学习进阶知识，建议你对基本的深度学习和Python编程有一定的了解，并深入学习上述提到的库和模型。同时，实践和动手做项目也非常重要，可以通过练习数据集上的各种NLP任务来提高自己的实战能力。自然语言处理（Natural... [详细]
赞
踩
article
【Vue】【Python】【Flask】Vue连接Python Flask后端跨域问题，以及GET能用POST不能用_python flask后端接口如何避免跨域问题
Vue项目如果连接Pyhton后端通常会存在跨域的问题，最开始我是用nginx解决的，后来发现flask有一个flask_cors包，比较简便。后来又出现POST请求不能用的问题。_pythonflask后端接口如何避免跨域问题python... [详细]
赞
踩

用python分分钟爬取B站视频_python爬取b站1080p视频

Python+Django毕业设计校园食堂订餐系统（程序+LW+部署）_学校食堂菜品信息查询系统python代码

【python】—— python的基本介绍并附安装教程

人工智能 | Python：易学、强大、多用途的编程语言_python编程

Python 教程 | Python 简介_python -〉

Python——函数的参数

使用 Python 创造你自己的计算机游戏（游戏编程快速上手）第四版：第五章到第九章

python 3.5实现gif缩小并打包成exe_打包一个含gif的文件为exe文件

【已解决】安装cv2时Building wheel for opencv-python终端卡死_building wheel for opencv-python (pep 517)

《Python入门到精通》webbrowser模块详解，Python webbrowser标准库，Python浏览器控制工具

Python 与 PySpark数据分析实战指南：解锁数据洞见_python和pyspark数据分析乔纳森·里乌 pdf

python：chatGPT 写一个趋势跟踪策略量化交易程序_python 趋势跟踪策略

python sqlite3 线程池封装

springboot国家公务员招聘网站 (免费领源码、附论文）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

python 领英爬虫_linkin简历数据抓取

python OSError: [Errno 24] Too many open files_scrapy to many open file

【Python】01快速上手爬虫案例一

【人生苦短，我学 Python】（10）pass语句、match语句、异常处理以及日志记录

Python 变量？对象？引用？赋值？一个例子解释清楚

Python NLP深度学习进阶：自然语言处理

【Vue】【Python】【Flask】Vue连接Python Flask后端跨域问题，以及GET能用POST不能用_python flask后端接口如何避免跨域问题