赞
踩
嗨喽!大家好,这里是魔王~
Python采集网站视频,下载流媒体m3u8格式视频
- requests >>> pip install requests (数据请求 第三方模块)
- re # 正则表达式 去匹配提取数据
- json
- Python 3.8 解释器
- Pycharm 2021.2 版本 建议
win + R 输入cmd 输入安装命令 pip install 模块名 如果出现爆红 可能是因为 网络连接超时 切换国内镜像源
- 确定目标网站 >>> 爬取网址是什么 数据是什么
- 通过开发者工具进行抓包分析
采集视频
- 先看network下面 media(媒体文件包含视频数据或者音频数据) [如果没有数据]
- 通过数据包数据慢慢分析
如果说url里面包含 ts 后缀 >>> 视频片段 >>> m3u8视频格式 (有专门m3u8文件保存所有ts文件内容)
m3u8 就是把一个整体视频, 分割成很多视频小片段 一个片段只有几秒时间…
(可以更好缓存, 你看多少,他就给加载多少, 减少服务器压力)通过上述分析可以知道 只需要获取m3u8文件, 可以获取所有ts视频片段…
- 发送请求, 对于视频详情页页面发送请求
- 获取数据, 获取网页源代码
- 解析数据, 提取我们想要数据内容 视频信息
- 发送请求, 对于m3u8 url地址发送请求
- 获取数据, 获取返回ts文件内容
- 解析数据, 提取所有ts文件
保存数据, 把视频内容保存本地, 把视频片段合成为一个完整视频
# 导入数据请求模块
import requests # 第三方模块 pip install requests
# 导入正则
import re # 内置模块 不需要安装
# 导入json
import json # 内置模块 不需要安装
# 导入格式化输出模块
import pprint # 内置模块 不需要安装
for page in
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。