赞
踩
开始爬取网页视频第一步
介绍以下现在网页视频大多是流媒体形式播放,将视频分为多个一小段视频为ts文件
我们需要取安装一些爬虫必需一些库以及在这中需要的一些第三方库
requests库是python3中的主要的爬虫库
我们调用win + R ,输入cmd确定,输入以下
pip install requests
Cryto库是用于解码ts文件的库,和上面一样调出系统命令,输入:
pip install cryto
安装好后,这个需要你找到这个库的文件安装位置,将cryto库名首字母改为大写即可
在这里路径可以根据需求进行修改,根据下面指示就可以成功下载
代码运行后,我们需要先观察是ts文件链接是否完整,如果不完整可以根据提示输入
接下来上代码:
- #os库,re库,time库 python自带无须安装
- import requests
- import re #正则库
- import time
- #Crypto(秘密的).Cipher(密码)库可以用于加密和解密
- from Crypto.Cipher import AES #用解密ts文件的库
- import os
- import winsound #用于调用系统铃声
-
-
- #获取m3u8文件下的ts文件
- def web_m3u8(url,url_ts):
- try:
- url_m3u8 = url
- print('正在下载中~')
- time.sleep(1)
- print('请稍等')
- header = {"user-agent":"选择使用的浏览器"}
- res = requests.get(url_m3u8,headers = header)
- res.encoding = 'UTF-8'
- model = r"[^#\s].*.[ts|key]"
- #获取m3u8的密钥模板
- model_key = r'[^A-Z-:\s128="URI,].*'
- res_content = re.findall(model,res.text)
- #用于收集ts链接的列表
- list = []
- #单独提出key加到第一项
- url_i &
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。