当前位置:   article > 正文

Python爬虫—爬取网页视频_网页视频流获取

网页视频流获取

 开始爬取网页视频第一步

介绍以下现在网页视频大多是流媒体形式播放,将视频分为多个一小段视频为ts文件


我们需要取安装一些爬虫必需一些库以及在这中需要的一些第三方库

  requests库是python3中的主要的爬虫库

  我们调用win + R ,输入cmd确定,输入以下

pip install requests

Cryto库是用于解码ts文件的库,和上面一样调出系统命令,输入:

pip install cryto

安装好后,这个需要你找到这个库的文件安装位置,将cryto库名首字母改为大写即可

在这里路径可以根据需求进行修改,根据下面指示就可以成功下载

代码运行后,我们需要先观察是ts文件链接是否完整,如果不完整可以根据提示输入

接下来上代码:

  1. #os库,re库,time库 python自带无须安装
  2. import requests
  3. import re #正则库
  4. import time
  5. #Crypto(秘密的).Cipher(密码)库可以用于加密和解密
  6. from Crypto.Cipher import AES #用解密ts文件的库
  7. import os
  8. import winsound #用于调用系统铃声
  9. #获取m3u8文件下的ts文件
  10. def web_m3u8(url,url_ts):
  11. try:
  12. url_m3u8 = url
  13. print('正在下载中~')
  14. time.sleep(1)
  15. print('请稍等')
  16. header = {"user-agent":"选择使用的浏览器"}
  17. res = requests.get(url_m3u8,headers = header)
  18. res.encoding = 'UTF-8'
  19. model = r"[^#\s].*.[ts|key]"
  20. #获取m3u8的密钥模板
  21. model_key = r'[^A-Z-:\s128="URI,].*'
  22. res_content = re.findall(model,res.text)
  23. #用于收集ts链接的列表
  24. list = []
  25. #单独提出key加到第一项
  26. url_i &
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/1012334
推荐阅读
相关标签
  

闽ICP备14008679号