当前位置:   article > 正文

69 | Python 网络爬虫案例 —— 爬取B站视频弹幕数据_爬取bilibili直播弹幕

爬取bilibili直播弹幕

最近同学要做东西,需要用 B 站的视频对应的弹幕数据做分析,于是请我帮忙爬取 B 站视频的弹幕数据。B站提供了一个接口,可以通过视频的cid获取对应的弹幕数据。本文将使用Python和XPath来实现爬取B站视频弹幕数据的操作。

1. 寻找视频对应的cid

在B站视频播放页面,通过搜索"cid"关键字可以找到对应视频的cid。具体步骤如下:

  1. 打开B站视频播放页面。
  2. 在页面中搜索"cid"关键字。
  3. 找到包含cid的信息,通常在<script>标签或者其他相关标签中,可以看到类似于cid: 327508765这样的内容。

其实 B 站是提供了弹幕接口的,B站把视频对应的弹幕数据全部放在 xml 文件中,获取的接口是

此接口就是:https://api.bilibili.com/x/v1/dm/list.so?oid=视频的cid

如何寻找视频的对应的cid的?

高手的做法就是直接搜索cid

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/205441
推荐阅读
相关标签
  

闽ICP备14008679号