当前位置:   article > 正文

使用Python分析网易云歌曲评论信息,通过可视化处理我发现了这些有趣的规律_网易云音乐热门评论与普通评论可视化

网易云音乐热门评论与普通评论可视化

数据来源

首先是数据来源,来自网易云音乐热评,代码这里就不放出来了,调用了API获取的,抓取难度就少了许多,这里不在赘述了。

分析过程

时间处理

下面的代码主要是评论时间分布,主要是针对时间列做了数据处理,常规操作,你也对照的去以日期和月份去挖掘下有意思的事情。

  1. import pandas as pd
  2. from pyecharts import Line
  3. # 读取数据
  4. df = pd.read_csv('music_comments.csv', header=None, names=['name', 'userid', 'age', 'gender', 'city', 'text', 'comment', 'commentid', 'praise', 'date'], encoding='utf-8-sig')
  5. # 根据评论ID去重
  6. df = df.drop_duplicates('commentid')
  7. df = df.dropna()
  8. # 获取时间
  9. df['time'] = [int(i.split(' ')[1].split(':')[0]) for i in df['date']]
  10. # 分组汇总
  11. date_message = df.groupby(['time'])
  12. date_com = date_message['time'].agg(['count'])
  13. date_com.reset_index(inplace=True)
  14. # 绘制走势图
  15. attr = date_com['time']
  16. v1 = date_com['count']
  17. line = Line("歌曲被爆抄袭后-评论的时间分布", title_pos='center', title_top='18', width=800, height=400)
  18. line.add("", attr, v1, is_smooth=True, is_fill=True, area_color="#000", is_xaxislabel_align=True, xaxis_min="dataMin", area_opacity=0.3, mark_point=["max"], mark_point_symbol="pin", mark_point_symbolsize=55)
  19. line.render("歌曲被爆抄袭后-评论的时间分布.html")

运行之后,得到的效果图如下所示:

<
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/码创造者/article/detail/1015775
推荐阅读
相关标签
  

闽ICP备14008679号