当前位置:   article > 正文

基于数据可视化的豆瓣图书榜单数据分析_数据可视化图书数据

数据可视化图书数据

文章目录


前言

本文旨在对豆瓣图书榜单TOP250进行数据分析,主要包括数据抓取、数据清洗和数据分析。


一、数据抓取

       豆瓣图书top250的数据爬取比较简单,使用requests发送请求,使用lxml模块的xpath表达式提取数据。难点在于价格、出版年份、出版社等信息在一起,需要使用python的字符串处理方法将各种数据分离,包括作者评价人数等信息都需要做替换、去除空格等等字符串操作处理。爬取的数据经过处理如下图所示,代码附后:

二、数据可视化

1.绘制词云图

绘制词云图,需要使用jieba库进行分词,使用collections库进行词频

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/432270
推荐阅读
相关标签
  

闽ICP备14008679号