基于数据可视化的豆瓣图书榜单数据分析_数据可视化图书数据

作者：很楠不爱3 | 2024-04-16 03:59:30

踩

数据可视化图书数据

文章目录

前言
一、数据抓取
二、数据可视
总结

前言

本文旨在对豆瓣图书榜单TOP250进行数据分析，主要包括数据抓取、数据清洗和数据分析。

一、数据抓取

豆瓣图书top250的数据爬取比较简单，使用requests发送请求，使用lxml模块的xpath表达式提取数据。难点在于价格、出版年份、出版社等信息在一起，需要使用python的字符串处理方法将各种数据分离，包括作者评价人数等信息都需要做替换、去除空格等等字符串操作处理。爬取的数据经过处理如下图所示，代码附后：

二、数据可视化

1.绘制词云图

绘制词云图，需要使用jieba库进行分词，使用collections库进行词频

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/432270

基于数据可视化的豆瓣图书榜单数据分析_数据可视化图书数据

文章目录

前言

一、数据抓取

二、数据可视

总结

前言

一、数据抓取

二、数据可视化

1.绘制词云图