当前位置:   article > 正文

大数据可视化当当网图书结课代码流程_当当网书籍可视化分析怎么做

当当网书籍可视化分析怎么做

一、爬虫爬取数据。

 1.提取信息

 2.发起请求

 3.爬取数据

 4.查看数据

 5.导出数据

二、数据预处理

1. 空值与重复值处理

2.标点符号处理

2.1提取作者

2.2提取出版社 

2.3提取出版日期  

2.4 提取书名和书简介 

 3.单位标准统一化

 4.数值标准化

5.转换星级

6.成果展示

三、数据可视化

1.导入库

  1. import json
  2. import numpy as np
  3. import pandas as pd
  4. import pyecharts.options as opts
  5. from pyecharts.charts import *
  6. from pyecharts.globals import ThemeType#设定主题
  7. from pyecharts.commons.utils import JsCode
  8. import chardet
  9. import jieba
  10. import missingno as msno
  11. import stylecloud
  12. from IPython.display import Image

2.详细操作 

2.1出版社出版top15

2.2图书价格饼图

2.3出版top10的矩形树图分布

2.4书名词云图

2.5简介词云图

2.6星级与评论数的关系图

2.7图书星级与价格的关系图

2.8图书星级占比分析

2.9图书出版日期与星级关系分析

 

 2.10图书作者top5分析

 四、多维度分析得出图书推荐单

1.价格维度

 2.星级维度

 3.评论数维度

 

 五、利用RFM模型得出图书推荐表

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/874873
推荐阅读
相关标签
  

闽ICP备14008679号