赞
踩
一、爬虫爬取数据。
1.提取信息
2.发起请求
3.爬取数据
4.查看数据
5.导出数据
二、数据预处理
1. 空值与重复值处理
2.标点符号处理
2.1提取作者
2.2提取出版社
2.3提取出版日期
2.4 提取书名和书简介
3.单位标准统一化
4.数值标准化
5.转换星级
6.成果展示
三、数据可视化
1.导入库
- import json
- import numpy as np
- import pandas as pd
- import pyecharts.options as opts
- from pyecharts.charts import *
- from pyecharts.globals import ThemeType#设定主题
- from pyecharts.commons.utils import JsCode
- import chardet
- import jieba
- import missingno as msno
- import stylecloud
- from IPython.display import Image
2.详细操作
2.1出版社出版top15
2.2图书价格饼图
2.3出版top10的矩形树图分布
2.4书名词云图
2.5简介词云图
2.6星级与评论数的关系图
2.7图书星级与价格的关系图
2.8图书星级占比分析
2.9图书出版日期与星级关系分析
2.10图书作者top5分析
四、多维度分析得出图书推荐单
1.价格维度
2.星级维度
3.评论数维度
五、利用RFM模型得出图书推荐表
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。