赞
踩
这篇文章主要介绍了python数据分析期末大作业报告,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获,下面让小编带着大家一起了解一下。
分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。
- #导入numpy包
- import numpy as np
- #导入pandas包
- import pandas as pd
2.1 一维数据分析:NumPy
2.2 一维数据结构:Pandas
2.3 二维数据分析:numpy对应array
2.4 二维数据分析:pandas对应数据框DateFrame
此处遇到一个问题:读取Excel文件报错python画心的源代码。
解决方法:
1 查看Excel文件存放路径
具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
2 将上面标红的两处合成文件的路径,
格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb
3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\)
最后的路径为F:\ann\Untitled1.ipynb
3.1 提出问题
分析指标:
月均消费次数
月均消费金额
客单件
消费趋势
3.2 理解数据
3.3 清洗数据
3.3.1 选择子集
3.3.2 列名重命名
3.3.3 缺失数据处理(dropna()函数)
Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。
None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。
3.3.4 数据类型转换
3.3.5 数据排序
3.3.6 异常值处理
3.4 构建模型
3.4.1 指标1:月均消费次数=总消费次数/月份数
3.4.2 指标2:月均消费金额=总消费金额/月份数
3.4.3 指标3:客单价=总消费金额/总消费次数
客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。
3.4.3 消费趋势
读者福利:知道你对Python感兴趣,便准备了这套python学习资料
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/770072
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。