赞
踩
Excel 是数据分析师的好帮手, 可用来制作数据看板 / 连接数据库 / 统计分析- 简单的机器学习模型;可以说,在大数据时代,Excel 依然是数据分析师的重要工作之一。
数据分析师为甚么要学习Excel?
Excel可以覆盖数据分析流程全部的六个环节:
数据探索:全面理解数据传达的信息,探索发现进一步深入分析切入点,常见手段有作图可视化,统计量计算等。
Excel 与R 比较:两者都可以覆盖数据分析流程全部六个环节,但通常 EXCEL用于部分步骤或者简单的工作,适合数据小而干净,分析方法不复杂等比较简单的分析,而编程语言R / Python 则是作为实际工作上的主要工具,适应于数据/分析流程更复杂,分析需求更多更深的分析;在处理数据量大小方面:Excel适合于处理1万行以下的数据,R用于处理< 4GB的数据,其他则需要使用大数据工具;
适用于Excel 完成的工作场景:
小试牛刀:
数据分析流程的6个步骤:数据获取- 数据清理 -数据转换 - 数据探索 - 统计分析和建模 - 数据呈现,其中,数据清理 和 数据转换这两个阶段 常用的函数,在这里统称为 “数据处理类”函数。
常用数据处理类函数 —— 常用函数
函数名称 | 功能 |
---|---|
LEFT/RIGHT | 从文本左/右侧提取一个或多个字符 |
CONCATENATE | 将两个或多个字符串组成一个 |
LEN | 返回文本字符串的长度 |
TRIM | 从文本中删除了除“单词之间的单个空格”以外的所有空格 |
REPLACE | 将文本字符串的一部分替换为其他文本 |
如何查询所需的Excel函数:
方法一: Excel函数(按类别给出)
方法二: 通过搜索引擎寻找和学习你所需要的Excel 函数
在数据探索与统计分析与建模这两个阶段也经常使用Excel函数,在这称之为“数据分析类函数”
SUBTOTAL 函数(筛选)/ IF / SUMIF
Excel函数:按字母顺序
VLOOKUP使用步骤:
注意点: 在大表格中,查询值应该在查询依据值右边,否则无法进行查询。
什么是数据透视表(Pivot Table)?
对表格信息进行总结和归纳的一站式工具;数据透视表可以基于一个有更大信息量的表格,生成统计性总结和归纳的表格。所谓的“统计性总结”可以包括求和、平均值、或其他统计量。
场景和需求:
注意: 第四步、第五步依据业务需要进行操作;
什么是数据可视化:借助图形手段,清晰有效地传达与沟通数据背后的信息。
为什么要进行可视化?
Excel 、Power BI 和 R-ggplot2在可视化上的差别
利用Excel作图:
分别介绍六种常用的图形,比如柱形图、折线图、饼图、散点图和直方图。并且学习者五种图形各自不同的使用场景。
小任务:
效果图如下:
适应场景:适应于查找走势
推荐输入数据:带有行名称和列名称的“数值矩阵”(与柱形图相似)
小任务:
适应场景:显示比例情况
推荐输入数据: 数据表中的两列,一列为“分类标签”,一列是数值。
小任务:销售量目标在各个市场的分布。
适应场景:显示比例情况
推荐输入数据: 数据表中的两个数值列
小任务:在不同市场销售额与销售量目标之间的关系
适应场景:衡量数据在数据集中出现的频率
推荐输入数据:一个数值列
小任务:销售额在不同市场的分布情况
部分图像特点对比
水平分类轴标签:这个部分对应的是横坐标的每一个值。例如:201901到201906这几个值。
图例项(系列):这个部分对应的是,在每一个横坐标的值上边,有几个需要看的类别,比如在每一个月份上,我们都要看北美、拉美、欧洲&中东,亚洲几个类别的值。
Y值对应的的是,每一个类别之上的数值大小。
变化前:
变换后:
数据报告 VS 数据仪表盘
报告:是包含文本、表格形式数据,和少量图形的静态文档 —— 特点:定期传递给不同利益的相关者;非实时,重点在文字叙述;
仪表盘:是可以对其个性化以显示特定的指标、数据和KPI的可视化工具;—— 特点:通常实时更新,利益相关者实时查看;重点在可视化呈现完整信息。
Power BI特点:
业务:需要呈现的数据 —— 500条不同业务 & 时间单元的绩效目标值
作品:
书籍推荐:
Excel / Power BI系列 下篇更新:① 制作仪表盘开发流程 ② index + match 函数
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。