我刚接触数据可视化是在 4 年前,那时候一位大学老师 S ,叫我们使用 R 对数据进行统计分析(对,哥也学过一阵统计呢),其中有部分知识点是用 R 绘制箱线图、散点图之类的可视化结果。
从此对数据可视化产生了浓厚的兴趣,现在系统地来学习一下数据可视化。今天分享一些关于数据可视化的基本流程。
做任何事情都有章可循,数据可视化也是一样,而且可视化的基本步骤、流程和体系都是通用的, 不同的数据都可以按照下面的模型将数据可视化。
这里给出的步骤不是教大家怎么画出一幅「信、达、雅」的可视化结果图,而是传递一种思想,也就是可视化方法论。
可视化基本流程
可视化不是一个算法,而是一个流程,有点像流水线,但这些流水线之间是可以相互作用的、双向的。
我们可以简单地将可视化流程分成三个部分:前端、处理、后端,这和软件的开发流程不是一个概念。
文字看起来不太直观,直接上图:
图中涉及到几个主要的部分:
- 数据采集。数据的采集直接决定了数据的格式、维度、尺寸、分辨率、精确度等重要性质,在很大程度上决定了可视化结果的质量。
- 数据变换。这个过程包括去除数据噪声、数据清洗、提取特征。
- 可视化映射。可视化映射是整个可视化流程的核心,它将数据的数值、空间位置、不同位置数据间的联系等,映射到不同的视觉通道ÿ