赞
踩
大数据实验教学系统
案例:银行客户数据分析
某银行积累有大量客户数据,现希望大数据分析团队使用Spark技术对这些数据进行分析,以期获得有价值的信息。
本案例用到的数据集说明如下:
数据集文件:/data/dataset/bank-full.csv
该数据集包含银行客户信息,其中部分字段的说明如下:
字段 | 定义 |
---|---|
age | 客户年龄 |
job | 职业 |
marital | 婚姻状况 |
education | 受教育程度 |
balance | 银行账户余额 |
1、启动HDFS集群
在Linux终端窗口下,输入以下命令,启动HDFS集群:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。