当前位置:   article > 正文

基于Spark技术的银行客户数据分析_银行数据分析项目案例

银行数据分析项目案例


申明: 未经许可,禁止以任何形式转载,若要引用,请标注链接地址
全文共计4672字,阅读大概需要3分钟

1. 实验室名称:

大数据实验教学系统

2. 实验项目名称:

案例:银行客户数据分析

一、业务场景

某银行积累有大量客户数据,现希望大数据分析团队使用Spark技术对这些数据进行分析,以期获得有价值的信息。

二、数据集说明

本案例用到的数据集说明如下:
  数据集文件:/data/dataset/bank-full.csv
  该数据集包含银行客户信息,其中部分字段的说明如下:

字段 定义
age 客户年龄
job 职业
marital 婚姻状况
education 受教育程度
balance 银行账户余额

三、操作步骤

阶段一、启动HDFS、Spark集群服务和zeppelin服务器

1、启动HDFS集群
  在Linux终端窗口下,输入以下命令,启动HDFS集群:


                
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/746527
推荐阅读
相关标签
  

闽ICP备14008679号