当前位置:   article > 正文

用Hive+Hadoop集群实现《飞机票购买人群分类案例》思路+代码 (实验数据待整理)_基于hadoop的高铁售票数据分析代码

基于hadoop的高铁售票数据分析代码


1. 思考:我们为什么要做《飞机票购买人群分类案例》?


当今社会,事事存在竞争,航空公司也不例外。想要从林立的航空公司中立足,就要有稳定且增长的盈利。

怎么保证这个盈利呢?这就要从营销策略上下手了,针对不同的客户采取不同的营销策略,才能保证最大的盈利。

那怎么找出不同的客户群呢?这就是这篇文章首先要探索的。


整体思路如下:1.根据航空公司的客户数据,对客户进行分类。

                            2.对不同的客户类别进行特征分析,比较不同类客户的客户价值。

                            3.对不同价值的客户类别提供个性化服务,制定相应的营销策略。


2.航空公司客户价值的LRFMC模型是什么?五个指标是什么?


LRFMC模型:

L:客户关系长度 = 会员入会时间距观测窗口结束的月数

R:消费时间间隔 =  客户最近一次乘坐公司飞机距观测窗口结束的月数 

F:消费频率 = 客户在观测窗口内乘坐公司飞机的次数

M:飞行里程 = 客户在观测窗口内累计的飞行里程

C:折扣系数的平均值 = 客户在观测窗口内乘坐舱位所对应的折扣系数的平均值



实验步骤如下:

启动Hadoop集群,myhql,hive,上传数据到/root/目录。

=============================================================================================

用Hive做数据预处理:

步骤如下:

1) hive -f create_air_data_base.hql  创建表


create table air_data_base(
member_no string,
ffp_date string,
first_flight_date string,
gender string,
ffp_tier int,
work_city string,
work_province string,
work_country string,
age int,
load_time string,
flight_count int,
bp_sum bigint,
ep_sum_yr_1 int,
ep_sum_yr_2 bigint,
sum_yr_1 bigint,
sum_yr_2 bigint,
seg_km_sum bigint,
weighted_seg_km double,
last_flight_date string,
avg_flight_count double,
avg_bp_sum double,
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/824794
推荐阅读
相关标签
  

闽ICP备14008679号