赞
踩
批处理主要操作大容量静态数据集,并在计算过程完成后返回结果。可以认为处理的是一个固定时间间隔分组的数据点集合。批处理模式中使用的数据集通常符合下列特征:
流处理可以对随时进入系统的数据进行计算。流处理方式无需针对整个数据集执行操作,而是对通过系统传输的每个数据项执行操作。流处理中的数据集是“无边界”的,这就产生了几个重要的影响:
Windows10、Centos7(三集群,三台分别都是6G,8核)、Idea2019.3、Maven3.3.9、Flink1.7.2、kafka2.11-2.1.0、sacla2.1.18、jdk1.8
一共是五份淘宝用户行为数据集,保存为 csv 文件。此数据集包含了淘宝上某一天随机一百万用户的所有行为(包括点击、购买、收藏、喜欢)。数据集的每一行表示一条用户行为,由用户 ID、商品 ID、商品类目 ID、行为类型和时间戳组成,并以逗号分隔,分别保存在每一个分项目的resource中
Flink电商用户行为分析系统(用户画像)Github地址
可Fork可Clone
Flink电商用户行为分析系统(用户画像)Gitee地址
可Fork可Clone
Flink电商用户行为分析系统(用户画像)源码下载
直接下载即可
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。