赞
踩
数据仓库
离线数仓
hadoop是完全分布式噢
➢数据采集传输: Flume,Kafka, Sqoop
➢数据存储: MySQL,HDFS,HBase,
➢数据计算: Hive, Tez,Spark
➢数据查询: Presto,Kylin ,
➢数据可视化: Superset
➢任务调度: Azkaban
➢集群监控: Zabbix
用的Linux系统是三个节点完全分布式的hadoop集群
私聊我部署安装噢!图一是项目流程简介噢
可以只要虚拟机环境
可以做学习项目,如果是想学习大数据但是懒得搭建集群的也适用。
感兴趣的话点“我想要”和我私聊吧~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。