赞
踩
数据体系介绍
整体分为业务服务、数据抽取、调度系统、数据仓库、数据服务、数据应用、数据挖掘、数据治理等
业务存储:以mysql为主,另有也有TiDB可以选择
数据抽取:canel、flume为主,数据到kafka
数据仓库:实时Flink、离线Hive、Spark、Presto;dataX
业务应用:Doris、Tair、Redis、MySQL
数据接口:OneService数据服务
调度系统:Cantor 美团调度系统,同类开源项目有AirFlow
魔数平台:用于执行SQL查询,下载结果集的系统。通常在数据分析阶段使用。
协同平台:用于使用SQL开发ETL的平台。通常用于数据生产。
托管平台:用于管理和运行Spark任务,用户提供任务的代码仓库,系统管理和运行任务。通常用于逻辑较复杂的ETL、基于Spark的离线模型训练/预测任务等。
调度平台:用于管理任务的依赖关系,周期性按依赖执行调度任务。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。