赞
踩
应用流程图:
开发、部署/运维、运维三种角色
数据集成模块、数据开发模块、发布管理模块、运维中心模块
包括:数据输入、数据开发、数据输出(数据集成+数据开发模块);代码发布(发布管理模块);生产调度、生产运维(运维中心模块)
数据输入
就是数据的收集和数据存储,是数据开发的基础,首先要将不同业务系统的数据,分析要用到的数据同步到MaxCompute平台上来,这样才能利用MaxCompute海里数据存储和处理能力对数据处理加工和分析。、
数据开发
指的是数据的相关处理、清洗、加工、数据分析、统计、数据发掘等等。
数据输出
就是数据应用。就是加工好的数据通过数据提取、数据展现、数据分享等多种形式发挥价值作用
代码发布
数据处理的程序代码、自定义函数、涉及的数据表、调度配置等需要从开发环境发布部署到线上环境
生产调度
数据分析过程通过调度系统、运维中心调度运行。
用阿里云数据平台Dataworks进行数据分析的几个必要步骤:服务开通、数据输入、数据开发、任务运维。
服务开通的流程图:
服务开通是阿里云大数据应用的前提。也就是首先开通相关的服务产品。
已阿里云公有云为例:
用阿里云账号登录阿里云平台、购买MaxCompute资源、创建工作空间、为了安全建议使用子账号来进行操作(因此需要创建子账号),为子账号添加权限,添加到项目中来。
点击创建项目,进入创建工作空间的操作界面
输入基本信息:工作空间名称、显示名称、选配模式。然后在点击创建项目,然后进入MaxCompute配置页面。
配置MaxCompute项目的配置信息,涉及到:名称、付费模式、MaxCompute的数据类型(当前包括1.0数据类型和2.0数据类型,和Hive兼容类型,根据自己的需要选配),然后单击确认创建即可完成MaxCompute的创建。
DataWorks的工作空间就是MaxCompute的项目的概念,工作空间是DataWorks管理工作任务、成员、分配角色和权限的基本单元。前提是开通阿里云账号,使用主账号登录DataWorks控制台,在概览页面的快速入口进入创建项目空间的操作界面。具体配置如图所示
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。