当前位置:   article > 正文

阿里云Dataworks平台应用_阿里云dataworks教程

阿里云dataworks教程

总体应用流程

应用流程图:

角色

开发、部署/运维、运维三种角色

涉及模块

数据集成模块、数据开发模块、发布管理模块、运维中心模块

数据处理

包括:数据输入、数据开发、数据输出(数据集成+数据开发模块);代码发布(发布管理模块);生产调度、生产运维(运维中心模块)

        数据输入

        就是数据的收集和数据存储,是数据开发的基础,首先要将不同业务系统的数据,分析要用到的数据同步到MaxCompute平台上来,这样才能利用MaxCompute海里数据存储和处理能力对数据处理加工和分析。、

        数据开发

        指的是数据的相关处理、清洗、加工、数据分析、统计、数据发掘等等。

        数据输出

        就是数据应用。就是加工好的数据通过数据提取、数据展现、数据分享等多种形式发挥价值作用

        代码发布

        数据处理的程序代码、自定义函数、涉及的数据表、调度配置等需要从开发环境发布部署到线上环境

        生产调度

        数据分析过程通过调度系统、运维中心调度运行。

用阿里云数据平台Dataworks进行数据分析的几个必要步骤:服务开通、数据输入、数据开发、任务运维。

服务开通

服务开通的流程图:

 服务开通是阿里云大数据应用的前提。也就是首先开通相关的服务产品。

已阿里云公有云为例:

服务产品购买

用阿里云账号登录阿里云平台、购买MaxCompute资源、创建工作空间、为了安全建议使用子账号来进行操作(因此需要创建子账号),为子账号添加权限,添加到项目中来。

通过MaxCompute控制台创建工作空间

点击创建项目,进入创建工作空间的操作界面

输入基本信息:工作空间名称、显示名称、选配模式。然后在点击创建项目,然后进入MaxCompute配置页面。

 配置MaxCompute项目的配置信息,涉及到:名称、付费模式、MaxCompute的数据类型(当前包括1.0数据类型和2.0数据类型,和Hive兼容类型,根据自己的需要选配),然后单击确认创建即可完成MaxCompute的创建。

基于DataWorks控制台创建DataWorks工作空间

DataWorks的工作空间就是MaxCompute的项目的概念,工作空间是DataWorks管理工作任务、成员、分配角色和权限的基本单元。前提是开通阿里云账号,使用主账号登录DataWorks控制台,在概览页面的快速入口进入创建项目空间的操作界面。具体配置如图所示

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/代码探险家/article/detail/1014008
推荐阅读
  

闽ICP备14008679号