当前位置:   article > 正文

微软云计算平台Azure的学习教程_azure 学习

azure 学习

Boys,Grils,Friends,我是你的师哥or师弟,也可以是师姐or师妹哟!
领域展开:Java,Python,数据分析,数据可视化,大数据开发…
兴趣展开:阅读,旅游,运动,王者农药…

【今日重点:Azure的简介和使用步骤】

简介

Azure 是一个集存储和ETL的云平台,可以在此平台上可以进行数据的迁移、数据的etl以及数据的分析。
数据源支持一百多种,如常见的数据库(关系型、非关系型)、文件系统、hdfs、ftp文件、hive、hbase等;
数据的ETL支持hive,spark,pig,impala,mapreduce,以及已分装好的其他数据处理的功能;
数据的分析可以使用已分装好的功能(已经非常完善),亦可以写自定义。

下面是如何使用azure 的factory来解决问题,大致提纲
先简单说一下步骤,感兴趣的、有条件的可以去实操一下:

  1. 创建数据工厂(DataFactory)
  2. 创建链接服务(源端和目标端的配置信息)
  3. 创建输入端和输出端数据源(dataset)
  4. 创建活动(具体的操作)
  5. 创建管道(运行活动的地方)
  6. 创建管道运行(管道实例)
  7. 创建监控管道运行(可选)
  8. 启动(或者叫部署)
  9. 可以在监控面板查看管道运行情况

1. 创建数据工厂的常用方式

  1. 使用用户界面(UI)
  2. 使用"复制数据"工具(UI)
    - 1.新建容器
    - 2.创建数据工厂
    - 3.启动数据复制工具
  3. 使用python

2. 数据的接入、ETL、Analysis方式

2.1 移动/复制数据

  1. 使用数据复制工具(UI)
    - 数据库全表复制
    - 自定义筛选复制
    - 可定时配置复制
  2. 使用Python SDK

2.3 转换数据

  1. 使用Databricks python活动
  2. 使用HDInsight Hive活动
  3. 使用HDInsight Spark活动

2.4 分析数据

-分组、统计、极值、去重
- 更改行:对行的插入、删除、更新和更新插入
- 有条件拆分:分流
- 派生列:添加列
- Exists:类似与sql exists
- 筛选:类似与sql where
- 平展:获取层次结构数组值并展开到行
- 连接:类似与 sql join
- 查找:类似于sql left join
- 新建分支:一源,多接收器使用
- 分析:分析数据中文档形式的列,如json、xml、规则文本
- 透视:类似与 sql行转列
- 级别:排序
- Select:对列进行重命名、删除、重新排序等
- 接收器:可定义多个
- 排序:可选列进行升序、降序排列
- 源转换:至少需要一个
- 代理键:类似于sql的自增主键(非业务键)
- Union:多个数据流组合成一个数据流
- 逆透视:类似于sql的列转行
- 窗口:类似于flink的时间或统计窗口,如LEAD、LAG、NTILE、CUMEDIST、RANK

3.python使用的完整示例

"""
使用python来使用DF,以Azure blob文件-> Azure blob文件的复制 为例
"""
from azure.identity import ClientSecretCredential 
from azure.mgmt.resource import ResourceManagementClient
from azure.mgmt.datafactory import DataFactoryManagementClient
from azure.mgmt.datafactory.models import *
from datetime import datetime, timedelta
import time

# 打印概览信息
def print_item(group):
    """Print an Azure object instance."""
    print("\tName: {}".format(group.name))
    print("\tId: {}".format(group.id))
    if hasattr(group, 'location'):
        print("\tLocation: {}".
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/909302
推荐阅读
相关标签
  

闽ICP备14008679号