赞
踩
Nifi 安装 Nifi安装
Kafka安装 kafka安装
Nifi 最重要的就是Processor(数据处理单元)和FlowFlie(数据流)
FlowFile: 每条“用户数据”(即,用户通过NiFi获取或者是生成的,需要进行处理和分发的数据)均被称为FlowFile。 FlowFile由两部分组成:属性和内容。 内容是用户数据本身, 属性是与用户数据关联的键值对,用来提供一些额外的信息。比如fliename,表示的就是FlowFile的文件名,如果是通过GetFile从操作系统中取的文件的话,则filename就表示的是取到的文件的名称.
Processor:是NiFi中负责创建、发送、接收、转换、路由、拆分、合并和处理FlowFiles的业务组件。 它是NiFi用户可用于构建其数据流的最重要的构建块。
拖动图中红色创建一个组,然后在组中进行数据处理
工程完整数据流
分步骤创建
1.创建getfile
配置getfile
填写要复制文件所在的目录
同理创建一个putfile
身材flowfile
enable Getfile
然后start
同理putfile也要enable,然后start
Nifi 实时数仓建设全流程,数据推到kafka后,应该用flink进行实时计算和处理,这里先不介绍如何利用flink进行实时处理。只把数据推到kafka。
创建jsonrecordsetwriter
naespace :数据库名
info_test 表名
{ "namespace": "数据库名", "type": "record", "name": "info_test", "fields": [ { "name": "id", "type": [ "int", "null" ] }, { "name": "store_name", "type": [ "string", "null" ] }, { "name": "store_code", "type": [ "string", "null" ] }, { "name": "product_name", "type": [ "string", "null" ] }, { "name": "src_tbName", "type": "string", "default": "info_test" } ] }
然后点击生效
配置很简单
全部启动后,就能在kafka拿到消息
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。