搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
不正经
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
小程序展开收起
2
如何在前端实现WebSocket发送和接收TCP消息(多线程模式)
3
Elasticsearch的使用RestHighLevelClient_elasticsearch-rest-high-level-client 使用教程
4
STM32完美移植RT-Thread实时操作系统_rtconfig.h
5
注解处理器、ServiceLoader 开发SpringCloud启动参数拓展类_implements launcherservice
6
带你深入浅出Vue
7
Windows 服务资料不错_cserctrl.writetolog vc
8
校验 ChatGPT 4.0 真实性的三个经典问题:快速区分 GPT3.5 与 GPT4,并提供免费测试网站_gpt4.0测试csdn
9
C语言:通过自定义函数实现查找功能_c语言查找函数怎么写
10
对于超出一行的文本进行(展开/收起)操作的vue组件,实测好用_vue 判断内容是否超过一行
当前位置:
article
> 正文
flume框架案例之抽取文件_flume支持文件抽取吗
作者:不正经 | 2024-02-16 00:41:20
赞
踩
flume支持文件抽取吗
======
1.配置a3.conf
===========
a3.sources = r3
a3.sinks = k3
a3.channels = c3
# Describe/configure the source
# 源是某个目录使用spooldir
a3.sources.r3.type = spooldir
# 抽取的目录 $ cp -r ${HADOOP_HOME}/logs/* /home/user01/logs ->执行完之后,会在原文件后面自动加一个.COMPLETED,所以换个目录比较合适
a3.sources.r3.spoolDir = /home/user01/logs
# 抽取该目录下符合包含.log结尾的文件 用正则表达式去除不符合要求的文件a3.sources.r3.ignorePattern = ^.*out.*
# 设置channel类型是file
a3.channels.c3.type = file
# 设置检查点目录,记录已经获取哪些文件,一些元数据信息
a3.channels.c3.checkpointDir = /opt/modules/cdh/flume-1.5.0-cdh5.3.6/checkpoint
#设置缓存的数据存储目录
a3.channels.c3.dataDirs = /opt/modules/cdh/flume-1.5.0-cdh5.3.6/bufferdata
# 设置sinks的输出类型
a3.sinks.k3.type = hdfs
# 启用设置多级目录,这里按年/月/日/时 2级目录,每个小时生成一个文件夹
a3.sinks.k3.hdfs.path = hdfs://bigdata.ibeifeng.com:8020/flume2/%Y%m%d/%H
# 设置HDFS生成文件的的前缀
a3.sinks.k3.hdfs.filePrefix = accesslog
#启用按时间生成文件夹
a3.sinks.k3.hdfs.round = true
#设置round单位:小时
a3.sinks.k3.hdfs.roundValue = 1
a3.sinks.k3.hdfs.roundUnit = hour
#使用本地时间戳
a3.sinks.k3.hdfs.useLocalTimeStamp = true
# 设置每次写入的DFS的event的个数为100个
a3.sinks.k3.hdfs.batchSize = 100
# 写入HDFS的方式
a3.sinks.k3.hdfs.fileType = DataStream
# 写入HDFS的文件格式
a3.sinks.k3.hdfs.writeFormat = Text
#设置解决文件过多过小问题
#每600秒生成一个文件
a3.sinks.k3.hdfs.rollInterval = 60
#当达到128000000bytes时,创建新文件 127*1024*1024
#实际环境中如果按照128M回顾文件,那么这里设置一般设置成127M
a3.sinks.k3.hdfs.rollSize = 128000000
#设置文件的生成不和events数相关,与时间和大小相关
a3.sinks.k3.hdfs.rollCount = 0
#设置成1,否则当有副本复制时就重新生成文件,上面三条则没有效果
a3.sinks.k3.hdfs.minBlockReplicas =1
//
channel 连接
sources和
sinks
# Bind the source and sink to the channel
a3.sources.r3.channels = c3
a3.sinks.k3.channel = c3
===================================
2.启动Flume-agent a3
$ bin/flume-ng agent --conf conf --conf-file conf/a3.conf --name a3 -Dflume.root.logger=INFO,console
bin/flume-ng agent --conf conf --conf-file conf/a3.conf --name a3 -Dflume.root.logger=INFO,console
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/不正经/article/detail/88929
推荐阅读
article
计算机
基础知识
(
免费
、
全面)_
免费
计算机
基础知识
重点
归纳...
查看目录网络
基础知识
*
计算机
基础知识
1*
计算机
基础知识
2#
计算机
病毒* 病毒:人为编制的程序,特点有隐蔽性
、
传染性...
赞
踩
article
局域网
中
发送
数据
传输
流程
_有
局域网
电脑转发
数据
给
服务器
...
局域网
传输
流程
_有
局域网
电脑转发
数据
给
服务器
有
局域网
电脑转发
数据
给
服务器
...
赞
踩
article
【
计算机网络
原理
】
第
1 章
:
计算机网络
概述
_
计算机网络
原理
第
一章
...
计算机网络
概述
:
计算机网络
基本概念、
计算机网络
结构、数据交换技术、
计算机网络
性能、
计算机网络
体系结构、
计算机网络
与因特网...
赞
踩
article
CIAA
网络
安全
模型 — 数据传输
安全
_
qhisbf
...
后续,当 Server 向 Client 发送数据时,中间人故技重施的将数据劫持,用一开始劫持的 Public Key ...
赞
踩
article
unity
-
scene
,右键+
aswd
移动
很慢的问题_
unity
滚轮
速度太慢...
问题: 今天导入一个模型之后,发现两个问题:
滚轮
滚到一定程度,物体还没看到全貌,就滚不动了。 按住右键,用
aswd
移动
...
赞
踩
article
android
adb
pull
/
push
permission
denied
可能的解决办法_ad...
android
adb
pull
/
push
permission
denied
可能的解决办法1、_
adb
push
没有权...
赞
踩
article
mysql
中文
编码问题...
最近在学springboot整合mybatisplus技术,用到
mysql
数据库,然后发现在windows下插入数据表会...
赞
踩
article
7
大
最
常用
ChatGPT
Excel
最
佳
使用
示例(
最
后附微软官方
Excel
-
ChatGPT
插件
使用
方...
自从OpenAI为开发者开放了
ChatGPT
API后
,
在
很短的时间内出现了
大
量的创意应用程序。许多相关的
插件
已经出现
在
...
赞
踩
article
车
联网
安全
知识点总结_
汽车
信息
安全
学习...
随着信息
安全
和智能网联
汽车
的发展,
汽车
的信息
安全
越来越受到人们的重视。高通公司总裁兼CEO安蒙称“
汽车
已经变成车轮上的联...
赞
踩
article
CVPR
2023:
GANmouflage
: 3D
Object
Nondetection
wit...
该方法在对象的 3D 表示和场景的 3D 表示上进行操作,考虑深度和视点变化。伪装的有效性通过人类视觉搜索研究进行评估,...
赞
踩
article
2024
年
美赛
思路_
2024
美赛
思路...
先开个坑,,开题后更新。_
2024
美赛
思路
2024
美赛
思路 先开个坑,码住,开题后更新。 &nb...
赞
踩
article
php
中
函数
禁用
绕过
的
原理
与利用
_
ini
_
set
()
绕过
...
bypass disable function是否遇到过费劲九牛二虎之力拿了webshell却发现连个scandir都执...
赞
踩
article
微信小程序——
>
<>em
>
slot
>
<>/em
>
插槽的
>
<>em
>
使用
>
<>/em
>
(多插槽
>
<>em
>
使用
>
<>/em
>
)_
>
<>
>
<>em
>
slot
>
<>/em
>
>
>
<>em
>
节点
>
<>/em
>
...
一,创建组件在根目录项目创建一个components文件夹目录,然后在里面创建你的组件,这里我们要注意创建组件页面时我们...
赞
踩
article
计算机网络
知识
汇总(超详细
整理
)
_
计算机网络
全局
理解
...
为了准备期末考试,同时也是为了之后复习方便,特对
计算机网络
的
知识
进行了
整理
。本篇内容大部分是来源于我们老师上课的ppt。...
赞
踩
article
IPV4
地址
详解...
包含
地址
分类、子网划分、无分类编制CIDR和划分子网内容。在一定程度上提高了IP
地址
空间的利用,但是数量巨大的C类网因为...
赞
踩
article
Unity
学习笔记
_
m
_
rigidbody2d
.
addforce
...
向左移动人物using System.Collections;using System.Collections.Gene...
赞
踩
article
selenium
浏览器检测 绕过
_
excludeswitches
selenium
...
from
selenium
.webdriver import Chromeimport timefrom seleniu...
赞
踩
article
SpringBoot
分页插件(
PageHelper
)_
springboot
pagehelper
...
PageHelper
.startPage(int PageNum,int PageSize):用来设置页面的位置和展示的...
赞
踩
article
好书推荐 | 详解
云
安全
攻防
模型
,
这些
攻击
战略和
战术
越早知道越好(送书福利)
...
...
云
计算在带来便利的同时
,
也带来了新的
安全
技术风险、政策风险和
安全
合规风险。那么
,
如何设计
云
计算
安全
架构、如何保障
云
计算平...
赞
踩
article
MySQL
——使用
mysqldump
备份
与恢复
数据
_
mysqldump
备份
数据
库
...
mysqldump
命令可以将
数据
库
中指定或所有的库、表导出为SQL脚本。表的结构和表中的
数据
将存储在生成的SQL脚本中。...
赞
踩
相关标签
计算机基础知识
计算机网络原理
安全
web安全
网络
unity
adb pullpush
android
permission denied
mysql
数据库
chatgpt
excel
microsoft
自然语言处理
人工智能
汽车
网络安全
物联网
3d
伪装
信息熵
用户态
数学建模