赞
踩
Apache Flink 是一个开源的流处理和批处理框架,用于大数据处理和分析。它旨在以实时和批处理模式高效处理大量数据。Flink 支持事件时间处理、精确一次语义、有状态计算等关键功能。
以下是与Apache Flink相关的一些主要特性和概念:
流处理和批处理:
事件时间处理:
精确一次语义:
有状态计算:
容错性:
丰富的 API 集:
库和连接器:
社区和生态系统:
动态扩展:
兼容性:
总体而言,Apache Flink 是构建实时和批处理数据处理应用程序的强大而灵活的框架,适用于大数据领域的各种用例。
主节点JobManager(Master)和从节点TaskManager(Slave)在一台机器上模拟
Flink程序由JobClient进行提交
JobClient将任务提交给JobManager
JobManager只负责协调分配资源和分发任务,资源分配完成后将任务提交给相应的TaskManager
TaskManager启动一个线程开始执行任务,TaskManager会向JobManager报告状态的变更, 例如:开始执行、正在执行、执行完成
作业执行完成后,结果将发送回客户端(JobClient)
yum install java-1.8.0-openjdk.x86_64
yum install -y java-1.8.0-openjdk-devel
wget --no-check-certificate https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.17.2/flink-1.17.2-bin-scala_2.12.tgz
mkdir -p /opt/flink
tar -zxvf flink-1.17.2-bin-scala_2.12.tgz -C /opt/flink
/opt/flink/flink-1.17.2/bin/stop-cluster.sh
/opt/flink/flink-1.17.2/bin/start-cluster.sh
访问http://10.6.8.227:8081/
# 可以只执行上面这个,也可以加上下面的参数
/opt/flink/flink-1.17.2/bin/flink run /opt/flink/flink-1.17.2/examples/batch/WordCount.jar --input /root/words.txt --output /root/out
停止Flink:
/opt/flink/flink-1.17.2/bin/stop-cluster.sh
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。