当前位置:   article > 正文

(2) 快速上手第一个Flink应用程序--Java_flink 应用程序 java -jar执行

flink 应用程序 java -jar执行

环境配置

  1. Java

  2. Maven

    更改conf目录下的setting.xml文件中的依赖存储位置

  3. IDEA

前置条件: Maven 3.0.4(or higher) and Java 8.x

Flink开发批处理应用程序

  1. 需求
  • 词频统计(word count)
  • 一个文件,统计文件中每个单词出现的次数
  • 分隔符是\t
  • 统计结果我们直接打印在控制台(生产上肯定是Sink到目的地)
  1. 用Java实现

最新的文档是v.11版本,页面布局已经发生很大变化了。视频中是v1.7,链接为https://ci.apache.org/projects/flink/flink-docs-release-1.7/

在这里插入图片描述

创建项目的方式:

  • Use Maven archetypes:
   # 最后这个参数可以是官方文档中没有的,可以加快命令运行速度
   $ mvn archetype:generate                           \
      -DarchetypeGroupId=org.apache.flink              \
      -DarchetypeArtifactId=flink-quickstart-java      \
      -DarchetypeVersion=1.7.2                         \
      -DarchetypeCatalog=local    
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • Run the quickstart scipt
$ curl https://flink.apache.org/q/quickstart.sh | bash -s 1.7.2
  • 1

我的宿主机是Win10,mvn命令不是很方便(Powershell和cmd命令不完全兼容);所以使用第二个方式比较多

out of the box: OOTB 开箱即用

  1. 开发流程

    1. set up the batch execution environment

    2. read

    3. transform operations 开发的核心所在:开发业务逻辑

    4. execute programs

  2. 功能拆解

    1. 读取数据

    ​ hello welcome

    1. 每一行的数据按照指定的分隔符拆分

    ​ hello

    ​ welcome

    1. 为每一个单词附上次数为1

    ​ (hello, 1)

    ​ (welcome, 1)

    ​ welcome

    1. 为每一个单词附上次数为1

    ​ (hello, 1)

    ​ (welcome, 1)

    1. 合并操作
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/760510
推荐阅读
相关标签
  

闽ICP备14008679号