当前位置:   article > 正文

使用Maven构建Flink第一个项目

maven org.apache.flink

使用Maven构建Flink第一个项目

0.准备工作

下载Flink并运行!

1.IDEA创建Maven项目

点击左上角File->new Project->后面直接点击下一步->GroupID与artifactId、version随便填写->填写项目名称,点击完成。

注意:Maven打包后的jar包名字就是我们artifactId-version.jar格式,可以适当根据喜好在pom.xml修改。

pom.xml修改:

  1. <dependencies>
  2.     <dependency>
  3.         <groupId>org.apache.flink</groupId>
  4.         <artifactId>flink-streaming-java_2.11</artifactId> <!--2.11为scala.binary.version-->
  5.         <version>1.7.2</version> <!--Flink版本号-->
  6.     </dependency>
  7. </dependencies>

点击import change即可。

java class命名为:SocketTextStreamWordCount

填写下面代码:

  1. import org.apache.flink.api.common.functions.FlatMapFunction;
  2. import org.apache.flink.api.java.tuple.Tuple2;
  3. import org.apache.flink.streaming.api.datastream.DataStreamSource;
  4. import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
  5. import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
  6. import org.apache.flink.util.Collector;
  7. public class SocketTextStreamWordCount {
  8.     public static void main(String[] args) throws Exception {
  9.         //参数检查
  10.         if (args.length != 2) {
  11.             System.err.println("USAGE:\nSocketTextStreamWordCount <hostname> <port>");
  12.             return;
  13.         }
  14.         String hostname = args[0];
  15.         Integer port = Integer.parseInt(args[1]);
  16.         // set up the streaming execution environment
  17.         final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
  18.         //获取数据
  19.         DataStreamSource<String> stream = env.socketTextStream(hostname, port);
  20.         //计数
  21.         SingleOutputStreamOperator<Tuple2<StringInteger>> sum = stream.flatMap(new LineSplitter())
  22.                 .keyBy(0)
  23.                 .sum(1);
  24.         sum.print();
  25.         env.execute("Java WordCount from SocketTextStream Example");
  26.     }
  27.     public static final class LineSplitter implements FlatMapFunction<StringTuple2<StringInteger>> {
  28.         public void flatMap(String s, Collector<Tuple2<String, Integer>> collector) {
  29.             String[] tokens = s.toLowerCase().split("\\W+");
  30.             for (String token: tokens) {
  31.                 if (token.length() > 0) {
  32.                     collector.collect(new Tuple2<StringInteger>(token, 1));
  33.                 }
  34.             }
  35.         }
  36.     }
  37. }

2.编译与运行

Maven打包

第一种方式,进入pom.xml同级目录,输入:mvn clean package -Dmaven.test.skip=true

上述表示:不但跳过单元测试的运行,也跳过测试代码的编译。

另外一种方式,使用IDEA左边的Maven直接install即可打包。

640?wx_fmt=png

640?wx_fmt=png

最终看到BUILD SUCCESS就成功了。

nc 命令

nc 是一款功能类似 cat 的工具,但是是用于网络的。它是一款拥有多种功能的 CLI 工具,可以用来在网络上读、写以及重定向数据。

输入:sudo nc -l 1019

上述1019为端口号。

运行jar包

flink run -c SocketTextStreamWordCount 2-wordcount.jar 127.0.0.1 1019

需要配置环境变量flink或者进入flink的bin目录下运行,输入程序类名、jar包包名、端口号。

在nc处向端口发送数据,进入flink的log目录查看log日志,可以看到flink的统计结果。

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

问题:中文与特殊字符不能统计

上述学习参考自:http://www.54tianzhisheng.cn/2018/09/18/flink-install/


640?wx_fmt=png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/557280
推荐阅读
相关标签
  

闽ICP备14008679号