当前位置:   article > 正文

Flink--source/数据不同的来源_flink env.fromsource

flink env.fromsource

Flink Source不同的来源

1、Source几个不同的来源

//创建环境
val env = StreamExecutionEnvironment.getExecutionEnvironment

//基本的数据源
//1、端口数据源
env.socketTextStream(“master”,6666)		//连接虚拟机等端口,master是虚拟机主机名,也可以是ip

//2、文件数据源
env.readTextFile(path,"UTF_8")			//path是要读取文件的路径,utf-8是字符编码

//3、本地数据源
env.fromSequeence(1,100)		//是一个Seq,从1到100		内容

env.fromCollection(List(1,2,3,4))		//是一个集合列表,内容格式要一致

env.fromElements(1,2,3,"d")			//单个元素,,内容格式可以不一样

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

2、kafka作为数据源,flink读取

kakfa producer生产者产生数据,flink读取
  • 1
//创建环境
val env = StreamExecutionEnvironment.getExecutionEnvironment

//定义kakfa消费者配置文件
val props = new Properties()

//可以传入多个生产者,,master是主机名,也可以换成ip
props.setProperty(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,"master:9092,slave1:9092",)
//分组名称
props.setProperty(ConsumerConfig.GROUP_ID_CONFIG,"gr01")

//读取kafka生产者产生的数据
//addSource需要的参数是一个SourceFunction,这里传入的是FlinkKafkaConsumer,也可以自定义,继承RichParallelSourceFunction即可
//FlinkKafkaConsumer:参数1,主题,参数2,序列化,参数3,配置文件
val inputStream = env.addSource(new FlinkKafkaConsumer[String]("test", new SimpleStringSchema(), props))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

3、myslq数据库作为数据源,且自定义Source

object MyJDBCSource {
  def main(args: Array[String]): Unit = {

//创建环境
val env = StreamExecutionEnvironment.getExecutionEnvironment

//调用addSource,传入自己写的自定义的Source
env.addSource(new MyJDBCSourceFunc)
.print()

//启动
env.execute()
	}
}

//自定义Source数据源
//在同一个文件下创建一个类,然后继承RichParallelSourceFunction,是多线程的
//参数Worker是一个自己写的样例类,是根据数据中的数据来编写的
class MyJDBCSourceFunc extends RichParallelSourceFunction[Worker] {

	var conn:Connection = _
	var statement:PreparedDtatement = _
	var flag:Boolean = true
//连接数据库
override def open(oarameters:Configuartion):Unit = {
	conn = DriverManager.getConnection("jdbc:mysql://localhos:3306/test?characterEncoding=utf-8&serverTimezone=UTC","root","147258")
	statemant = conn.prepareStatement("select * from stu")
} 

//对从数据库中读取的数据做输出
override def run(ctx:SourceFunction.SourceContext[Worker]):Unit={
//用flag控制循环
while(flag){	
	Thread.sleep(5000)
	val resultSet = statement.executeQuery()
	while(restultSet.next()){
		val id = resultSet.getInt(1)
		val name = resultSet.getString(2)
		ctx.collect(Worker(id,name)) 
		}
	}
}

//控制循环override def cancel():Unit = flag =flase

//关闭连接
override def close():Unit = {
	if(statemant!=null) statemant.close()
    if(conn!=null) conn.close()
}


}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/779571
推荐阅读
相关标签
  

闽ICP备14008679号