当前位置:   article > 正文

Apache Flink 概览 - 有状态的流式计算

流式计算 有状态数据

 

Flink的主要特性如下:

 

一、所有的流式使用用例

 

  • 事件驱动的应用
  • 流式 & 批量分析
  • 数据 Pipelines & ETL

二、保证正确性

 

  • 严格一次(Exactly-once) 状态一致性
  • 基于消息时间(Event-time)的 处理
  • 复杂的后期数据处理(Sophisticated late data handling)

三、分层的API

 

  • 基于流和批量数据的SQL
  • DataStream API 和 DataSet API
  • 基于时间和状态的处理函数

四、操作重点(Operational Focus)

 

  • 灵活的部署
  • 高可用的设置
  • 保存点(SavePoint)

五、扩展至任何用例

 

  • 横向扩展的架构(Scale-out architecture)
  • 支持大量的状态
  • 增量的checkpointing

六、卓越的性能

 

  • 低延时
  • 高吞吐
  • 基于内存的计算

 

 

笔者水平有限,有些地方如有翻译不适,尽请指出。

 

如想对flink特性了解更多,请参考:http://flink.apache.org/

 

 

打个广告,个人网站:http://www.leaderanking.com/

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/969869
推荐阅读
相关标签
  

闽ICP备14008679号