当前位置:   article > 正文

大数据Flink(一百零八):阿里云与开源的功能优势对比

大数据Flink(一百零八):阿里云与开源的功能优势对比

文章目录

阿里云与开源的功能优势对比


阿里云与开源的功能优势对比

下面通过表格介绍阿里云实时计算Flink全托管产品的功能点和价值,以及和开源Flink的对比优势。

类型

功能

描述

价值

性能与成本

资源利用率提升

可以根据业务负载进行弹性扩缩容。

更好的引擎性能和更细粒度资源配置使得整体TCO优于开源,且灵活的付费模式以及智能扩缩容,进一步提高了资源使用的精细程度。

可以配置智能调优,无人值守自动监控并调整作业资源分配,并可以在指定时间段应用对应的资源计划,帮助我们平稳顺利地度过业务洪峰,同时最大程度的节省成本。

可以进行细粒度资源管理,支持SQL算子级别的精细化资源(CPU和Memory)配置,大规模作业资源利用率提升100%。

付费类型

可以根据自身业务特点,选择包年包月或者按量付费。

核心性能提升

在Nexmark流计算标准性能测试中性能是开源Flink的2倍左右,同时API和社区保持完全兼容。

特色能力

数据实时入湖入仓

支持整库实时同步、分库分表实时同步和表结构变更实时同步。

可以更加高效便捷的对包含分库分表等架构的业务数据库、消息中间件中的数据进行实时的入湖入仓。

实时风控场景能力

企业级复杂事件处理(CEP)支持作业无需重启动态可配置规则,实现在线实时风控等场景的不间断生产级能力。

应用于实时营销、实时风控、安全态势感知等领域,提升开发效率和大规模数据处理能力,同时保证业务连续性。

上下游数据连接(Connector)

  • 涵盖阿里云产品和开源社区30+主流引擎,涉及数据库、消息中间件、数据仓库、湖格式、文件系统等多种上下游存储。
  • 支持特有数据模拟Connector贴近业务含义的测试数据。
  • 相对开源版本,Connector也有诸多易用性和稳定性提升。
  • 可以按需自定义注册Connector对接各种外部存储系统。

无需自己开发对接各种上下游生态,并操心稳定性和性能。

开发效率

作业开发

多语言支持:一站式开发管理平台,包括SQL、Java、Scala和Python语言。

无需自己搭建或者对接开源。Flink SQL简单易懂,整体开发环境上手便捷。

多版本支持:支持主流Flink版本,包括多版本作业代码比较和回滚。

提供元数据管理:可以通过Catalog连接常见的上下游组件(例如MySQL、Hive、Hologres、DLF和Kafka等),进行统一元数据管理与使用。

自定义函数:可以方便的管理和使用自定义函数。

代码模板:提供20多个Flink SQL通用场景的模版,帮助我们快速了解如何使用Flink SQL构建作业代码。

代码调试

测试数据管理:支持线上采样和模拟测试数据管理,方便构建测试流程。

程序员、甚至是数据分析师都可以完成调试和上线的动作,大幅减少调试测试成本,提高作业上线速度和质量。

快速运行调试:基于Session集群实现作业秒级启停,大幅提高作业调试效率。

中间结果展示:支持中间结果展示,提高复杂SQL的调试效率。

开发生产隔离:开发调试过程不影响生产作业和数据。

运维管理

监控告警

丰富的指标监控和维度聚合,便于排查作业延迟、数据倾斜、反压等问题。

大幅提高系统稳定性,减少运维工作量,降低调优的难度。精细化资源管理,大幅度降低成本。提供原厂高可用服务保障。

通过钉钉、邮件、短信、电话等途径进行及时告警,并可对接企业内部统一监控告警系统(Prometheus)。

问题分析与诊断

动态修改作业的配置,无需启停即可对日志Level、火焰图是否开启等配置进行在线调整。

对于反压、Job异常、TM失联等常见问题提供智能化诊断和快速日志定位分析,给出调优或者修改建议,并连动自动调优能力帮助您定位问题。

高可用保障

原厂运维服务兜底,SLA 99.9%保证。

全链路自动容错能力,支持JobManager容错,系统无单点,更稳定。

提供更快速的非全局(单点)容错恢复能力,在数据一致性和业务连续性间提供灵活平衡。

状态管理

提供完整的系统检查点和作业快照生命周期管理,提供状态兼容性检查和状态数据迁移,以最大可能的复用原来的状态数据。

企业安全

空间隔离

支持租户级和项目级的资源和代码隔离,满足跨团队协作需求。

提供了企业多部门协同工作互不干扰的能力,安全可控地满足企业内控外审要求。

访问控制

与阿里云账号体系打通,支持多角色的访问控制。


推荐阅读
相关标签