聊聊Hadoop、Storm、Spark Streaming、Flink在大数据领域的现状_大数据storm为什么被淘汰了

作者：小蓝xlanll | 2024-03-06 14:39:07

踩

大数据storm为什么被淘汰了

Hadoop 生态组件竞争激烈，Spark 优势明显，MapReduce 已进入维护模式

曾有开发人员表示，Hadoop 主要是被 MapReduce 拖累了，其实 HDFS 和 YARN 都还不错。堵俊平（腾讯云专家研究员）则认为 MapReduce 拖累 Hadoop 的说法并不准确：

首先 MapReduce 还是有应用场景，只是越来越窄，它仍然适合某些超大规模数据处理的批量任务，且任务运行非常稳定；

其次，Hadoop 社区对于 MapReduce 的定位就是进入维护模式，并不追求任何新的功能或性能演进，这样可以让资源投入到更新的计算框架，比如 Spark、Tez，促进其成熟。

HDFS 和 YARN 目前还是大数据领域分布式存储和资源调度系统的事实标准，不过也面临一些挑战。

对 HDFS 而言，在公有云领域，越来越多的大数据应用会选择跳过 HDFS 而直接使用云上的对象存储，这样比较方便实现计算与存储分离，增加了资源弹性。

YARN 也面临着来自 Kubernetes 的强大挑战，尤其是原生的 docker 支持，更好的隔离性以及上面生态的完整性。不过 K8S 在大数据领域还是追赶者，在资源调度器以及和对各计算框架支持上还有很大的进步空间。

Spark 在计算框架方面基本上占据了主导地位，MapReduce 主要是一些历史应用，而 Tez 更像是 Hive 的专属执行引擎。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小蓝xlanll/article/detail/199539