当前位置:   article > 正文

《Spark与Hadoop大数据分析》一一1.5 小结

《Spark与Hadoop大数据分析》一一1.5 小结

本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第1章,第1.5节,作者:文卡特·安卡姆(Venkat Ankam) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.5 小结

使用Hadoop和Spark的大数据分析大致分为两大类:数据分析和数据科学。数据分析侧重于过去和现在的统计,而数据科学侧重于未来的统计。数据科学项目本质上是迭代的,而数据分析项目则不是迭代的。
Apache Hadoop为你提供了分布式存储和资源管理,Spark为你提供了大数据分析的内存级性能。在大数据分析中,需要根据用例的类型及其可行性来使用各种工具和技术。
下一章将帮助你开始学习Hadoop和Spark。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/648660
推荐阅读
相关标签
  

闽ICP备14008679号