当前位置:   article > 正文

一些hadoop入门小demo_hadoop demo

hadoop demo

lz最近在研究hadoop,刚在入门阶段,对一些高深的知识点还不在行,但是我希望能够通过自己点点滴滴的学习总结,在日复一日的过程中,逐渐积累相关的学习经验,从而能够逐步成为hadoop方面、spark甚至是大数据方面的专家。

那么只能先从一些小的demo开始学些,这里要介绍的一个小demo是在给定的一个文件中,求出每年的最高气温。

  1. 2014010114
  2. 2014010216
  3. 2014010317
  4. 2014010410
  5. 2014010506
  6. 2012010609
  7. 2012010732
  8. 2012010812
  9. 2012010919
  10. 2012011023
  11. 2001010116
  12. 2001010212
  13. 2001010310
  14. 2001010411
  15. 2001010529
  16. 2013010619
  17. 2013010722
  18. 2013010812
  19. 2013010929
  20. 2013011023
  21. 2008010105
  22. 2008010216
  23. 2008010337
  24. 2008010414
  25. 2008010516
  26. 2007010619
  27. 2007010712
  28. 2007010812
  29. 2007010999
  30. 2007011023
  31. 2010010114
  32. 2010010216
  33. 2010010317
  34. 2010010410
  35. 2010010506
  36. 2015010649
  37. 2015010722
  38. 2015010812
  39. 2015010999
  40. 2015011023

这里的数据,前4位表示的是年份,中间四位表示的是月和日,最后两位表示的是当天的温度。那么现在要利用hadoop来实现在这些所有的日期里的温度,选取最高的温度。

首先,通过新建一个maven项目,那么需要更新pom.xml文件,写入依赖的jar包。

  1. <dependencies>
  2. <dependency>
  3. <groupId>org.apache.hadoop</groupId>
  4. <artifactId>hadoop-common</artifactId>
  5. <version>2.7.1</version>
  6. </dependency>
  7. <dependency>
  8. <groupId>org.apache.hadoop</groupId>
  9. <artifactId>hadoop-hdfs</artifactId>
  10. <version>2.7.1</version>
  11. </dependency>
  12. <dependency>
  13. <groupId>org.apache.hadoop</groupId>
  14. <artifactId>hadoop-mapreduce-client-core</artifactId>
  15. <version>2.7.1</version>
  16. </dependency>
  17. <dependency>
  18. <groupId>org.apache.hadoop</groupId>
  19. <artifactId>hadoop-mapreduce-client-common</artifactId>
  20. <version>2.7.1</version>
  21. </dependency>
  22. <dependency>
  23. <groupId>org.apache.hadoop</groupId>
  24. <art
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Li_阴宅/article/detail/824804
推荐阅读
相关标签
  

闽ICP备14008679号