赞
踩
lz最近在研究hadoop,刚在入门阶段,对一些高深的知识点还不在行,但是我希望能够通过自己点点滴滴的学习总结,在日复一日的过程中,逐渐积累相关的学习经验,从而能够逐步成为hadoop方面、spark甚至是大数据方面的专家。
那么只能先从一些小的demo开始学些,这里要介绍的一个小demo是在给定的一个文件中,求出每年的最高气温。
2014010114 2014010216 2014010317 2014010410 2014010506 2012010609 2012010732 2012010812 2012010919 2012011023 2001010116 2001010212 2001010310 2001010411 2001010529 2013010619 2013010722 2013010812 2013010929 2013011023 2008010105 2008010216 2008010337 2008010414 2008010516 2007010619 2007010712 2007010812 2007010999 2007011023 2010010114 2010010216 2010010317 2010010410 2010010506 2015010649 2015010722 2015010812 2015010999 2015011023
这里的数据,前4位表示的是年份,中间四位表示的是月和日,最后两位表示的是当天的温度。那么现在要利用hadoop来实现在这些所有的日期里的温度,选取最高的温度。
首先,通过新建一个maven项目,那么需要更新pom.xml文件,写入依赖的jar包。
- <dependencies>
- <dependency>
- <groupId>org.apache.hadoop</groupId>
- <artifactId>hadoop-common</artifactId>
- <version>2.7.1</version>
- </dependency>
- <dependency>
- <groupId>org.apache.hadoop</groupId>
- <artifactId>hadoop-hdfs</artifactId>
- <version>2.7.1</version>
- </dependency>
- <dependency>
- <groupId>org.apache.hadoop</groupId>
- <artifactId>hadoop-mapreduce-client-core</artifactId>
- <version>2.7.1</version>
- </dependency>
- <dependency>
- <groupId>org.apache.hadoop</groupId>
- <artifactId>hadoop-mapreduce-client-common</artifactId>
- <version>2.7.1</version>
- </dependency>
- <dependency>
- <groupId>org.apache.hadoop</groupId>
- <art

Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。