赞
踩
Hadoop入门配置系列博客目录一览
1、Eclipse中使用Hadoop伪分布模式开发配置及简单程序示例(Linux下)
2、使用Hadoop命令行执行jar包详解(生成jar、将文件上传到dfs、执行命令、下载dfs文件至本地)
3、Hadoop完全分布式集群安装及配置(基于虚拟机)
4、Eclipse中使用Hadoop集群模式开发配置及简单程序示例(Windows下)
5、Zookeeper3.4.9、Hbase1.3.1、Pig0.16.0安装及配置(基于Hadoop2.7.3集群)
6、mysql5.7.18安装、Hive2.1.1安装和配置(基于Hadoop2.7.3集群)
7、Sqoop-1.4.6安装配置及Mysql->HDFS->Hive数据导入(基于Hadoop2.7.3)
8、Hadoop完全分布式在实际中优化方案
9、Hive:使用beeline连接和在eclispe中连接
10、Scala-2.12.2和Spark-2.1.0安装配置(基于Hadoop2.7.3集群)
11、Win下使用Eclipse开发scala程序配置(基于Hadoop2.7.3集群)
12、win下Eclipse远程连接Hbase的配置及程序示例(create、insert、get、delete)
hadoop入门示例详见本人github:https://github.com/Nana0606/hadoop_example
cd /opt/Hadoop
hdfs dfs -mkdir /local
执行代码之后,我们在网页上查看下,在浏览器中输入"http://localost:50070",点击“Utilities --> Browse the file system“,在地址栏上输入“/”,则在dfs系统上的所有文件夹及文件都会显示,如下图:
hdfs dfs -put /home/lina/input/sample.txt /local/
上传完毕,在上图中的页面上点击Name下的local链接,打开如下页面,发现sample.txt在列表中,点击sample.txt链接,会弹出sample.txt的详细信息。
cd
hadoop jar /home/lina/example.jar com/oss/maxtemperature/MaxTemperatureDriver /local/sample.txt /output/sampleout
其中,/home/lina/example.jar是jar包所在目录,com/oss/maxtemperature/MaxTemperatureDriver是因为main程序是放在com.oss.maxtemperature包下的MaxTemperatureDriver.java下,/local/sample.txt是dfs文件系统下的sample.txt输入文件的目录,/output/sampleout是设定的输出目录。
执行完毕,在浏览器中可以看到多了一个output的文件夹,output下面有sampleout文件夹,sampleout文件夹下是输出内容,包括_SUCCESS和part-r-00000文件(与Eclipse中使用Hadoop单机模式开发配置及简单程序示例 一致),如下图:
命令行截图如下:
hadoop fs -ls /local //这条命令作用是查看/local文件夹下的所有文件
hadoop fs -cat /local/sample.txt //这条命令作用是查看/local文件夹下sample.txt文件的内容
如图:
hadoop fs -get /output/sampleout/part-r-00000 //作用:将HDFS文件系统/output/sampleout文件夹下的part-r-00000文件下载至根目录下
hadoop fs -get /output/sampleout/part-r-00000 /home/lina/temp/ //作用:将HDFS文件系统/output/sampleout文件夹下的part-r-00000文件下载至/home/lina/temp目录下
3、删除文件的命令
hadoop fs -rm /local/sample.txt //作用:将/local文件目录下的sample.txt文件删除
hadoop fs -rm -r /local //将local文件夹及其内部的文件删除
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。