赞
踩
打开spark-shell,输入下面代码(注意“yourPATHinHDFS”这里换成自己文件的路径)
val textFile = sc.textFile("hdfs://localhost:9000/yourPATHinHDFS/test.txt")
因为我的是json数据,就可以通过下面这条命令显示
textFile.collect
实现计数,一共有多少行
textFile.count()
打印第一行
textFile.first()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。