当前位置:   article > 正文

Hive-tez合并小文件_tez 合并小文件

tez 合并小文件

-》1. hive-sql 方式, 小文件产生和最后的map任务数量有关系

原来是7W多个

查看hive表对应hdfs文件的数量,可以看这里

https://mp.csdn.net/mp_blog/creation/editor/new/129703080

  1. SET hive.merge.tezfiles=true; --开启合并
  2. SET hive.merge.mapfiles = true; --在map only任务结束时合并小文件
  3. SET hive.merge.mapredfiles = true; --为true时在mapreduce任务结束时合并小文件
  4. SET hive.merge.size.per.task = 256000000; --合并文件大小
  5. SET hive.merge.smallfiles.avgsize = 160000000; --文件合并标准(低于16000000kb进行合并)
  6. INSERT overwrite TABLE ods.ods_s4_matdoc
  7. SELECT *
  8. FROM ods.ods_s4_matdoc;

执行完后,查询对应hdfs文件数的变化,变成了400多

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/727930
推荐阅读
相关标签
  

闽ICP备14008679号