当前位置:   article > 正文

hive通用优化-join优化_hive.auto.convert.join.noconditionaltask.size

hive.auto.convert.join.noconditionaltask.size

        底层还是mr的join优化。map join适合小表join大表或者小表join小表。

  1. #是否开启自动转为mapjoin 在满足条件的情况下 默认true
  2. hive.auto.convert.join=true
  3. Hive老版本
  4. #如果参与的一个表大小满足条件 转换为map join
  5. hive.mapjoin.smalltable.filesize=25000000
  6. Hive2.0之后版本
  7. #是否启用基于输入文件的大小,将reduce join转化为Map join的优化机制。假设参与join的表(或分区)有N个,如果打开这个参数,并且有N-1个表(或分区)的大小总和小于hive.auto.convert.join.noconditionaltask.size参数指定的值,那么会直接将join转为Map join
  8. hive.auto.convert.join.noconditionaltask=true
  9. hive.auto.convert.join.noconditionaltask.size=512000000

        reduce join适合于大表join大表。

        bucket join适合于大表join大表。

                方式一:Bucket map join

  1. 语法: clustered by colName(参与join的字段)
  2. 参数: set hive.optimize.bucketmapjoin = true
  3. 要求: 分桶字段 = Join字段 ,分桶的个数相等或者成倍数,必须是在map join

                方式二:sort merge bucket join

  1. 基于有序的数据Join
  2. 语法:clustered by colName sorted by (colName)
  3. 参数
  4. set hive.optimize.bucketmapjoin = true;
  5. set hive.auto.convert.sortmerge.join=true;
  6. set hive.optimize.bucketmapjoin.sortedmerge = true;
  7. set hive.auto.convert.sortmerge.join.noconditionaltask=true;
  8. 要求: 分桶字段 = Join字段 = 排序字段,分桶的个数相等或者成倍数

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/976989
推荐阅读
相关标签
  

闽ICP备14008679号