当前位置:   article > 正文

hive中通用调优-fetch抓取-mr本地模式_hive本地模式,没有mr

hive本地模式,没有mr

        Fetch抓取机制:在执行SQL的时候,能不走mr就不走mr,尽量直接去操作数据文件。

        参数设置:hive.fetch.task.conversion= more。

        通常情况下,全局查找,字段查找,limit查找都不走mr程序。

  1. --在下述3种情况下 sql不走mr程序
  2. --全局查找
  3. select * from student;
  4. --字段查找
  5. select num,name from student;
  6. --limit 查找
  7. select num,name from student limit 2;

        mr本地模式:如果非要执行mr,能够执行本地的就不要提交yarn执行,默认是关闭的,意味着只要走mr就提交到yarn。

        参数设置为:

        mapreduce.framework.name = local 本地模式
        mapreduce.framework.name = yarn 集群模式 

        hive提供了一个参数,自动切换mr程序为本地模式,如果不满条件,就执行yarn模式。

  1. set hive.exec.mode.local.auto = true;
  2. --3个条件必须都满足 自动切换本地模式
  3. The total input size of the job is lower than: hive.exec.mode.local.auto.inputbytes.max (128MB by default) --数据量小于128M
  4. The total number of map-tasks is less than: hive.exec.mode.local.auto.tasks.max (4 by default) --maptask个数少于4个
  5. The total number of reduce tasks required is 1 or 0. --reducetask个数是0 或者 1

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/148522
推荐阅读
相关标签
  

闽ICP备14008679号