赞
踩
1.选择Pool:
判断当前运行的任务数目小于最小共享数目。(Fair算法,只考虑内存使用, 后边注释)
如果二个组都小于,则比较最小共享占比。即当前运行的数 / 该组的最小共享数。
如果二个组都大于,则比较权重比。即运行任务数 / 权重系数。(权重越高,被选中的几率越高,且获得资源时获取的量也越大)
如果二者还是相等,则根据起始时间来比较。
2.选择job:
默认采用Fair算法,可支持FIFO、Fair、DRF算法
FIFO:先按照优先级高低调度,如果优先级相同,则按照提交时间先后顺序调度,如果提交时间相同,则按照(队列或者应用程序)名称大小(字符串比较)调度;
FAIR:按照内存资源使用量比率调度,即按照used_memory(使用的内存)/minShare(最少资源保证量,只考虑内存)大小调度(核心思想是按照该调度算法决定调度顺序,但还需考虑一些边界情况);
DRF:借鉴了Mesos中的设计策略,按照主资源公平调度算法进行调度,具体已经在Apache Mesos调度器机制进行了介绍。
作业提交到的队列:mapreduce.job.queuename
作业优先级:mapreduce.job.priority
Pig版本:
SET mapreduce.job.queuename root.etl.distcp;
SET mapreduce.job.priority HIGH;
Hive版本:
SET mapreduce.job.queuename=root.etl.distcp;
SET mapreduce.job.priority=HIGH;
MapReduce版本:
hadoop jar app.jar -D mapreduce.job.queuename=root.etl.distcp -D mapreduce.job.priority=HIGH
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29754888/viewspace-1220318/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/29754888/viewspace-1220318/
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。