贪心算法(Greedy Algorithm)刨析(附例题讲解及Python代码实现)








 1. 会议安排



2. 构造字典序最小的字符串



3. 分金条(哈夫曼编码)



4. 背包问题



5. 中位数获取



6. N皇后问题






集成开发工具:PyCharm Professional 2021.1

集成开发环境:Python 3.10.6



贪心算法(Greedy algorithm)是一种常用的算法策略,用于在求解最优化问题时做出局部最优选择。贪心算法的基本思想是每次都选择当前最优的解决方案,而不考虑整体的最优解。虽然贪心算法不能保证对所有问题都能找到全局最优解,但它在许多问题上表现良好,并且具有高效的计算速度。



1. 确定问题的最优解性质:首先,需要确定问题的最优子结构性质。这意味着通过局部最优解可以推导出全局最优解。这是贪心算法的基础,因为贪心策略的核心是每一步都选择当前最优解。
2. 构建贪心选择:在每一步中,根据某种准则选择当前最优解。这个选择是局部最优的,即在当前状态下看起来是最好的。
3. 解决子问题:经过选择后,将原问题转化为一个更小的子问题。通常,这个子问题是原问题的约束条件限制下的一个子集。
4. 迭代步骤 2 和步骤 3:重复执行步骤 2 和步骤 3,直到得到问题的完整解。








 1. 会议安排



  1. import random
  2. import timeit
  3. def schedule_meetings(projects):
  4. """
  5. 对于问题:一些项目要占用一个会议室宣讲,会议室不能同时容纳两个项目的宣讲。给你每一个项目开始的时间和结束的时间
  6. (给你一个数组,里面是一个个具体的项目),你来安排宣讲的日程,要求会议室进行的宣讲的场次最多。返回这个最多的宣讲场次。
  7. 贪心策略:根据结束时间进行排序,依次安排宣讲场次。
  8. :type projects: List[List[int]]
  9. """
  10. if not projects:
  11. return []
  12. sorted_projects = sorted(projects, key=lambda x: x[1])
  13. count = 1
  14. curr_end_time = sorted_projects[0][1]
  15. result = [sorted_projects[0]]
  16. for i in range(1, len(sorted_projects)):
  17. start_time, end_time = sorted_projects[i]
  18. if start_time >= curr_end_time:
  19. count += 1
  20. curr_end_time = end_time
  21. result.append(sorted_projects[i])
  22. return result
  23. def schedule_meetings_brute_force(projects):
  24. """
  25. 暴力求解,用于对数器验证贪心算法的正确性
  26. """
  27. if not projects:
  28. return []
  29. max_count = 0
  30. max_result = []
  31. def backtrack(curr_result, curr_index):
  32. nonlocal max_count, max_result
  33. # 当前结果的项目数量大于最大数量时更新最大数量和最大结果
  34. if len(curr_result) > max_count:
  35. max_count = len(curr_result)
  36. max_result = curr_result[:]
  37. # 从当前索引开始尝试添加项目
  38. for i in range(curr_index, len(projects)):
  39. curr_project = projects[i]
  40. can_add = True
  41. # 检查当前项目与已安排的项目是否有时间冲突
  42. for scheduled_project in curr_result:
  43. if curr_project[0] < scheduled_project[1] and curr_project[1] > scheduled_project[0]:
  44. can_add = False
  45. break
  46. # 如果没有时间冲突,将当前项目添加到结果中,并继续向下回溯
  47. if can_add:
  48. curr_result.append(curr_project)
  49. backtrack(curr_result, i + 1)
  50. curr_result.pop()
  51. backtrack([], 0)
  52. return max_result
  53. def generate_test_input():
  54. # 生成随机测试输入
  55. n = random.randint(5, 10) # 项目数量
  56. projects = []
  57. for _ in range(n):
  58. start_time = random.randint(1, 10)
  59. end_time = random.randint(start_time + 1, 15)
  60. projects.append((start_time, end_time))
  61. return projects
  62. def run_test():
  63. projects = generate_test_input()
  64. print("测试输入:", projects)
  65. # 计算算法1的执行时间,number是执行次数
  66. time1 = timeit.timeit(lambda: schedule_meetings(projects), number=1)
  67. # 计算算法2的执行时间
  68. time2 = timeit.timeit(lambda: schedule_meetings_brute_force(projects), number=1)
  69. result1 = schedule_meetings(projects)
  70. result2 = schedule_meetings_brute_force(projects)
  71. if len(result1) == len(result2):
  72. print("算法输出结果一致:", result1)
  73. # 输出算法执行时间
  74. print("贪心算法执行时间:", time1, "秒")
  75. print("暴力求解算法执行时间:", time2, "秒")
  76. else:
  77. print("算法输出结果不一致:")
  78. print("算法1输出结果:", result1)
  79. print("算法2输出结果:", result2)
  80. # 运行对数器测试
  81. run_test()


  1. 测试输入: [(10, 11), (3, 11), (10, 15), (5, 13), (9, 14), (1, 8), (9, 14), (6, 12), (8, 14)]
  2. 算法输出结果一致: [(1, 8), (10, 11)]
  3. 贪心算法执行时间: 5.500005499925464e-06
  4. 暴力求解算法执行时间: 1.9899998733308166e-05

2. 构造字典序最小的字符串


贪心策略:定义比较规则,当s1+s2 < s2+s1时,s1放在s2前面,否则s2放在s1前。


  1. import timeit
  2. import random
  3. from functools import cmp_to_key
  4. def smallest_concatenation(strings):
  5. """
  6. 对于问题:拼接字符串,要求拼接后的字符串字典序最小
  7. 贪心策略:定义比较规则,当s1+s2 < s2+s1时,s1放在s2前面,否则s2放在s1前
  8. """
  9. # 比较函数,用于确定字符串在排序时的顺序
  10. def compare(s1, s2):
  11. if s1 + s2 < s2 + s1:
  12. return -1
  13. elif s1 + s2 > s2 + s1:
  14. return 1
  15. else:
  16. return 0
  17. # 将字符串列表按照 compare 函数进行排序
  18. sorted_strings = sorted(strings, key=cmp_to_key(compare))
  19. # 拼接排序后的字符串
  20. result = ''.join(sorted_strings)
  21. return result
  22. def smallest_concatenation_brute_force(strings):
  23. """
  24. 暴力排列求解法,用于验证贪心算法的正确性
  25. """
  26. def permute(nums, curr_permutation, visited, all_permutations):
  27. if len(curr_permutation) == len(nums):
  28. all_permutations.append(''.join(curr_permutation))
  29. return
  30. for i in range(len(nums)):
  31. if not visited[i]:
  32. visited[i] = True
  33. curr_permutation.append(nums[i])
  34. permute(nums, curr_permutation, visited, all_permutations)
  35. curr_permutation.pop()
  36. visited[i] = False
  37. all_permutations = []
  38. visited = [False] * len(strings)
  39. permute(strings, [], visited, all_permutations)
  40. min_concatenation = min(all_permutations)
  41. return min_concatenation
  42. def generate_test_input():
  43. n = random.randint(5, 10) # 字符串数量
  44. strings = []
  45. for _ in range(n):
  46. string_length = random.randint(1, 5)
  47. string = ''.join(random.choices('abcdefghijklmnopqrstuvwxyz', k=string_length))
  48. strings.append(string)
  49. return strings
  50. def run_test():
  51. strings = generate_test_input()
  52. print("测试输入:", strings)
  53. # 计算算法1的执行时间,number是执行次数
  54. time1 = timeit.timeit(lambda: smallest_concatenation(strings), number=1)
  55. # 计算算法2的执行时间
  56. time2 = timeit.timeit(lambda: smallest_concatenation_brute_force(strings), number=1)
  57. result_greedy = smallest_concatenation(strings)
  58. result_brute_force = smallest_concatenation_brute_force(strings)
  59. print("贪心算法拼接结果:", result_greedy)
  60. print("暴力排列算法拼接结果:", result_brute_force)
  61. if result_greedy == result_brute_force:
  62. print("贪心算法和暴力排列算法的结果一致")
  63. else:
  64. print("贪心算法和暴力排列算法的结果不一致")
  65. print("贪心算法执行时间:", time1, "秒")
  66. print("暴力排列算法执行时间:", time2, "秒")
  67. # 运行对数器测试
  68. run_test()


  1. 测试输入: ['tuh', 'xmvqb', 'fk', 'go', 'paga', 'hkrcx']
  2. 贪心算法拼接结果: fkgohkrcxpagatuhxmvqb
  3. 暴力排列算法拼接结果: fkgohkrcxpagatuhxmvqb
  4. 贪心算法和暴力排列算法的结果一致
  5. 贪心算法执行时间: 7.099995855242014e-06
  6. 暴力排列算法执行时间: 0.00093120000383351

3. 分金条(哈夫曼编码

问题描述:一块金条切成两半,是需要花费和长度数值一样的铜板的。比如长度为20的金条,不管切成长度多大的两半,都要花费20个铜板。 一群人想整分整块金条,怎么分最省铜板? 例如,给定数组{10,20,30},代表一共三个人,整块金条长度为10+20+30=60。金条要分成10,20,30三个部分。如果先把长度60的金条分成10和50,花费60;再把长度50的金条分成20和30,花费50;一共花费110铜板。 但是如果先把长度60的金条分成30和30,花费60;再把长度30金条分成10和20,花费30;一共花费90铜板。 输入一个数组,返回分割的最小代价。



  1. import random
  2. import time
  3. def min_cost_split(gold_lengths):
  4. total_cost = 0
  5. while len(gold_lengths) > 1:
  6. # 找到长度最小的两块金条
  7. min1_idx = gold_lengths.index(min(gold_lengths))
  8. min1 = gold_lengths.pop(min1_idx)
  9. min2_idx = gold_lengths.index(min(gold_lengths))
  10. min2 = gold_lengths.pop(min2_idx)
  11. # 合并两块金条的长度,并计算代价
  12. merged_length = min1 + min2
  13. total_cost += merged_length
  14. # 将合并后的金条长度加入列表中
  15. gold_lengths.append(merged_length)
  16. return total_cost
  17. def brute_force_min_cost_split(gold_lengths):
  18. def split_gold(lengths, total_cost):
  19. if len(lengths) == 1:
  20. return total_cost
  21. min_cost = float('inf')
  22. for i in range(len(lengths) - 1):
  23. for j in range(i + 1, len(lengths)):
  24. new_lengths = lengths[:i] + [lengths[i] + lengths[j]] + lengths[i + 1:j] + lengths[j + 1:]
  25. cost = split_gold(new_lengths, total_cost + lengths[i] + lengths[j])
  26. min_cost = min(min_cost, cost)
  27. return min_cost
  28. return split_gold(gold_lengths, 0)
  29. def generate_test_input():
  30. n = random.randint(3, 8) # 金条数量
  31. gold_lengths = [random.randint(10, 80) for _ in range(n)]
  32. return gold_lengths
  33. def run_test():
  34. gold_lengths = generate_test_input()
  35. gold_lengths1 = gold_lengths.copy()
  36. print("测试输入:", gold_lengths)
  37. start_time = time.perf_counter()
  38. result_greedy = min_cost_split(gold_lengths)
  39. end_time = time.perf_counter()
  40. time_greedy = end_time - start_time
  41. start_time = time.perf_counter()
  42. result_brute_force = brute_force_min_cost_split(gold_lengths1)
  43. end_time = time.perf_counter()
  44. time_brute_force = end_time - start_time
  45. print("贪心算法最小代价:", result_greedy)
  46. print("暴力排列算法最小代价:", result_brute_force)
  47. if result_greedy == result_brute_force:
  48. print("贪心算法和暴力排列算法的结果一致")
  49. else:
  50. print("贪心算法和暴力排列算法的结果不一致")
  51. print("贪心算法执行时间:", time_greedy, "秒")
  52. print("暴力排列算法执行时间:", time_brute_force, "秒")
  53. # 运行对数器测试
  54. run_test()


  1. 测试输入: [14, 15, 15, 46, 17, 52, 37, 80]
  2. 贪心算法最小代价: 757
  3. 暴力排列算法最小代价: 757
  4. 贪心算法和暴力排列算法的结果一致
  5. 贪心算法执行时间: 8.39999847812578e-06
  6. 暴力排列算法执行时间: 3.426389200001722

4. 背包问题




  1. import random
  2. import timeit
  3. def max_profit(costs, profits, k, m):
  4. """
  5. 问题描述:在启动资金为m的,一次最多能同时做k个项目的情况下,求最大的收益.
  6. 每做完一个项目,马上就能获得收益并支持你去做下一个项目
  7. :param costs[i]:花费
  8. :param profits[i]:利润
  9. :return:
  10. """
  11. # 创建项目列表 [(花费, 利润)]
  12. projects = list(zip(costs, profits))
  13. # 根据利润从大到小排序
  14. projects.sort(key=lambda x: -x[1])
  15. # 执行贪心算法
  16. for _ in range(k):
  17. affordable_projects = []
  18. # 找出所有花费在当前资金范围内的项目
  19. for c, p in projects:
  20. if c <= m:
  21. affordable_projects.append((c, p))
  22. if not affordable_projects:
  23. break
  24. # 选择利润最大的项目,更新资金和项目列表
  25. max_profit_project = max(affordable_projects, key=lambda x: x[1])
  26. m += max_profit_project[1]
  27. projects.remove(max_profit_project)
  28. return m
  29. def brute_force_max_profit(costs, profits, k, m):
  30. def backtrack(curr_profit, curr_index, curr_funds):
  31. nonlocal max_profit
  32. if curr_index == len(costs) or curr_profit == k:
  33. max_profit = max(max_profit, curr_funds)
  34. return
  35. # 不选择当前项目
  36. backtrack(curr_profit, curr_index + 1, curr_funds)
  37. # 选择当前项目,更新当前利润和资金
  38. if curr_funds >= costs[curr_index]:
  39. backtrack(curr_profit + 1, curr_index + 1, curr_funds + profits[curr_index])
  40. max_profit = 0
  41. backtrack(0, 0, m)
  42. return max_profit
  43. def generate_test_input():
  44. n = random.randint(5, 10) # 项目数量
  45. k = random.randint(2, 4) # 最多做的项目数
  46. m = random.randint(50, 100) # 初始资金
  47. costs = [random.randint(10, 20) for _ in range(n)] # 花费列表
  48. profits = [random.randint(30, 50) for _ in range(n)] # 利润列表
  49. return costs, profits, k, m
  50. def run_test():
  51. costs, profits, k, m = generate_test_input()
  52. print("测试输入:")
  53. print("costs:", costs)
  54. print("profits:", profits)
  55. print("k:", k)
  56. print("m:", m)
  57. # 计算算法1的执行时间,number是执行次数
  58. time_greedy = timeit.timeit(lambda: max_profit(costs, profits, k, m), number=1)
  59. # 计算算法2的执行时间
  60. time_brute_force = timeit.timeit(lambda: brute_force_max_profit(costs, profits, k, m), number=1)
  61. result_greedy = max_profit(costs, profits, k, m)
  62. result_brute_force = brute_force_max_profit(costs, profits, k, m)
  63. print("贪心算法最大收益:", result_greedy)
  64. print("贪心算法执行时长:", time_greedy, "秒")
  65. print("暴力排列算法最大收益:", result_brute_force)
  66. print("暴力排列算法执行时长:", time_brute_force, "秒")
  67. # 运行对数器测试
  68. run_test()


  1. 测试输入:
  2. costs: [12, 10, 12, 12, 10, 14, 13, 11, 15]
  3. profits: [49, 32, 40, 41, 47, 44, 30, 46, 49]
  4. k: 2
  5. m: 57
  6. 贪心算法最大收益: 155
  7. 贪心算法执行时长: 1.189999602502212e-05
  8. 暴力排列算法最大收益: 155
  9. 暴力排列算法执行时长: 2.2799998987466097e-05

5. 中位数获取




  1. import heapq
  2. class MedianFinder:
  3. def __init__(self):
  4. self.max_heap = [] # 最大堆,存储较小的一半元素
  5. self.min_heap = [] # 最小堆,存储较大的一半元素
  6. def addNum(self, num):
  7. heapq.heappush(self.max_heap, -num) # 最大堆使用相反数存储(因为 Python 的 heapq 模块只提供最小堆的实现)
  8. heapq.heappush(self.min_heap, -heapq.heappop(self.max_heap)) # 平衡两个堆
  9. if len(self.min_heap) > len(self.max_heap):
  10. heapq.heappush(self.max_heap, -heapq.heappop(self.min_heap))
  11. def findMedian(self):
  12. if len(self.max_heap) == len(self.min_heap):
  13. return (-self.max_heap[0] + self.min_heap[0]) / 2
  14. else:
  15. return -self.max_heap[0]
  16. # 测试
  17. medianFinder = MedianFinder()
  18. # stream = [2, 4, 1, 5, 3] # 输入流
  19. stream = [5, 4, 3, 2, 1] # 输入流
  20. for num in stream:
  21. medianFinder.addNum(num)
  22. print("当前中位数:", medianFinder.findMedian(), "\t大根堆为:", medianFinder.max_heap, "\t小根堆为:", medianFinder.min_heap)


  1. 当前中位数: 5 大根堆为: [-5] 小根堆为: []
  2. 当前中位数: 4.5 大根堆为: [-4] 小根堆为: [5]
  3. 当前中位数: 4 大根堆为: [-4, -3] 小根堆为: [5]
  4. 当前中位数: 3.5 大根堆为: [-3, -2] 小根堆为: [4, 5]
  5. 当前中位数: 3 大根堆为: [-3, -1, -2] 小根堆为: [4, 5]

6. N皇后问题


n 皇后问题 研究的是如何将 n 个皇后放置在 n×n 的棋盘上,并且使皇后彼此之间不能相互攻击。

给你一个整数 n ,返回所有不同的 n 皇后问题 的解决方案。

每一种解法包含一个不同的 n 皇后问题 的棋子放置方案,该方案中 'Q' 和 '.' 分别代表了皇后和空位。


输入:n = 4
解释:如上图所示,4 皇后问题存在两个不同的解法。


  1. import time
  2. class Solution1:
  3. def solveNQueens(self, n: int) -> list[list[str]]:
  4. def backtrack(row, cols, diag1, diag2, path):
  5. """
  6. :param row: 当前行数
  7. :param cols: 存储已放置了皇后的列的索引 通过检查col not in cols确保不同列
  8. :param diag1: 已放置了皇后的主对角线的差值 通过检查(row + col) not in diag1确保不同主对角线
  9. :param diag2: 已放置了皇后的次对角线的差值 通过检查(row - col) not in diag2确保不同次对角线
  10. """
  11. # 终止条件:当 row 等于 n 时,表示找到了一个有效的解决方案
  12. if row == n:
  13. result.append(path)
  14. return
  15. # 遍历当前行的每个位置
  16. for col in range(n):
  17. # 检查当前位置是否可以放置皇后
  18. if col not in cols and (row + col) not in diag1 and (row - col) not in diag2:
  19. # 更新 cols、diag1 和 diag2
  20. cols.add(col)
  21. diag1.add(row + col)
  22. diag2.add(row - col)
  23. # 递归调用 backtrack 处理下一行
  24. backtrack(row + 1, cols, diag1, diag2, path + [col])
  25. # 回溯:撤销对 cols、diag1 和 diag2 的更新
  26. cols.remove(col)
  27. diag1.remove(row + col)
  28. diag2.remove(row - col)
  29. result = []
  30. backtrack(0, set(), set(), set(), [])
  31. # 将结果转换为题目要求的输出格式
  32. return [['.' * col + 'Q' + '.' * (n - col - 1) for col in path] for path in result]
  33. class Solution2:
  34. def solveNQueens(self, n: int) -> list[list[str]]:
  35. def backtrack(row, cols, diag1, diag2, path):
  36. if row == n:
  37. result.append(path)
  38. return
  39. # 计算可放置皇后的位置,使用位运算
  40. available_pos = ((1 << n) - 1) & (~(cols | diag1 | diag2))
  41. while available_pos:
  42. pos = available_pos & -available_pos # 获取最低位的 1
  43. col = bin(pos - 1).count('1') # 获取该位置所在的列
  44. cols |= pos
  45. diag1 |= pos
  46. diag2 |= pos
  47. backtrack(row + 1, cols, diag1 << 1, diag2 >> 1, path + [col])
  48. cols ^= pos
  49. diag1 ^= pos
  50. diag2 ^= pos
  51. available_pos &= available_pos - 1 # 去除最低位的 1
  52. result = []
  53. backtrack(0, 0, 0, 0, [])
  54. # 将结果转换为题目要求的输出格式
  55. return [['.' * col + 'Q' + '.' * (n - col - 1) for col in path] for path in result]
  56. start_time1 = time.time() * 1000 # 记录开始时间
  57. n1 = Solution1().solveNQueens(14)
  58. end_time1 = time.time() * 1000 # 记录结束时间
  59. execution_time1 = end_time1 - start_time1 # 计算运行时间
  60. print("优化前14皇后问题求解时间:", execution_time1, "毫秒")
  61. print("优化前14皇后问题方案数:", len(n1))
  62. start_time2 = time.time() * 1000 # 记录开始时间
  63. n2 = Solution2().solveNQueens(14)
  64. end_time2 = time.time() * 1000 # 记录结束时间
  65. execution_time2 = end_time2 - start_time2 # 计算运行时间
  66. print("优化后14皇后问题求解时间:", execution_time2, "毫秒")
  67. print("优化后14皇后问题方案数:", len(n2))


  1. 优化前14皇后问题求解时间: 39064.458251953125 毫秒
  2. 优化前14皇后问题方案数: 365596
  3. 优化后14皇后问题求解时间: 24999.784912109375 毫秒
  4. 优化后14皇后问题方案数: 365596


