前 K 个高频元素_返回频率前k高的元素

作者：你好赵伟 | 2024-06-07 11:48:38

踩

返回频率前k高的元素

前 K 个高频元素

问题

给定一个非空的整数数组，返回其中出现频率前 k 高的元素。 频数TopK

示例

输入: nums = [1,1,1,2,2,3], k = 2

输出: [1,2]

示例 2:

输入: nums = [1], k = 1

输出: [1]

说明：

你可以假设给定的 k 总是合理的，且 1 ≤ k ≤ 数组中不相同的元素的个数。
你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。

方法 1：堆

想法

k = 1 时问题很简单，线性时间内就可以解决。只需要用哈希表维护元素出现频率，每一步更新最高频元素即可。
当 k > 1 就需要一个能够根据出现频率快速获取元素的数据结构，这就是优先队列。
首先建立一个元素值对应出现频率的哈希表。
1. 在 Java 中使用 HashMap，但需要手工填值。
2. 在 Python 中提供一个字典结构用作哈希表和在 collections 库中的 Counter 方法去构建我们需要的哈希表。

这个步骤需要 O(N)时间其中 N 是列表中元素个数。

第二步建立堆，堆中添加一个元素的复杂度是 $O(log(k))$ ，要进行 N 次复杂度是 O(N)。

最后一步是输出结果，复杂度为 $O(klog(k))$ 。

在 Python 中可以使用 heapq 库中的 nlargest 方法，可以在相同时间内完成，但只需要一行代码解决。

Java
Python


class Solution {
  public List<Integer> topKFrequent(int[] nums, int k) {
    // build hash map : character and how often it appears
    HashMap<Integer, Integer> count = new HashMap();
    for (int n: nums) {
      count.put(n, count.getOrDefault(n, 0) + 1);
    }
 
    // init heap 'the less frequent element first'
    PriorityQueue<Integer> heap =
            new PriorityQueue<Integer>((n1, n2) -> count.get(n1) - count.get(n2));
 
    // keep k top frequent elements in the heap
    for (int n: count.keySet()) {
      heap.add(n);
      if (heap.size() > k)
        heap.poll();
    }
 
    // build output list
    List<Integer> top_k = new LinkedList();
    while (!heap.isEmpty())
      top_k.add(heap.poll());
    Collections.reverse(top_k);
    return top_k;
  }
}

复杂度分析

时间复杂度：O(Nlog(k))。Counter 方法的复杂度是 O(N)O(N)，建堆和输出的复杂度是 O(N \log(k))O(Nlog(k))。因此总复杂度为 O(N + N \log(k)) = O(N \log(k))O(N+Nlog(k))=O(Nlog(k))。
空间复杂度：O(N)O(N)，存储哈希表的开销。

注释

根据复杂度分析，方法对于小 k 的情况是很优的。但是如果 k 值很大，我们可以将算法改成删除频率最低的若干个元素。

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】