赞
踩
给定一个 非空的整数数组,返回其中出现频率前 k 高的元素。 频数TopK
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]
输入: nums = [1], k = 1
输出: [1]
你可以假设给定的 k 总是合理的,且 1 ≤ k ≤ 数组中不相同的元素的个数。
你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。
想法
k = 1
时问题很简单,线性时间内就可以解决。只需要用哈希表维护元素出现频率,每一步更新最高频元素即可。k > 1
就需要一个能够根据出现频率快速获取元素的数据结构,这就是优先队列。HashMap
,但需要手工填值。collections
库中的 Counter
方法去构建我们需要的哈希表。这个步骤需要 O(N)时间其中 N 是列表中元素个数。
最后一步是输出结果,复杂度为
heapq
库中的 nlargest
方法,可以在相同时间内完成,但只需要一行代码解决。
- class Solution {
- public List<Integer> topKFrequent(int[] nums, int k) {
- // build hash map : character and how often it appears
- HashMap<Integer, Integer> count = new HashMap();
- for (int n: nums) {
- count.put(n, count.getOrDefault(n, 0) + 1);
- }
-
- // init heap 'the less frequent element first'
- PriorityQueue<Integer> heap =
- new PriorityQueue<Integer>((n1, n2) -> count.get(n1) - count.get(n2));
-
- // keep k top frequent elements in the heap
- for (int n: count.keySet()) {
- heap.add(n);
- if (heap.size() > k)
- heap.poll();
- }
-
- // build output list
- List<Integer> top_k = new LinkedList();
- while (!heap.isEmpty())
- top_k.add(heap.poll());
- Collections.reverse(top_k);
- return top_k;
- }
- }
![](https://csdnimg.cn/release/blogv2/dist/pc/img/newCodeMoreWhite.png)
复杂度分析
Counter
方法的复杂度是 O(N)O(N),建堆和输出的复杂度是 O(N \log(k))O(Nlog(k))。因此总复杂度为 O(N + N \log(k)) = O(N \log(k))O(N+Nlog(k))=O(Nlog(k))。注释
根据复杂度分析,方法对于小 k
的情况是很优的。但是如果 k
值很大,我们可以将算法改成删除频率最低的若干个元素。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。