当前位置:   article > 正文

LeetCode专题:滑动窗口(持续更新,已更17题)_滑动窗口 leetcode

滑动窗口 leetcode

目录

LeetCode713.乘积小于K的子数组:

问题描述:

代码分析:

解法一:双指针滑窗

扩展部分:滑动窗口解题模板

LeetCode567.字符串的排列:

LeetCode76.最小覆盖子串:

LeetCode438.找到字符串中所有字母异位词:

LeetCode3.无重复字符的最长子串:

LeetCode30.串联所有单词的子串(难):

问题描述:

代码分析:

剑指 Offer II 041. 滑动窗口的平均值:

问题描述:

代码分析:

LeetCode239. 滑动窗口最大值:

问题描述:

代码分析:

方法一:优先队列

方法二:单调队列(具有单调性的双端队列)

方法三:分块(莫队基础)

LeetCode187.重复的DNA序列:

问题描述:

代码分析:

方法二:字符串哈希+前缀和      

LeetCode219. 存在重复元素 II:

问题描述:

代码分析:

LeetCode220.存在重复元素 III(难):

问题描述:

代码分析:

方法一:滑动窗口+有序集合二分

方法二:桶排序

LeetCode396.旋转函数:

问题描述:

代码分析:

方法一:前缀和+滑动窗口

LeetCode424.替换后的最长重复字符:

问题描述:

代码分析:

宫水三叶版解法:

LeetCode480.滑动窗口中位数(难):

问题描述:

代码分析:

方法一:双优先队列+延迟删除(设计思想难)

Java版:

平衡二叉树:

LeetCode295.数据流的中位数:

问题描述:

代码分析:

方法二:有序集合+双指针

LeetCode2024.考试的最大困扰度:

问题描述:

代码分析:

LeetCode1208.尽可能使字符串相等:

问题描述:

代码分析:

方法二:前缀和+二分搜索

持续更新......(35700字)


LeetCode713.乘积小于K的子数组:

问题描述:

给你一个整数数组 nums 和一个整数 k ,请你返回子数组内所有元素的乘积严格小于 k 的连续子数组的数目。

 示例 1:

输入:nums = [10,5,2,6], k = 100
输出:8
解释:8 个乘积小于 100 的子数组分别为:[10]、[5]、[2],、[6]、[10,5]、[5,2]、[2,6]、[5,2,6]。
需要注意的是 [10,5,2] 并不是乘积小于 100 的子数组。

代码分析:

本题与 剑指 Offer II 009. 乘积小于 K 的子数组 相同。

然后这题跟209. 长度最小的子数组是一个方法,理解这题后可以用209这题巩固巩固。 (209这题是维护窗口最小长度,本题是维护窗口最大长度)

本题力扣官解法一学有余力再看一看,重点学习滑窗。

解法一:双指针滑窗

滑窗算是双指针中的特殊情况。要理解滑窗很重要的是理解两个滑窗边界有什么意义。滑窗可能分为固定窗口大小和变长窗口大小,这题便是变长窗口,我们要理解为什么窗口是变长的。

  1. 我们要维护一个滑窗。窗口不断向右滑动,窗口右边界(r)为固定轴,左边界(l)则是一个变动轴。
  2. 此窗口代表的意义为:以窗口右边界为结束点的区间,其满足乘积小于k所能维持的最大窗口。因此,本题最重要的是求窗口在每个位置时,窗口的最大长度。(最大长度是重点)

  3. 最终的答案便是窗口在每个位置的最大长度的累计和。

    为什么呢?这个就需要我们找规律了。因为针对上一位置的窗口,移动一次后相对增加出来的个数便是r-l+1。

  4. 我们可以从前往后处理所有的 nums[i],使用一个变量 cur 记录当前窗口的乘积,使用两个变量 j 和 i 分别代表当前窗口的左右端点。当 cur>=k 时,我们考虑将左端点 j 右移,同时消除原来左端点元素 nums[j] 对 cur 的贡献,直到 cur>=k 不再满足,这样我们就可以得到每个右端点 nums[i] 的最远左端点 nums[j]。

做完本题后我们来总结一下相关的模板。

—— by 宫水三叶 & piwoyixia 腌菜读作梦想 & labuladong的算法小抄

  1. class Solution {
  2. public int numSubarrayProductLessThanK(int[] nums, int k) {
  3. int n = nums.length, ans = 0;
  4. if (k <= 1) return 0;
  5. for (int i = 0, j = 0, cur = 1; i < n; i++) {
  6. cur *= nums[i];
  7. while (cur >= k) cur /= nums[j++];
  8. ans += i - j + 1;
  9. }
  10. return ans;
  11. }
  12. }
  13. 作者:宫水三叶

扩展部分:滑动窗口解题模板

  1. class Solution {
  2. public int slidingWindow(int[] nums, int k) {
  3. //数组/字符串长度
  4. int n = nums.length;
  5. //双指针,表示当前遍历的区间[left, right],闭区间
  6. int left = 0, right = 0;
  7. //定义变量统计 子数组/子区间 是否有效
  8. int sum = 0;
  9. //定义变量动态保存最大 求和/计数
  10. int res = 0;
  11. //右指针遍历到数组尾
  12. while (right < n) {
  13. //增加当前右指针对应的数值
  14. sum += nums[right];
  15. //当在该区间内 sum 超出定义范围
  16. while (sum > k) {
  17. //先将左指针指向的数值减去
  18. sum -= nums[left];
  19. //左指针右移
  20. left++;
  21. }
  22. //到 while 结束时,我们找到了一个符合题意要求的 子数组/子串
  23. res = Math.max(res, right - left + 1);
  24. //移动右指针,去探索下一个区间
  25. right++;
  26. }
  27. return res;
  28. }
  29. }
  30. 作者:腌菜读作梦想
  1. class Solution {
  2. public String slidingWindow(String s, String t) {
  3. //创建两个哈希表,分别记录 [需要的] 和 [加入的]
  4. Map<Character, Integer> need = new HashMap<>();
  5. Map<Character, Integer> map = new HashMap<>();
  6. //创建 [双指针] 和 [有效数量]
  7. int left = 0, right = 0;
  8. int valid = 0;
  9. //外层循环,供右指针遍历
  10. while(right < s.length()){
  11. //创建临时 c 字符,是移入 窗口 内的字符
  12. char c = s.charAt(right);
  13. 进行窗口一系列逻辑更新
  14. ...
  15. //判断左指针是否要右移即窗口收缩:有效数量足够满足条件
  16. /* 可能是规定的窗口大小超出了,可能是有效值数量达成了
  17. 1. while(valid == need.size())
  18. 2. while(right - left + 1 >= s1.length())
  19. */
  20. while(windows need shrink){
  21. // 创建 d 是要移除窗口的字符
  22. char d = s.charAt(left);
  23. left++;
  24. //进行窗口一系列逻辑更新
  25. ...
  26. }
  27. //右指针右移
  28. right++;
  29. }
  30. }
  31. }
  32. 作者:腌菜读作梦想

需要注意的是:

  1. unordered_map 就是哈希表(字典),它的一个方法 count(key) 相当于 Java 的 containsKey(key) 可以判断键 key 是否存在。

  2. 可以使用方括号访问键对应的值 map[key]。需要注意的是,如果该 key 不存在,C++ 会自动创建这个 key,并把 map[key] 赋值为 0。

    Java 的 map.put(key, map.getOrDefault(key, 0) + 1)相当于C++的map[key]++。

LeetCode567.字符串的排列:

这种题目,是明显的滑动窗口算法,相当给你一个 S 和一个 T,请问你 S 中是否存在一个子串,包含 T 中所有字符且不包含其他字符由于排列不会改变字符串中每个字符的个数,所以只有当两个字符串每个字符的个数均相等时,一个字符串才是另一个字符串的排列。

  1. class Solution {
  2. public boolean checkInclusion(String s1, String s2) {
  3. Map<Character, Integer> need = new HashMap<>();
  4. 滑动窗口 + 两哈希,始终保证窗口长度,当长度超了s1.length(),左指针准备右移
  5. Map<Character, Integer> map = new HashMap<>();
  6. int left = 0, right = 0;
  7. 当发现有效值长度 valid == need.size() 时,就说明窗口map中就是一个合法的排列,所以立即返回 true
  8. int valid = 0;
  9. //统计s1词频
  10. for(Character c : s1.toCharArray()) {
  11. need.put(c, need.getOrDefault(c, 0) + 1);
  12. }
  13. while(right < s2.length()) {
  14. char c = s2.charAt(right);
  15. 进行窗口内数据的一系列更新
  16. if(need.containsKey(c)) {
  17. map.put(c, map.getOrDefault(c, 0) + 1); //map[c]++
  18. if(need.get(c).equals(map.get(c))) {
  19. valid++;
  20. }
  21. }
  22. 判断左侧窗口是否要收缩,保证窗口的大小始终和需要查找的字串一致
  23. 是 >= 而不是 > 的原因:
  24. 假设目标字串长度是2,如果是 > 的话,此时窗口内有两个元素,
  25. 下一轮增加窗口的时候再加入一个就是3个元素的, 超出了子串长度但却有可能返回true
  26. while(right - left + 1 >= s1.length()) {
  27. 在这里判断是否找到了合法的子串
  28. if(valid == need.size()) {
  29. return true;
  30. }
  31. d是需要移出窗口的元素
  32. 进行窗口内数据的一系列更新
  33. char d = s2.charAt(left);
  34. if(need.containsKey(d)) {
  35. if(need.get(d).equals(map.get(d))) {
  36. valid--;
  37. }
  38. map.put(d, map.get(d) - 1); //map[d]--
  39. }
  40. left++;
  41. }
  42. right++;
  43. }
  44. return false;
  45. }
  46. }

当然此方法有一定的理解难度,我们还可以使用之前的双指针滑窗来解决。

左程云大神提供了一种有趣的思路:

  1. 通过一个记账本 charCount 做为【总账表】维护s1的词频表;
  2. 滑动窗口内每一个右边界字符进入窗口后,【还账】:charCount[str2[r] - 'a']--
  3. 如果某个字符多还了(变成负值),即尝试失败,开始尝试下一个左端点(l++);
  4. 左边界字符出窗口后,表示【重新赊账】:charCount[str2[l] - 'a']++
  5. 最终如果欠账还足了(窗口长度达到len1),则尝试成功,直接返回true
  1. public static boolean checkInclusion(String s1, String s2) {
  2. char[] str1 = s1.toCharArray();
  3. char[] str2 = s2.toCharArray();
  4. int len1 = s1.length();
  5. int len2 = s2.length();
  6. int[] charCount = new int[26]; // 【总欠账表】:s1的词频表
  7. for (char c : str1) { // 统计s1的词频
  8. charCount[c - 'a']++;
  9. }
  10. int l = 0, r = 0; // 滑动窗口左右边界
  11. // 依次尝试固定以s2中的每一个位置l作为左端点开始的len1长度的子串s2[l ... l+len1)是否是s1的排列
  12. while (l <= len2 - len1) { // 固定左端点只需要尝试到len2-len1即可
  13. // 右边界s2[r]字符进入窗口【还账】
  14. while (r < l + len1 && charCount[str2[r] - 'a'] >= 1) {
  15. charCount[str2[r] - 'a']--; // 【"还账"】
  16. r++;
  17. }
  18. if (r == l + len1) return true;
  19. // 左边界s2[l]字符出窗口【赊账】,l++,开始尝试固定下一个位置做左端点
  20. 此程序直接排除了r>l+len1的可能,若要开始尝试固定下一个位置做左端点,则表明
  21. r!=l+len1并且当前str2[r]多还了
  22. charCount[str2[l] - 'a']++; // 重新【"赊账"】
  23. l++;
  24. }
  25. return false; // 所有的左端点均尝试还账失败,不可能再有答案了
  26. }
  27. 作者:seven

LeetCode76.最小覆盖子串:

要在 S(source) 中找到包含 T(target) 中全部字母的一个子串,且这个子串一定是所有可能子串中最短的。(处理窗口的扩大和缩小和上一题相同)

具体思路为:

  • 我们先不断地增加 right 指针扩大窗口 [left, right),直到窗口中的字符串符合要求(包含了 T 中的所有字符)。【相当于在寻找一个「可行解」
  • 此时,我们停止增加 right,转而不断增加 left 指针缩小窗口 [left, right),直到窗口中的字符串不再符合要求(不包含 T 中的所有字符了)。同时,每次增加 left,我们都要更新一轮结果。【相当于优化这个「可行解」,最终找到最优解也就是最短的覆盖子串

  • 如果一个字符进入窗口,应该增加 map 计数器;如果一个字符将移出窗口的时候,应该减少 map 计数器;当 valid 满足 need 时应该收缩窗口;应该在收缩窗口的时候更新最终结果。

  1. string minWindow(string s, string t) {
  2. unordered_map<char, int> need, window;
  3. for (char c : t) need[c]++;
  4. int left = 0, right = 0;
  5. int valid = 0;
  6. // 记录最小覆盖子串的起始索引及长度
  7. int start = 0, len = INT_MAX;
  8. while (right < s.size()) {
  9. // c 是将移入窗口的字符
  10. char c = s[right];
  11. // 进行窗口内数据的一系列更新
  12. if (need.count(c)) {
  13. window[c]++;
  14. if (window[c] == need[c])
  15. valid++;
  16. }
  17. // 判断左侧窗口是否要收缩
  18. while (valid == need.size()) {
  19. // 在这里更新最小覆盖子串
  20. if (right - left + 1 < len) {
  21. start = left;
  22. len = right - left + 1;
  23. }
  24. // d 是将移出窗口的字符
  25. char d = s[left];
  26. // 进行窗口内数据的一系列更新
  27. if (need.count(d)) {
  28. window[d]--;
  29. if (window[d] == need[d])
  30. valid--;
  31. }
  32. // 左移窗口
  33. left++;
  34. }
  35. // 右移窗口
  36. right++;
  37. }
  38. // 返回最小覆盖子串
  39. return len == INT_MAX ?
  40. "" : s.substr(start, len);
  41. }
  42. 作者:labuladong

LeetCode438.找到字符串中所有字母异位词:

相当于,输入一个串S,一个串T,找到S中所有T的排列,返回它们的起始索引。

在上题的基础上改改即可。

  1. vector<int> findAnagrams(string s, string t) {
  2. unordered_map<char, int> need, map;
  3. for (char c : t) need[c]++;
  4. int left = 0, right = 0;
  5. int valid = 0;
  6. vector<int> res; // 记录结果
  7. while (right < s.size()) {
  8. char c = s[right];
  9. right++;
  10. // 进行窗口内数据的一系列更新
  11. if (need.count(c)) {
  12. window[c]++;
  13. if (window[c] == need[c])
  14. valid++;
  15. }
  16. // 判断左侧窗口是否要收缩
  17. while (right - left >= t.size()) {
  18. // 当窗口符合条件时,把起始索引加入 res
  19. if (valid == need.size())
  20. res.push_back(left);
  21. char d = s[left];
  22. left++;
  23. // 进行窗口内数据的一系列更新
  24. if (need.count(d)) {
  25. if (window[d] == need[d])
  26. valid--;
  27. window[d]--;
  28. }
  29. }
  30. }
  31. return res;
  32. }
  33. 作者:labuladong

LeetCode3.无重复字符的最长子串

这个题终于有了点新意,不是一套框架就出答案,不过反而更简单了,稍微改一改框架就行了:

  1. class Solution {
  2. public:
  3. int lengthOfLongestSubstring(string s) {
  4. unordered_map<char, int> map;
  5. int left = 0, right = 0;
  6. int res = 0;
  7. while(right < s.size()) {
  8. char c = s[right];
  9. map[c]++;
  10. while(map[c] >= 2) {
  11. char d = s[left];
  12. map[d]--;
  13. left++;
  14. }
  15. res = max(res, right - left + 1);
  16. right++;
  17. }
  18. return res;
  19. }
  20. };

当map[c]值大于 1 时,说明窗口中存在重复字符,不符合条件,就该移动 left 缩小窗口了。

唯一需要注意的是,在哪里更新结果 res 呢?我们要的是最长无重复子串,哪一个阶段可以保证窗口中的字符串是没有重复的呢?在收缩窗口完成后更新 res!因为窗口收缩的 while 条件是存在重复元素,换句话说收缩完成后一定保证窗口中没有重复。


LeetCode30.串联所有单词的子串(难):

问题描述:

给定一个字符串 s 和一个字符串数组 words words 中所有字符串 长度相同

s 中的 串联子串 是指一个包含  words 中所有字符串以任意顺序排列连接起来的子串。

返回所有串联字串在 s 中的开始索引。你可以以 任意顺序 返回答案。

示例 1:

  • 例如,如果 words = ["ab","cd","ef"], 那么 "abcdef", "abefcd""cdabef", "cdefab""efabcd", 和 "efcdab" 都是串联子串。 "acdbef" 不是串联子串,因为他不是任何 words 排列的连接。
输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:因为 words.length == 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
子串 "barfoo" 开始位置是 0。它是 words 中以 ["bar","foo"] 顺序排列的连接。
子串 "foobar" 开始位置是 9。它是 words 中以 ["foo","bar"] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

代码分析:

        本题是 438. 找到字符串中所有字母异位词 的进阶,难度较大。不过438的元素是字母,本题的元素是单词,可以用类似滑动窗口的方法来解决。

        记 words 的长度为 m,words 中每个单词的长度为 n,s 的长度为 ls。首先需要将 s 划分为若干单词组,每个单词的大小均为 n (首尾除外)。这样的划分方法有 n 种(即s的长度是否能被n整除,余数范围为0~n-1即为划分方法数),具体操作为先删去前 i (i=0∼n−1)个字母后,将剩下的字母进行划分,如果末尾有不到 n 个字母也删去(剩余字母的删除不影响结论)对这 n 种划分得到的单词数组分别使用滑动窗口对 words 进行类似于「字母异位词」的搜寻。

        划分成单词组后,一个窗口包含 s 中前 m 个单词,用一个哈希表 differ 表示窗口中单词频次和 words 中单词频次之差。初始化 differ 时,出现在窗口中的单词,每出现一次,相应的值增加 1,出现在 words 中的单词,每出现一次,相应的值减少 1。然后将窗口右移,右侧会加入一个单词,左侧会移出一个单词,并对 differ 做相应的更新。窗口移动时,若出现 differ 中值不为 0 的键的数量为 0,则表示这个窗口中的单词频次和 words 中单词频次相同,窗口的左端点是一个待求的起始位置。

划分的方法有 n 种,做 n 次滑动窗口后,即可找到所有的起始位置。

        具体看代码来理解。要注意理解滑窗中存放的是长单词,进进出出的是短单词,我们判断的依据是不断向后滑动的长单词中短单词的词频之差。

——by 力扣官方题解

  1. 本题的各种下标、细节需要仔细理解
  2. class Solution {
  3. public:
  4. vector<int> findSubstring(string s, vector<string>& words) {
  5. vector<int> res;
  6. int m = words.size(), n = words[0].size(), ls = s.size();
  7. n种划分方式把s中每n个字母一组的组合方式都考虑到
  8. 注意条件i + m * n <= ls!!!
  9. 考虑到所有组合方式的情况下还要保证当前划分方式要在ls范围内至少容下一组由m个
  10. 短单词组成的长单词即至少容下一个滑窗
  11. for(int i = 0; i <= n - 1 && i + m * n <= ls; ++i) {
  12. //哈希表中key为string,differ表示存放长单词的窗口中的短单词频次和words中的短单词频次之差
  13. unordered_map<string, int> differ;
  14. 将该划分方式下的每个分别由n个字母组成的的短单词加入集合并进行比对
  15. differ表示窗口中的单词频次与words中的单词频次之差
  16. 只要差值为0就将其抹去,为正或负都记录下来
  17. for(int j = 0; j < m; ++j) {
  18. ++differ[s.substr(i + j * n, n)];
  19. }
  20. for(string &word : words) {
  21. if(--differ[word] == 0) {
  22. differ.erase(word);
  23. }
  24. }
  25. 开始滑动窗口
  26. for(int start = i; start < ls - m * n + 1; start += n) {
  27. 若start == i,当前长单词中的短单词频次已经在前面两个for循环处统计好了
  28. 直接判断differ是否为空即可
  29. if(start != i) {
  30. //右边的单词滑进来
  31. string word = s.substr(start + (m - 1) * n, n);
  32. if(++differ[word] == 0) {
  33. differ.erase(word);
  34. }
  35. //左边的单词滑出去,一进一出保证了滑窗的长度不变
  36. word = s.substr(start - n, n);
  37. if(--differ[word] == 0) {
  38. differ.erase(word);
  39. }
  40. }
  41. //differ为空表明在窗口中的单词均在words中出现且都仅出现一次
  42. if(differ.empty()) {
  43. res.emplace_back(start);
  44. }
  45. }
  46. }
  47. return res;
  48. }
  49. };
  50. 作者:力扣官解

变量名称以上述方法的代码为准。将 words 中的单词存入哈希表,复杂度为 O(m)(由于字符串长度固定且不超过 30,假定所有哈希操作均为 O(1) 的);需要做 n 次滑动窗口,每次需要遍历一次 s。整体时间复杂度为O(ls×n)。

        上述方法是对枚举起点的过程进行了优化,即将起点根据 当前下标与单词长度的取余结果 进行分类,这样我们就不用频繁的建立新的哈希表和进行单词统计。

        比较好想的直观的一个方法是由 宫水三叶 提供的:

  1. 使用哈希表map记录words中每个单词的出现次数
  2. 枚举s中的每个字符作为起点,往后取得仅仅一个长度为 m*n 的子串 sub
  3. 使用哈希表 cur 统计 sub 中每个单词的出现次数(每隔n个长度作为一个单词)
  4. 比较 cur 和 map 是否相同

在步骤 3 中,如果发现 sub 中包含了 words 没有出现的单词,可以直接剪枝。

剪枝处使用了带标签的 continue 语句直接回到外层循环进行。(C++中使用goto语句)

这样你会发现,之前的方法由于经过分类优化,枚举起点次数少多了,并且每个起点都用滑动窗口以步长为n的距离向后不断探索,其间取得的sub可不仅仅为一个。

  1. class Solution {
  2. public List<Integer> findSubstring(String s, String[] words) {
  3. int n = s.length(), m = words.length, w = words[0].length();
  4. Map<String, Integer> map = new HashMap<>();
  5. for (String word : words) map.put(word, map.getOrDefault(word, 0) + 1);
  6. List<Integer> ans = new ArrayList<>();
  7. out:for (int i = 0; i + m * w <= n; i++) {
  8. Map<String, Integer> cur = new HashMap<>();
  9. String sub = s.substring(i, i + m * w);
  10. for (int j = 0; j < sub.length(); j += w) {
  11. String item = sub.substring(j, j + w);
  12. if (!map.containsKey(item)) continue out;
  13. cur.put(item, cur.getOrDefault(item, 0) + 1);
  14. }
  15. //集合之间的equals()需要满足键和值分别相同
  16. if (cur.equals(map)) ans.add(i);
  17. }
  18. return ans;
  19. }
  20. }
  21. 作者:宫水三叶

若变量名称采用第一种方法的代码中的标准。将 words 中的单词存入哈希表,复杂度为 O(m)(由于字符串长度固定且不超过 30,假定所有哈希操作均为 O(1) 的);然后第一层循环枚举 s 中的每个字符作为起点,复杂度为 O(ls);在循环中将 sub 划分为 m 个单词进行统计,枚举了 m - 1 个下标,复杂度为 O(m);每个单词的长度为 n。整体时间复杂度为 O(ls*m*n)。


剑指 Offer II 041. 滑动窗口的平均值:

问题描述:

给定一个整数数据流和一个窗口大小,根据该滑动窗口的大小,计算滑动窗口里所有数字的平均值。

实现 MovingAverage 类:

  • MovingAverage(int size) 用窗口大小 size 初始化对象。
  • double next(int val) 成员函数 next 每次调用的时候都会往滑动窗口增加一个整数,请计算并返回数据流中最后 size 个值的移动平均值,即滑动窗口里所有数字的平均值。

示例:

输入:
inputs = ["MovingAverage", "next", "next", "next", "next"]
inputs = [[3], [1], [10], [3], [5]]
输出:
[null, 1.0, 5.5, 4.66667, 6.0]

代码分析:

        本题名叫“滑动窗口”,实际上是一道队列模拟题。

        这道题要求根据给定的数据流计算滑动窗口中所有数字的平均值,滑动窗口的大小为给定的参数 size。当数据流中的数字个数不超过滑动窗口的大小时,计算数据流中的所有数字的平均值;当数据流中的数字个数超过滑动窗口的大小时,只计算滑动窗口中的数字的平均值,数据流中更早的数字被移出滑动窗口。

        由于数字进入滑动窗口和移出滑动窗口的规则符合先进先出,因此可以使用队列存储滑动窗口中的数字,同时维护滑动窗口的大小以及滑动窗口的数字之和。

        初始时,队列为空,滑动窗口的大小设为给定的参数 size,滑动窗口的数字之和为 0。

        每次调用 next 时,需要将 val 添加到滑动窗口中,同时确保滑动窗口中的数字个数不超过 size,如果数字个数超过 size 则需要将多余的数字移除,在添加和移除数字的同时需要更新滑动窗口的数字之和。由于每次调用只会将一个数字添加到滑动窗口中,因此每次调用最多只需要将一个多余的数字移除。具体操作如下:

  • 如果队列中的数字个数等于滑动窗口的大小,则移除队首的数字,将移除的数字从滑动窗口的数字之和中减去。如果队列中的数字个数小于滑动窗口的大小,则不移除队首的数字。
  • 将 val 添加到队列中,并加到滑动窗口的数字之和中。
  • 计算滑动窗口的数字之和与队列中的数字个数之商,即为滑动窗口中所有数字的平均值。

        一套下来行云流水,看代码。

——by 力扣官方题解

  1. class MovingAverage {
  2. public:
  3. MovingAverage(int size) {
  4. this->size = size;
  5. this->sum = 0.0;
  6. }
  7. double next(int val) {
  8. if (qu.size() == size) {
  9. sum -= qu.front();
  10. qu.pop();
  11. }
  12. qu.emplace(val);
  13. sum += val;
  14. return sum / qu.size();
  15. }
  16. private:
  17. int size;
  18. double sum;
  19. queue<int> qu;
  20. };
  21. 作者:力扣官解

当然,有几个需要留心的地方:

  • 不能用vector容器初始化queue。因为queue转换器要求容器支持front()、back()、push_back()及 pop_front(),说明queue的数据从容器后端入栈而从前端出栈(单端队列)。所以可以使用deque(double-ended queue,双端队列)和list对queue初始化,而vector因其缺少pop_front(),不能用于queue。

  • Queue接口与List、Set同一级别,都是继承了Collection接口。LinkedList除了实现了 List 接口,也实现了 Deque 接口,可以当做双端队列来使用。

LeetCode239. 滑动窗口最大值:

问题描述:

给你一个整数数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。

返回 滑动窗口中的最大值

示例 1:

输入:nums = [1,3,-1,-3,5,3,6,7], k = 3
输出:[3,3,5,5,6,7]
解释:
滑动窗口的位置                最大值
---------------               -----
[1  3  -1] -3  5  3  6  7       3
 1 [3  -1  -3] 5  3  6  7       3
 1  3 [-1  -3  5] 3  6  7       5
 1  3  -1 [-3  5  3] 6  7       5
 1  3  -1  -3 [5  3  6] 7       6
 1  3  -1  -3  5 [3  6  7]      7

代码分析:

        本题和上一题大体相同,唯一需要考虑在维护滑窗的同时维护最大值

        对于每个滑动窗口,我们可以使用 O(k) 的时间遍历其中的每一个元素,找出其中的最大值。对于长度为 n 的数组 nums 而言,窗口的数量为 n−k+1,因此该算法的时间复杂度为 O((n−k+1)k)=O(nk),会超出时间限制,因此我们需要进行一些优化。

        我们可以想到,对于两个相邻(只差了一个位置)的滑动窗口,它们共用着 k−1 个元素,而只有 1 个元素是变化的。我们可以根据这个特点进行优化。

方法一:优先队列

        对于「最大值」,我们可以想到一种非常合适的数据结构,那就是优先队列(堆),其中的大根堆可以帮助我们实时维护一系列元素中的最大值。

        对于本题而言,初始时,我们将数组 nums 的前 k 个元素放入优先队列中。每当我们向右移动窗口时,我们就可以把一个新的元素放入优先队列中,此时堆顶的元素就是堆中所有元素的最大值。如果我们不做什么处理的话,那么随着滑窗的右移,可能这个最大值未被更新掉但已不在滑窗中即在数组 nums 中的位置出现在滑动窗口左边界的左侧)。那么也没有保留这个值的必要了,我们可以将它从优先队列中永久移除。

        我们不断地移除堆顶的元素,直到其确实出现在滑动窗口中。此时,堆顶元素就是滑动窗口中的最大值。为了方便判断堆顶元素与滑动窗口的位置关系,我们可以在优先队列中存储二元组 (num,index),表示元素 num 在数组中的下标为 index。

  1. class Solution {
  2. public:
  3. vector<int> maxSlidingWindow(vector<int>& nums, int k) {
  4. int n = nums.size();
  5. priority_queue<pair<int, int> > q;
  6. for(int i = 0; i <= k - 1; ++i) {
  7. q.emplace(nums[i], i);
  8. }
  9. vector<int> ans = {q.top().first};
  10. for(int i = k; i <= n - 1; ++i) {
  11. q.emplace(nums[i], i);
  12. //时刻检查堆顶元素位置是否已经不在滑窗中
  13. while(q.top().second <= i - k) {
  14. q.pop();
  15. }
  16. //更新在滑窗中的最大值
  17. ans.push_back(q.top().first);
  18. }
  19. return ans;
  20. }
  21. };
  22. 作者:力扣官解

在最坏情况下,数组 nums 中的元素单调递增,那么最终优先队列中包含了所有元素,没有元素被移除。由于将一个元素放入优先队列的时间复杂度为 O(log⁡n),因此总时间复杂度为 O(nlog⁡n)。

方法二:单调队列(具有单调性的双端队列)

        我们可以顺着方法一的思路继续进行优化。    

        由于我们需要求出的是滑动窗口的最大值,试想如下情境:

  • 如果当前的滑动窗口中有两个下标 i 和 j,其中 i 在 j 的左侧(i<j),并且 i 对应的元素不大于 j 对应的元素(nums[i]≤nums[j]),那么会发生什么呢?

        由于 nums[j] 的存在,nums[i] 一定不会是滑动窗口中的最大值了!也就是说,nums[j]遮挡住了nums[i]。我们可以将 nums[i] 永久地移除。  

        可以使用一个队列存储所有还没有被移除的下标(有可能作为滑窗最大值的备选)。在队列中,这些下标按照从小到大的顺序被存储,并且它们在数组 nums 中对应的值是严格单调递减的。(如果队列中有两个相邻的下标,它们对应的值相等或者递增,那么令前者为 i,后者为 j,就对应了上面所说的情况,即 nums[i] 会被移除,这就产生了矛盾)

        当滑窗右移时,我们需要把一个新的元素放入队列中。为了保持队列的性质,我们会不断地将新的元素与队尾的元素相比较。如果前者大于等于后者,那么队尾的元素就可以被永久地移除,我们将其弹出队列。重复此操作,直到队列为空或者新的元素小于队尾的元素。

        由于队列中下标对应的元素是严格单调递减的,因此此时队首下标对应的元素就是滑动窗口中的最大值。但与方法一中相同的是,此时的最大值可能在滑动窗口左边界的左侧,并且随着窗口向右移动,它永远不可能出现在滑动窗口中了。因此我们还需要不断从队首弹出元素,直到队首元素在窗口中为止。

  1. class Solution {
  2. public:
  3. vector<int> maxSlidingWindow(vector<int>& nums, int k) {
  4. int n = nums.size();
  5. deque<int> q;
  6. for (int i = 0; i < k; ++i) {
  7. //注意严格单减,">="
  8. while (!q.empty() && nums[i] >= nums[q.back()]) {
  9. q.pop_back();
  10. }
  11. q.push_back(i);
  12. }
  13. vector<int> ans = {nums[q.front()]}; //初始化写法
  14. for (int i = k; i < n; ++i) {
  15. while (!q.empty() && nums[i] >= nums[q.back()]) {
  16. q.pop_back();
  17. }
  18. q.push_back(i);
  19. while (q.front() <= i - k) {
  20. q.pop_front();
  21. }
  22. ans.push_back(nums[q.front()]);
  23. }
  24. return ans;
  25. }
  26. };
  27. 作者:力扣官解

        每一个下标恰好被放入队列一次,并且最多被弹出队列一次,因此时间复杂度为 O(n)。

        我们使用的数据结构是双向的,因此「不断从队首弹出元素」保证了队列中最多不会有超过 k+1 个元素,因此队列使用的空间为 O(k)。

方法三:分块(莫队基础)

        我们可以将数组 nums 从左到右按照 k 个一组进行分组,最后一组中元素的数量可能会不足 k 个。如果我们希望求出 nums[i] 到 nums[i+k−1] 的最大值,就会有两种情况:

  • 如果 i 是 k 的倍数,那么 nums[i] 到 nums[i+k−1] 恰好是一个分组。我们只要预处理出每个分组中的最大值,即可得到答案;

  • 如果 i 不是 k 的倍数,那么 nums[i] 到 nums[i+k−1] 会跨越两个分组,占有第一个分组的后缀以及第二个分组的前缀。假设 j 是 k 的倍数,并且满足 i<j≤i+k−1,那么 nums[i] 到 nums[j−1] 就是第一个分组的后缀,nums[j] 到 nums[i+k−1] 就是第二个分组的前缀。如果我们能够预处理出每个分组中的前缀最大值以及后缀最大值,同样可以在 O(1) 的时间得到答案。    

        因此我们用 prefixMax[i] 表示下标 i 对应的分组中,以 i 结尾的前缀最大值;suffixMax[i] 表示下标 i 对应的分组中,以 i 开始的后缀最大值。它们分别满足如下的递推式:

 以及

        在递推 suffixMax[i] 时需要考虑到边界条件 suffixMax[n−1]=nums[n−1],而在递推 prefixMax[i] 时的边界条件 prefixMax[0]=nums[0] 恰好包含在递推式的第一种情况中,因此无需特殊考虑。

        在预处理完成之后,对于 nums[i] 到 nums[i+k−1] 的所有元素,如果 i 不是 k 的倍数,那么窗口中的最大值为 suffixMax[i] 与 prefixMax[i+k−1] 中的较大值;如果 i 是 k 的倍数,那么此时窗口恰好对应一整个分组,suffixMax[i] 和 prefixMax[i+k−1] 都等于分组中的最大值。因此无论窗口属于哪一种情况,取个较大值就一劳永逸。

  1. class Solution {
  2. public:
  3. vector<int> maxSlidingWindow(vector<int>& nums, int k) {
  4. int n = nums.size();
  5. //以i结尾的前缀最大值和以i开始的后缀最大值
  6. vector<int> prefixMax(n), suffixMax(n);
  7. for(int i = 0; i <= n - 1; ++i) {
  8. //正好包含了0处的边界条件,无需特殊考虑
  9. if(i % k == 0) {
  10. prefixMax[i] = nums[i];
  11. } else {
  12. prefixMax[i] = max(prefixMax[i - 1], nums[i]);
  13. }
  14. }
  15. for(int i = n - 1; i >= 0; --i) {
  16. if(i == n - 1 || (i + 1) % k == 0) {
  17. suffixMax[i] = nums[i];
  18. } else {
  19. suffixMax[i] = max(suffixMax[i + 1], nums[i]);
  20. }
  21. }
  22. vector<int> ans;
  23. for(int i = 0; i <= n - k; ++i) {
  24. ans.push_back(max(suffixMax[i], prefixMax[i + k - 1]));
  25. }
  26. return ans;
  27. }
  28. };
  29. 作者:力扣官解

        我们需要 O(n) 的时间预处理出数组 prefixMax,suffixMax 以及计算答案。

我们再来看 宫水三叶 的思路:

        具体的,除了给定的 nums 以外,我们构建一个分块数组 region,其中 region[idx] = x, 含义为块编号为 idx 的最大值为 x,一个块对应一个原始区间 [l,r]。

        如何定义块大小是实现分块算法的关键。对于本题,本质是求若干个大小为 k 的区间最大值。我们可以设定块大小为 kk​,这样所需创建的分块数组大小为 nknk​。分块数组的更新操作为 O(1),而查询则为 kk。(对于每个长度为 k 的 [l,r] 查询操作而言,最多遍历两个(左右端点对应的块)的块内元素,复杂度为 O(kk),同时最多遍历 kk个块,复杂度同为 O(kk)。因此最多两步复杂度为 O(kk) 的块内操作,最多 kk步复杂度为 O(1) 的块间操作,整体复杂度为O(kk)

        因此使用分块算法总的计算量为 n×kk = 10^6,可以过。

        分块算法的几个操作函数:

  • int getIdx(int x) :计算原始下标对应的块编号;
  • void add(int x, int v) : 计算原始下标 x 所属的 idx,并将 region[idx]vmax 来更新 region[idx]
  • int query(int l, int r) : 查询 [l,r] 中的最大值,如果 l 和 r 所在块相同,直接遍历 [l,r] 进行取值;若 l 和 r 不同块,则处理 l 和 r 对应的块内元素后,对块编号在 (getIdx(l),getIdx(r))之间的块进行遍历。
  1. class Solution {
  2. int n, m, len;
  3. int[] nums, region;
  4. int getIdx(int x) {
  5. return x / len;
  6. }
  7. void add(int x, int v) {
  8. region[getIdx(x)] = Math.max(region[getIdx(x)], v);
  9. }
  10. int query(int l, int r) {
  11. int ans = Integer.MIN_VALUE;
  12. if (getIdx(l) == getIdx(r)) {
  13. for (int i = l; i <= r; i++) ans = Math.max(ans, nums[i]);
  14. } else {
  15. int i = l, j = r;
  16. while (getIdx(i) == getIdx(l)) ans = Math.max(ans, nums[i++]);
  17. while (getIdx(j) == getIdx(r)) ans = Math.max(ans, nums[j--]);
  18. for (int k = getIdx(i); k <= getIdx(j); k++) ans = Math.max(ans, region[k]);
  19. }
  20. return ans;
  21. }
  22. public int[] maxSlidingWindow(int[] _nums, int k) {
  23. nums = _nums;
  24. n = nums.length; len = (int) Math.sqrt(k); m = n / len + 10;
  25. region = new int[m];
  26. Arrays.fill(region, Integer.MIN_VALUE);
  27. //把数组中每一个元素划分到对应的分块里面去并更新最大值
  28. for (int i = 0; i < n; i++) add(i, nums[i]);
  29. int[] ans = new int[n - k + 1];
  30. for (int i = 0; i < n - k + 1; i++) ans[i] = query(i, i + k - 1);
  31. return ans;
  32. }
  33. }
  34. 作者:宫水三叶

数组大小为 n,块大小为 kk,分块数组大小为 nknk​。预处理分块数组复杂度为 O(n)(即 add 操作复杂度为 O(1) );构造答案复杂度为 O(n×kk)(即 query 操作复杂度为 O(kk),最多有 n 次查询)。


LeetCode187.重复的DNA序列:

问题描述:

给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

示例 :

输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]

代码分析:

        这是一道比较简单的字符串哈希/滑动窗口题,可以采用类似30.题的对起点进行分类的解法。滑窗长度直接定为10就好。当然需要注意,为了防止相同的子串被重复添加到答案,而又不使用常数较大的 Set 结构。我们可以规定:当且仅当该子串在之前出现过一次(加上本次,当前出现次数为两次)时,将子串加入答案。

  1. vector<string> findRepeatedDnaSequences(string s) {
  2. int n = s.size();
  3. int len = 10;
  4. unordered_map<string, int> map;
  5. vector<string> ans;
  6. for(int i = 0; i <= len - 1; ++i) {
  7. int j = i;
  8. while(j + len - 1 <= n - 1) {
  9. if(++map[s.substr(j, len)] == 2)
  10. ans.push_back(s.substr(j, len));
  11. j += len;
  12. }
  13. }
  14. return ans;
  15. }

方法二:字符串哈希+前缀和      

        以上解法的时间复杂度为O(10*n) ,计算量为 10^6。若题目给定的子串长度大于 100 时,加上生成子串和哈希表本身常数操作,那么计算量将超过 10^7,会 TLE。

        因此一个能够做到严格 O(n) 的做法是使用「字符串哈希 + 前缀和」。

        具体做法为,我们使用一个与字符串 s 等长的哈希数组 h[],以及次方数组 p[]

        由字符串预处理得到这样的哈希数组和次方数组复杂度为 O(n)。当我们需要计算子串 s[i...j] 的哈希值,只需要利用前缀和思想 h[j]−h[i−1]∗p[j−i+1] 即可在 O(1) 时间内得出哈希值(与子串长度无关)。

  • 到这里,还有一个小小的细节需要注意:如果我们期望做到严格 O(n),进行计数的「哈希表」就不能是以 String 作为 key,只能使用 Integer(也就是 hash 结果本身)作为 key。因为 Java 中的 String 的 hashCode 实现是会对字符串进行遍历的,这样哈希计数过程仍与长度有关,而 Integer 的 hashCode 就是该值本身,这是与长度无关的。
  1. class Solution {
  2. /*
  3. 进阶解法:字符串hash+前缀和计算
  4. 根据字符串每个字符的信息计算出一个"特有"的数值,这个数值很大程度上可以辨别不同的字符串于相同的字符串
  5. 然后直接用这个数值代替字符串就行,可以通过判断数值是否相同从而简介判断字符串是否相同
  6. 这个数值的计算完全可以利用前缀和结合进出窗口的元素来快速计算
  7. 这个在字符串窗口(长度)非常大的时会有很高的效率
  8. */
  9. public List<String> findRepeatedDnaSequences(String s) {
  10. List<String> res = new ArrayList<>();
  11. if(s == null || s.length <= 10) return res;
  12. // N是哈希数组的大小,P是质数底数(不唯一)
  13. int N = (int)1e5 + 1, P = 131313;
  14. // h为哈希数组,p为对应位置的幂
  15. int[] h = new int[N], p = new int[N];
  16. int len = s.length();
  17. // 求数组h与p:h与p的索引意义均为字符串长度i
  18. p[0] = 1;
  19. h[0] = 0;
  20. // 遍历长度为[1,len]
  21. for(int i = 1; i <= len; i++) {
  22. h[i] = h[i - 1] * P + s.charAt(i - 1);
  23. p[i] = p[i - 1] * P;
  24. }
  25. // 存储hash值与出现的次数
  26. Map<Integer, Integer> map = new HashMap<>();
  27. // 遍历每个长度为10的子串:以i-1为起始索引,起始索引开始为0
  28. // 例如长度为11,原本是0,1作为起始索引;偏移一位后为i=1,2,其中2=len-10+1
  29. for(int i = 1; i + 10 - 1 <= len; i++) {
  30. // 一开始i=1,j=10,说明是索引[0,9]的
  31. int j = i + 10 - 1;
  32. // 计算出s[i-1,j-1]的hash值
  33. int hash = h[j] - h[i - 1] * p[10];
  34. // 找出map中是否曾经出现过hash的值
  35. int cnt = map.getOrDefault(hash, 0);
  36. // 出现过:将s[i-1,j-1]加入res
  37. if(cnt == 1) res.add(s.substring(i - 1, j));
  38. // 更新map
  39. map.put(hash, cnt + 1);
  40. }
  41. return res;
  42. }
  43. }
  44. 作者:宫水三叶

        字符串哈希的「构造 p 数组」和「计算哈希」的过程,不会溢出吗?

        会溢出,溢出就会变为负数,当且仅当两个哈希值溢出程度与 Integer.MAX_VALUE 呈不同的倍数关系时,会产生错误结果(哈希冲突),此时考虑修改 P 或者采用表示范围更大的 long 来代替 int。


LeetCode219. 存在重复元素 II:

问题描述:

给你一个整数数组 nums 和一个整数 k ,判断数组中是否存在两个 不同的索引 i 和 j ,满足 nums[i] == nums[j]abs(i - j) <= k 。如果存在,返回 true ;否则,返回 false

代码分析:

        借这题来复习一下前面所学的双指针滑窗模板。仅仅注意判断重元最好还是用哈希表,空间换时间是不亏的。

  1. class Solution {
  2. public:
  3. bool containsNearbyDuplicate(vector<int>& nums, int k) {
  4. if(k == 0)
  5. return false;
  6. int n = nums.size();
  7. int left = 0, right = 0;
  8. unordered_map<int, int> map;
  9. while(right <= n - 1) {
  10. if(++map[nums[right]] >= 2) {
  11. return true;
  12. }
  13. //滑窗收缩
  14. if(right - left >= k) {
  15. --map[nums[left]];
  16. ++left;
  17. }
  18. ++right;
  19. }
  20. return false;
  21. }
  22. };

LeetCode220.存在重复元素 III(难):

问题描述:

给你一个整数数组 nums 和两个整数 kt 。请你判断是否存在 两个不同下标 ij,使得 abs(nums[i] - nums[j]) <= t ,同时又满足 abs(i - j) <= k

如果存在则返回 true,不存在返回 false

代码分析:

本题难点在于 abs(nums[i] - nums[j]) <= t 该如何处理?即使知道了方法和使用的数据结构,对于题目条件的灵活转换也是个难题

方法一:滑动窗口+有序集合二分

        对于序列中每一个元素 x 左侧的至多 k 个元素,如果这 k 个元素中存在一个元素落在区间 [x - t, x + t] 中,我们就找到了一对符合条件的元素。注意到对于两个相邻的元素,它们各自的左侧的 k 个元素中有 k-1 个是重合的。于是我们可以使用滑动窗口的思路,维护一个大小为 k 的滑动窗口,每次遍历到元素 x 时,滑动窗口中包含元素 x 前面的最多 k 个元素,我们检查窗口中是否存在元素落在区间 [x−t,x+t] 中即可。

        如果使用队列维护滑动窗口内的元素,由于元素是无序的,我们只能对于每个元素都遍历一次队列来检查是否有元素符合条件。如果数组的长度为 n,则使用队列的时间复杂度为 O(nk),会超出时间限制。

        我们希望能够找到一个数据结构维护滑动窗口内的元素,该数据结构需要满足以下操作:

  • 支持添加和删除指定元素的操作,否则我们无法维护滑动窗口;
  • 内部元素有序,支持二分查找的操作,这样我们可以快速判断滑动窗口中是否存在元素满足条件,具体而言,对于元素 x,当我们希望判断滑动窗口中是否存在某个数 y 落在区间 [x−t,x+t] 中,只需要判断滑动窗口中所有大于等于 x−t 的元素中的最小元素是否小于等于 x+t 即可。

        我们可以使用有序集合来支持这些操作。实现方面,我们在有序集合中查找大于等于 x−t 的最小的元素 y,如果 y 存在,且 y≤x+t,我们就找到了一对符合条件的元素。完成检查后,我们将 x 插入到有序集合中,如果有序集合中元素数量超过了 k,我们将有序集合中最早被插入的元素删除即可。
        注意:

  • 为防止整型 int 溢出,我们既可以使用长整型 long,也可以对查找区间 [x−t,x+t] 进行限制,使其落在 int 范围内。
  • 如果当前有序集合中存在相同元素,那么此时程序将直接返回 true。因此本题中的有序集合无需处理相同元素的情况。
  1. class Solution {
  2. public:
  3. bool containsNearbyAlmostDuplicate(vector<int>& nums, int k, int t) {
  4. int n = nums.size();
  5. set<int> rec;
  6. for (int i = 0; i < n; i++) {
  7. //返回找到不小于其参数的值第一次出现的位置的迭代器
  8. 之所以要把nums[i]与INT_MIN和INT_MAX比较,是为了进行值越界保护
  9. 剧透一下,本题有特殊测试案例是超了int范围的,在不换成long的情况下可以仿照如下
  10. auto iter = rec.lower_bound(max(nums[i], INT_MIN + t) - t);
  11. if (iter != rec.end() && *iter <= min(nums[i], INT_MAX - t) + t) {
  12. return true;
  13. }
  14. //滑窗移动
  15. rec.insert(nums[i]);
  16. if (i >= k) {
  17. rec.erase(nums[i - k]);
  18. }
  19. }
  20. return false;
  21. }
  22. };
  23. 作者:力扣官解

        n 是给定数组的长度。每个元素至多被插入有序集合和从有序集合中删除一次,每次操作时间复杂度均为 O(log⁡(min⁡(n,k))),整体O(nlog(min(n,k)))。

方法二:桶排序

        我们按照元素的大小进行分桶,维护一个滑动窗口内的元素对应的元素。

        对于元素值 x,其影响的值区间为 [x−t,x+t]。于是我们可以设定桶的大小为 t+1t + 1t+1。如果两个元素同属一个桶,那么这两个元素必然符合条件。如果两个元素属于相邻桶,那么我们需要校验这两个元素是否差值不超过 t。如果两个元素既不属于同一个桶,也不属于相邻桶,那么这两个元素必然不符合条件。

        具体地,我们遍历该序列,假设当前遍历到元素 x,那么我们首先检查 x 所属于的桶是否已经存在元素,如果存在,那么我们就找到了一对符合条件的元素,否则我们继续检查两个相邻的桶内是否存在符合条件的元素。

        实现方面,我们将 int 范围内的每一个整数 x 表示为 x=(t+1)×a+b(0≤b≤t) 的形式,这样 x 即归属于编号为 a 的桶。因为一个桶内至多只会有一个元素,所以我们使用哈希表实现即可。

  1. #define LL long long
  2. class Solution {
  3. public:
  4. LL size;
  5. bool containsNearbyAlmostDuplicate(vector <int> & nums, int k, int t) {
  6. int n = nums.size();
  7. unordered_map<LL, LL> m;
  8. size = t + 1L;
  9. for (int i = 0; i < n; i++) {
  10. LL u = nums[i] * 1L;
  11. LL idx = getIdx(u);
  12. // 目标桶已存在(桶不为空),说明前面已有 [u - t, u + t] 范围的数字
  13. if (m.find(idx) != m.end()) return true;
  14. // 检查相邻的桶
  15. LL l = idx - 1, r = idx + 1;
  16. if (m.find(l) != m.end() && abs(u - m[l]) <= t) return true;
  17. if (m.find(r) != m.end() && abs(u - m[r]) <= t) return true;
  18. // 建立目标桶
  19. m.insert({idx, u});
  20. // 移除下标范围不在 [max(0, i - k), i) 内的桶
  21. if (i >= k) m.erase(getIdx(nums[i - k]));
  22. }
  23. return false;
  24. }
  25. LL getIdx(LL u) {
  26. return u >= 0 ? u / size : ((u + 1) / size) - 1;
  27. }
  28. };
  29. 作者:宫水三叶

难点是对于getIdx()函数的理解,正负数的处理逻辑不同。详见题解链接 力扣


LeetCode396.旋转函数:

问题描述:

给定一个长度为 n 的整数数组 nums 。

假设 arrk 是数组 nums 顺时针旋转 k 个位置后的数组,我们定义 nums 的 旋转函数  F 为:

  • F(k) = 0 * arrk[0] + 1 * arrk[1] + ... + (n - 1) * arrk[n - 1]

返回 F(0), F(1), ..., F(n-1)中的最大值 

生成的测试用例让答案符合 32 位 整数。

示例 1:

输入: nums = [4,3,2,6]
输出: 26
解释:
F(0) = (0 * 4) + (1 * 3) + (2 * 2) + (3 * 6) = 0 + 3 + 4 + 18 = 25
F(1) = (0 * 6) + (1 * 4) + (2 * 3) + (3 * 2) = 0 + 4 + 6 + 6 = 16
F(2) = (0 * 2) + (1 * 6) + (2 * 4) + (3 * 3) = 0 + 6 + 8 + 9 = 23
F(3) = (0 * 3) + (1 * 2) + (2 * 6) + (3 * 4) = 0 + 2 + 12 + 12 = 26
所以 F(0), F(1), F(2), F(3) 中的最大值是 F(3) = 26 。

代码分析:

        这道题考虑到数据规模,用暴力解会超时,除了找规律、迭代公式就只能另辟蹊径了。

方法一:前缀和+滑动窗口

        题目要对「旋转数组」做逻辑,容易想到将 nums 进行复制拼接,得到长度为 2∗n 的新数组,在新数组上任意一个长度为 n 的滑动窗口都对应了一个旋转数组。

        然后考虑在窗口的滑动过程中,计算结果会如何变化,假设当前我们处理到下标为 [i,i+n−1] 的滑动窗口,根据题意,当前结果为:

        cur=nums[i]0+nums[i+1]1+...+nums[i+n1](n1)cur=nums[i]0+nums[i+1]1+...+nums[i+n1](n1)

        当窗口往后移动一位,也就是窗口的右端点来到 i+n 的位置,左端点来到 i+1 的位置时:

  • 需要增加「新右端点」的值,即增加 nums[i+n]∗(n−1),同时减去「旧左端点」的值,即减少 nums[i]∗0(固定为 0),然后更新新旧窗口的公共部分 [i+1,i+n−1]。

        不难发现,随着窗口的逐步右移,每一位公共部分的权值系数都会进行减一。

        nums[i+1]1+nums[i+2]2+...+nums[i+n1](n1)nums[i+1]1+nums[i+2]2+...+nums[i+n1](n1)

        变为

        nums[i+1]0+nums[i+2]1+...+nums[i+n1](n2)nums[i+1]0+nums[i+2]1+...+nums[i+n1](n2)

        因此,公共部分的差值为 i+n1idx=i+1nums[idx]i+n1idx=i+1nums[idx],这引导我们可以使用前缀和进行优化。

        至此,我们从旧窗口到新窗口的过渡,都是 O(1),整体复杂度为 O(n)。

  • 实现上,我们并不需要真正对 nums 进行复制拼接,而只需要在计算前缀和数组 sum 进行简单的下标处理即可。
  1. class Solution {
  2. public int maxRotateFunction(int[] nums) {
  3. int n = nums.length;
  4. int[] sum = new int[n * 2 + 10];
  5. for (int i = 1; i <= 2 * n; i++) sum[i] = sum[i - 1] + nums[(i - 1) % n];
  6. int ans = 0;
  7. for (int i = 1; i <= n; i++) ans += nums[i - 1] * (i - 1);
  8. for (int i = n + 1, cur = ans; i < 2 * n; i++) {
  9. cur += nums[(i - 1) % n] * (n - 1);
  10. cur -= sum[i - 1] - sum[i - n];
  11. if (cur > ans) ans = cur;
  12. }
  13. return ans;
  14. }
  15. }
  16. 作者:宫水三叶

LeetCode424.替换后的最长重复字符:

问题描述:

给你一个字符串 s 和一个整数 k 。你可以选择字符串中的任一字符,并将其更改为任何其他大写英文字符。该操作最多可执行 k 次。

在执行上述操作后,返回包含相同字母的最长子字符串的长度

示例 : 

输入:s = "AABABBA", k = 1
输出:4
解释:
将中间的一个'A'替换为'B',字符串变为 "AABBBBA"。
子串 "BBBB" 有最长重复字母, 答案为 4。

代码分析:

        本题类似于 1004. 最大连续1的个数 III ,此外与此相类似的还有2024.考试的最大困惑1208. 尽可能使字符串相等(后面会贴出)。但1004.只会在0和1两个状态中改变,本题每个位置的字母都有26种改变选择,明显难度就上来了,启发我们要学会转化题目条件。

        你可能也想过,某个位置的字母是否改变、改变成什么应该受到该位置左右两边元素的影响,我们希望通过更新该处使得目前周围字符串长度尽可能大。继续细想(我们仍尝试套用双指针滑窗模板),当前滑窗内的所有修改应该“劲往一处使”,即全都修改成统一的某个字符那么这个字符如何选取?不管三七二十一统一选取为当前nums[i]可以吗?会对最终结果产生何种影响?不可以,意思是说这种right每次往右走,只要不满足条件,left就一直收敛的算法模板不能套用,我们需要对其进行升级:

  • 我们仍需要枚举字符串中的每一个位置作为右端点,然后找到其最远的左端点的位置,满足该区间内除了出现次数最多的那一类字符之外,剩余的字符(即非最长重复字符)数量不超过 k 个
  • 每次右指针右移,如果区间仍然满足条件,那么左指针不移动(区间长度增加呗),否则左指针至多右移一格,保证区间长度不减小(不减小这是这种算法的关键,具体看代码注释)。
  1. class Solution {
  2. public int characterReplacement(String s, int k) {
  3. int[] num = new int[26];
  4. int n = s.length();
  5. int maxn = 0;
  6. //left:左边界,用于滑动时减去头部或者计算长度
  7. //right:右边界,用于加上划窗尾巴或者计算长度
  8. int left = 0, right = 0;
  9. while (right < n) {
  10. int indexR = s.charAt(right) - 'A';
  11. num[indexR]++;
  12. //求窗口中曾出现某字母的最大次数
  13. //计算某字母出现在某窗口中的最大次数,窗口长度只能增大或者不变(注意后面left指针只移动了0-1次)
  14. //这样做的意义:我们求的是最长,如果找不到更长的维持长度不变返回结果不受影响
  15. maxn = Math.max(maxn, num[indexR]);
  16. //窗口总长度len=right-left+1,以下简称len
  17. //其他字母总数=len-字母出现最大次数>替换数目 => len>字母出现最大次数+替换数目
  18. //分析一下,替换数目是不变的=k,字母出现最大次数是可能变化的,因此,只有字母出现最大次数增加的情况,len才能拿到最大值
  19. //又不满足条件的情况下,left和right一起移动,len不变的
  20. if (right - left + 1 - maxn > k) {
  21. //这里要减的,因为left越过该点,会对最大值有影响
  22. num[s.charAt(left) - 'A']--;
  23. //只要把该点抛出窗口即可,仍保持窗口长度不变的方式就是让right也提前走一步
  24. left++;
  25. }
  26. //right提前多走一步
  27. right++;
  28. }
  29. //要消除right提前多走一步的影响,结果为(right-1)-left+1==right-left
  30. return right - left;
  31. }
  32. }
  33. 作者:力扣官解

        要搞清楚滑动窗口的限制条件是什么,本题中窗口的限制就是当前窗口(right-left+1)的非主体元素(right-left+1-maxn)的个数不超过k个(也就这点我们不能容忍),一旦超过那么就要缩小窗口(left+1),但题解中并没有保证丢掉的一定是非主体元素,即在left+1过程中也可能丢掉主体元素,此时窗口仍然不符合条件(这点我们可以容忍)。

        在之前的模板中我们左移while直至满足条件后,才继续增长窗口大小,但本题不需要(如果算法写到这,仍要用while,就无法保留之前处理过的当前窗口的最大值,更别提返回该值了)。直接保持窗口大小,右移直至满足条件为止,为什么可以呢?因为我们求的是最大窗口,如果后续符合条件的窗口大于当前窗口,说明当前窗口右移后是子窗口,无需缩小窗口,甚至还要增大,若当前窗口为最大窗口则无需缩小,本质上窗口大小是只增不减的.从循环中还可以看出实际上窗口中主体元素变多时,窗口才会变大

宫水三叶版解法:

        相较于上述解法可能更贴近大家所熟知的双指针滑窗模板,并非像官解维护了窗口最大值。

  1. class Solution {
  2. public int characterReplacement(String s, int k) {
  3. char[] cs = s.toCharArray();
  4. int[] cnt = new int[26];
  5. int ans = 0;
  6. for (int l = 0, r = 0; r < s.length(); r++) {
  7. // cnt[cs[r] - 'A']++;
  8. int cur = cs[r] - 'A';
  9. cnt[cur]++;
  10. // while (!check(cnt, k)) cnt[cs[l++] - 'A']--;
  11. while (!check(cnt, k)) {
  12. int del = cs[l] - 'A';
  13. cnt[del]--;
  14. l++;
  15. }
  16. //直至符合限制l不再移动时才更新最大值
  17. ans = Math.max(ans, r - l + 1);
  18. }
  19. return ans;
  20. }
  21. boolean check(int[] cnt, int k) {
  22. int max = 0, sum = 0;
  23. for (int i = 0; i < 26; i++) {
  24. max = Math.max(max, cnt[i]);
  25. sum += cnt[i];
  26. }
  27. return sum - max <= k;
  28. }
  29. }
  30. 作者:宫水三叶

LeetCode480.滑动窗口中位数(难):

问题描述:

给你一个数组 nums,有一个长度为 k 的窗口从最左端滑动到最右端。窗口中有 k 个数,每次窗口向右移动 1 位。你的任务是找出每次窗口移动后得到的新窗口中元素有序化后的中位数,并输出由它们组成的数组。

代码分析:

        本题是 295. 数据流的中位数 的进阶版。难点在于选取何种数据结构或算法求出排序后窗口中的最中间的一或两个元素。

方法一:双优先队列+延迟删除(设计思想难)

        使用两个优先队列(堆)维护所有的元素,第一个优先队列 small 是一个大根堆,它负责维护所有元素中较小的那一半;第二个优先队列 large 是一个小根堆,它负责维护所有元素中较大的那一半。具体地,如果当前需要维护的元素个数为 x,那么 small 中维护了 x2x2 (向上取整)个元素,large 中维护了 x2x2 (向下取整)个元素,也就是说:

  • small 中的元素个数要么与 large 中的元素个数相同,要么比 large 中的元素个数恰好多 1 个。

        这样设计的好处在于:当二者包含的元素个数相同时,它们各自的堆顶元素的平均值即为中位数;而当 small 包含的元素多了一个时,small 的堆顶元素即为中位数

        插入方面,如果当前两个优先队列都为空,那么根据元素个数的要求,我们必须将这个元素加入 small;如果 small 非空(显然不会存在 small 空而 large 非空的情况),我们就可以将 num 与 small 的堆顶元素 top 比较:

  • 如果 num≤top,我们就将其加入 small 中;

  • 如果 num>top,我们就将其加入 large 中。

        在成功地加入元素 num 之后,两个优先队列的元素个数可能会变得不符合要求。由于我们只加入了一个元素,那么不符合要求的情况只能是下面的二者之一:

  • small 比 large 的元素个数多了 2 个;
  • small 比 large 的元素个数少了 1 个。

        对于第一种情况,我们将 small 的堆顶元素放入 large;对于第二种情况,我们将 large 的堆顶元素放入 small,这样就可以解决了插入的问题。

        然而对于移除而言,设计起来就不是那么容易了,因为我们知道,优先队列不支持移出非堆顶元素这一操作的,因此我们可以考虑使用「延迟删除」的技巧,即:

  • 当我们需要移出优先队列中的某个元素时,我们只将这个删除操作「记录」下来,而不去真的删除这个元素。当这个元素出现在 small 或者 large 的堆顶时,我们再去将其移出对应的优先队列。

        「延迟删除」使用到的辅助数据结构一般为哈希表 delayed,其中的每个键值对(num,freq),表示元素 num 还需要被删除 freq 次。「优先队列 + 延迟删除」有非常多种设计方式,体现在「延迟删除」的时机选择。在本题解中,我们使用一种比较容易编写代码的设计方式,即:

        我们保证在 insert(num),erase(num),getMedian() 任意操作完成之后small 和 large 的堆顶元素都是不需要被「延迟删除」的(或者说任意操作开始之前)。这样设计的好处在于:我们无需更改 getMedian() 的设计,只需要略加修改 insert(num) 即可。

        我们首先设计一个辅助函数 prune(heap),它的作用很简单,就是对 heap 这个优先队列(small 或者 large 之一),不断地弹出其需要被删除的堆顶元素,并且减少 delayed 中对应项的值。在 prune(heap) 完成之后,我们就可以保证 heap 的堆顶元素是不需要被「延迟删除」的

        这样我们就可以在 prune(heap) 的基础上设计另一个辅助函数 makeBalance(),它的作用即为调整 small 和 large 中的元素个数,使得二者的元素个数满足要求。由于有了 erase(num) 以及「延迟删除」,我们在将一个优先队列的堆顶元素放入另一个优先队列时,第一个优先队列的堆顶元素可能是需要删除的。因此我们就可以用 makeBalance() 将 prune(heap) 封装起来,它的逻辑如下:

  • 如果 small 和 large 中的元素个数满足要求,则不进行任何操作;
  • 如果 small 比 large 的元素个数多了 2 个,那么我们我们将 small 的堆顶元素放入 large。此时 small 的对应元素可能是需要删除的,因此我们调用 prune(small);
  • 如果 small 比 large 的元素个数少了 1 个,那么我们将 large 的堆顶元素放入 small。此时 large 的对应的元素可能是需要删除的,因此我们调用 prune(large)。

        此时,我们只需要在原先 insert(num) 的设计的最后加上一步 makeBalance() 即可。然而对于 erase(num),我们还是需要进行一些思考的:

  • 如果 num 与 small 和 large 的堆顶元素都不相同,那么 num 是需要被「延迟删除」的,我们将其在哈希表中的值增加 1;
  • 否则,例如 num 与 small 的堆顶元素相同,那么该元素是可以理解被删除的。虽然我们没有实现「立即删除」这个辅助函数,但只要我们将 num 在哈希表中的值增加 1,并且调用「延迟删除」的辅助函数 prune(small),那么就相当于实现了「立即删除」的功能。

        此时,所有的接口都已经设计完成了。由于 insert(num) 和 erase(num) 的最后一步都是 makeBalance(),而 makeBalance() 的最后一步是 prune(heap),因此我们就保证了任意操作完成之后,small 和 large 的堆顶元素都是不需要被「延迟删除」的。

  1. class DualHeap {
  2. private:
  3. // 大根堆,维护较小的一半元素
  4. priority_queue<int> small;
  5. // 小根堆,维护较大的一半元素
  6. priority_queue<int, vector<int>, greater<int>> large;
  7. // 哈希表,记录「延迟删除」的元素,key 为元素,value 为需要删除的次数
  8. unordered_map<int, int> delayed;
  9. int k;
  10. // small 和 large 当前包含的元素个数,需要扣除被「延迟删除」的元素
  11. int smallSize, largeSize;
  12. public:
  13. //构造函数,采用参数表形式
  14. DualHeap(int _k): k(_k), smallSize(0), largeSize(0) {}
  15. private:
  16. // 不断地弹出 heap 的堆顶元素,并且更新哈希表
  17. prune删除操作和哈希表共同完成erase延迟删除操作
  18. template<typename T>
  19. void prune(T& heap) {
  20. 该删除确保堆顶再无待延迟删除元素
  21. while (!heap.empty()) {
  22. int num = heap.top();
  23. if (delayed.count(num)) {
  24. --delayed[num];
  25. if (!delayed[num]) {
  26. delayed.erase(num);
  27. }
  28. heap.pop();
  29. }
  30. else {
  31. break;
  32. }
  33. }
  34. }
  35. // 调整 small 和 large 中的元素个数,使得二者的元素个数满足要求
  36. 平衡操作里包含prune删除操作
  37. void makeBalance() {
  38. if (smallSize > largeSize + 1) {
  39. // small 比 large 元素多 2 个
  40. large.push(small.top());
  41. small.pop();
  42. --smallSize;
  43. ++largeSize;
  44. // small 堆顶元素被移除,为了保证移除后的堆顶元素为非延迟删除元素,需要进行 prune
  45. prune(small);
  46. }
  47. else if (smallSize < largeSize) {
  48. // large 比 small 元素多 1 个
  49. small.push(large.top());
  50. large.pop();
  51. ++smallSize;
  52. --largeSize;
  53. // large 堆顶元素被移除,需要进行 prune
  54. prune(large);
  55. }
  56. }
  57. public:
  58. void insert(int num) {
  59. if (small.empty() || num <= small.top()) {
  60. small.push(num);
  61. ++smallSize;
  62. }
  63. else {
  64. large.push(num);
  65. ++largeSize;
  66. }
  67. makeBalance();
  68. }
  69. void erase(int num) {
  70. ++delayed[num];
  71. if (num <= small.top()) {
  72. 可以看到,虽然删除存在延时,但smallSize和largeSize是即时更新的
  73. --smallSize;
  74. if (num == small.top()) {
  75. 如果碰巧是堆顶,立即删除不犹豫
  76. prune(small);
  77. }
  78. }
  79. else {
  80. --largeSize;
  81. if (num == large.top()) {
  82. prune(large);
  83. }
  84. }
  85. 插入和删除都要记得最后检查平衡
  86. makeBalance();
  87. }
  88. double getMedian() {
  89. return k & 1 ? small.top() : ((double)small.top() + large.top()) / 2;
  90. }
  91. };
  92. class Solution {
  93. public:
  94. vector<double> medianSlidingWindow(vector<int>& nums, int k) {
  95. DualHeap dh(k);
  96. for (int i = 0; i < k; ++i) {
  97. dh.insert(nums[i]);
  98. }
  99. vector<double> ans = {dh.getMedian()};
  100. for (int i = k; i < nums.size(); ++i) {
  101. dh.insert(nums[i]);
  102. dh.erase(nums[i - k]);
  103. ans.push_back(dh.getMedian());
  104. }
  105. return ans;
  106. }
  107. };
  108. 作者:力扣官解

        由于「延迟删除」的存在,small 比 large 在最坏情况下可能包含所有的 n 个元素,即没有一个元素被真正删除了。因此优先队列的大小是 O(n) 而不是 O(k) 的,其中 n 是数组 nums 的长度。

        insert(num) 和 erase(num) 的单次时间复杂度为 O(log⁡n),getMedian() 的单次时间复杂度为 O(1)。因此总时间复杂度为 O(nlog⁡n)。

Java版:

        区别于C++,Java中的remove()不仅可以删除头节点而且还可以用 remove(Object o) 来删除堆中的与给定对象相同的最先出现的对象,所以用JAVA解本题就不用考虑延迟删除了。但是其方法时间复杂度为O(n)而非O(logn),数据量准备的比较好的话可能通过不了,需要手写堆实现,增加log级的删除方法。

  1. class Solution {
  2. public double[] medianSlidingWindow(int[] nums, int k) {
  3. int n = nums.length;
  4. int cnt = n - k + 1;
  5. double[] ans = new double[cnt];
  6. // 如果是奇数滑动窗口,让 right 的数量比 left 多一个
  7. //此处写法为lamda表达式
  8. PriorityQueue<Integer> left = new PriorityQueue<>((a,b)->Integer.compare(b,a)); // 滑动窗口的左半部分
  9. PriorityQueue<Integer> right = new PriorityQueue<>((a,b)->Integer.compare(a,b)); // 滑动窗口的右半部分
  10. for (int i = 0; i < k; i++) right.add(nums[i]);
  11. for (int i = 0; i < k / 2; i++) left.add(right.poll());
  12. ans[0] = getMid(left, right);
  13. for (int i = k; i < n; i++) {
  14. // 人为确保了 right 会比 left 多,因此,删除和添加都与 right 比较(left 可能为空)
  15. int add = nums[i], del = nums[i - k];
  16. if (add >= right.peek()) {
  17. right.add(add);
  18. } else {
  19. left.add(add);
  20. }
  21. if (del >= right.peek()) {
  22. right.remove(del);
  23. } else {
  24. left.remove(del);
  25. }
  26. adjust(left, right);
  27. ans[i - k + 1] = getMid(left, right);
  28. }
  29. return ans;
  30. }
  31. void adjust(PriorityQueue<Integer> left, PriorityQueue<Integer> right) {
  32. while (left.size() > right.size()) right.add(left.poll());
  33. while (right.size() - left.size() > 1) left.add(right.poll());
  34. }
  35. double getMid(PriorityQueue<Integer> left, PriorityQueue<Integer> right) {
  36. if (left.size() == right.size()) {
  37. return (left.peek() / 2.0) + (right.peek() / 2.0);
  38. } else {
  39. return right.peek() * 1.0;
  40. }
  41. }
  42. }
  43. 作者:宫水三叶

        注意:

  • 在 Java 中 Integer.compare 的实现是 (x < y) ? -1 : ((x == y) ? 0 : 1)。只是单纯的比较,不涉及运算,所以不存在溢出风险。优于 (x, y) -> y-x 。y = Integer.MAX_VALUE, x = Integer.MIN_VALUE 时,到导致溢出,返回的是负数 ,而不是逻辑期望的正数。
  • 计算中位数时使用的是 (a / 2.0) + (b / 2.0) 的形式,而不是采用 (a + b) / 2.0 的形式。后者有相加溢出的风险。

平衡二叉树:

        insert 和 erase 都是平衡二叉树的标准操作,getMedian 只要首先得到平衡树的 size,再根据奇偶性得到第 size/2 或者 (size+1)/2 的数即可。

  1. /*手写平衡二叉树*/
  2. class IndexedAVL{
  3. private static class Node{
  4. // 节点存储的真实的数据
  5. int val;
  6. // size 是这节点统辖的树的所有元素的总个数,cnt这个节点存储val出现的次数, height是节点的高度
  7. int size,cnt,height;
  8. Node left,right;
  9. public Node(int val) {
  10. this.val = val;
  11. this.cnt = this.height = this.size = 1;
  12. }
  13. }
  14. private int size;
  15. public int getSize() {
  16. return size;
  17. }
  18. private Node root;
  19. private int h(Node node){
  20. return node==null?0:node.height;
  21. }
  22. private int getSize(Node p){
  23. return p==null?0:p.size;
  24. }
  25. private void pushUp(Node p){
  26. p.height = Math.max(h(p.left),h(p.right))+1;
  27. p.size = p.cnt + getSize(p.left) + getSize(p.right);
  28. }
  29. // 右旋
  30. private Node zig(Node p){
  31. Node q = p.left;
  32. p.left = q.right;
  33. q.right = p;
  34. pushUp(p);
  35. pushUp(q);
  36. return q;
  37. }
  38. // 左旋
  39. private Node zag(Node q){
  40. Node p = q.right;
  41. q.right = p.left;
  42. p.left = q;
  43. pushUp(q);
  44. pushUp(p);
  45. return p;
  46. }
  47. private Node LL(Node t){
  48. return zig(t);
  49. }
  50. private Node LR(Node t){
  51. t.left = zag(t.left);
  52. return zig(t);
  53. }
  54. private Node RR(Node t){
  55. return zag(t);
  56. }
  57. private Node RL(Node t){
  58. t.right = zig(t.right);
  59. return zag(t);
  60. }
  61. private Node insert(Node t,int value) {
  62. if(t == null){
  63. return new Node(value);
  64. }
  65. Node newRoot = t;
  66. // 插入完成之后,要将搜索路径上的点依次进行调整 height,调整 size的大小
  67. if(value < t.val){
  68. t.left = insert(t.left,value);
  69. int leftH = h(t.left);
  70. int rightH = h(t.right);
  71. if(leftH - rightH > 1){
  72. // LL型
  73. if(value <= t.left.val){
  74. newRoot = LL(t);
  75. // LR型
  76. }else{
  77. newRoot = LR(t);
  78. }
  79. }
  80. }else if(value > t.val){
  81. t.right = insert(t.right,value);
  82. int leftH = h(t.left);
  83. int rightH = h(t.right);
  84. if(rightH -leftH >1){
  85. // RR型
  86. if(value >= t.right.val){
  87. newRoot = RR(t);
  88. // RL型
  89. }else{
  90. newRoot = RL(t);
  91. }
  92. }
  93. }else {
  94. t.cnt++;
  95. }
  96. pushUp(newRoot);
  97. return newRoot;
  98. }
  99. private Node remove(Node t,int value) {
  100. if(t == null) return null;
  101. Node newRoot = t;
  102. if(value < t.val){
  103. t.left = remove(t.left,value);
  104. // 删除左子树的节点,唯一可能导致"失衡" 的情况是 bf由 -1 变成-2
  105. int leftH = h(t.left);
  106. int rightH = h(t.right);
  107. if(rightH - leftH > 1){
  108. if( h(t.right.right) >= h(t.right.left) ){
  109. newRoot = RR(t);
  110. }else{
  111. newRoot = RL(t);
  112. }
  113. }
  114. } else if(value > t.val){
  115. t.right = remove(t.right,value);
  116. int leftH = h(t.left);
  117. int rightH = h(t.right);
  118. // 删除右子树的节点,唯一可能导致"失衡" 的情况是 bf由 1 变成 2
  119. if(leftH - rightH > 1){
  120. if(h(t.left.left) >= h(t.left.right)){
  121. newRoot = LL(t);
  122. }else{
  123. newRoot = LR(t);
  124. }
  125. }
  126. }else{
  127. if(t.cnt>1){
  128. t.cnt--;
  129. }else{
  130. // 下面细分成 3种情况 (左右子树都为空,一棵为空另一棵不为空,都不为空)
  131. if(t.left == null && t.right == null){
  132. return null;
  133. }else if(t.left != null && t.right == null){
  134. return t.left;
  135. }else if(t.left == null){
  136. return t.right;
  137. }else{
  138. // 用前驱的值代替(后继也是一样)
  139. Node cur = t.left;
  140. while(cur.right != null){
  141. cur = cur.right;
  142. }
  143. t.val = cur.val;
  144. t.left = remove(t.left,cur.val);
  145. // 这个地方仍然要有形态的调整
  146. // 删除左子树的节点,唯一可能导致"失衡" 的情况是 bf由 -1 变成-2
  147. int leftH = h(t.left);
  148. int rightH = h(t.right);
  149. if(rightH - leftH > 1){
  150. if( h(t.right.right) >= h(t.right.left) ){
  151. newRoot = RR(t);
  152. }else{
  153. newRoot = RL(t);
  154. }
  155. }
  156. }
  157. }
  158. }
  159. pushUp(newRoot);
  160. return newRoot;
  161. }
  162. private int getItemByRank(Node node,int rank){
  163. if(node == null) return Integer.MIN_VALUE;
  164. if(getSize(node.left) >= rank) return getItemByRank(node.left,rank);
  165. if(getSize(node.left)+node.cnt >= rank) return node.val;
  166. return getItemByRank(node.right,rank-getSize(node.left)-node.cnt);
  167. }
  168. public int getItemByRank(int rank){
  169. return getItemByRank(root,rank);
  170. }
  171. public void add(int value){
  172. root = insert(root,value);
  173. this.size++;
  174. }
  175. public void erase(int value){
  176. root = remove(root,value);
  177. this.size--;
  178. }
  179. }
  180. class Solution {
  181. public double[] medianSlidingWindow(int[] nums, int k) {
  182. List<Double> list = new ArrayList<>();
  183. IndexedAVL avl = new IndexedAVL();
  184. // 初始化
  185. int n = nums.length;
  186. for(int i=0;i<k-1;i++){
  187. avl.add(nums[i]);
  188. }
  189. int l = 0 ,r = k-1;
  190. while(r<n){
  191. avl.add(nums[r++]);
  192. if(k%2!=0){
  193. list.add(avl.getItemByRank(k/2+1)*1.0);
  194. }else{
  195. list.add(((double)avl.getItemByRank(k/2)+avl.getItemByRank(k/2+1))/2.0);
  196. }
  197. avl.erase(nums[l++]);
  198. }
  199. double[] ans = new double[list.size()];
  200. for(int i=0;i<list.size();i++){
  201. ans[i] = list.get(i);
  202. }
  203. return ans;
  204. }
  205. }

        C++中multiset底层就是红黑树,非常方便;当然手写splay、FHQ treap、AVL什么的也行。


LeetCode295.数据流的中位数:

问题描述:

实现 MedianFinder 类:

  • MedianFinder() 初始化 MedianFinder 对象。

  • void addNum(int num) 将数据流中的整数 num 添加到数据结构中。

  • double findMedian() 返回到目前为止所有元素的中位数。与实际答案相差 10-5 以内的答案将被接受。

基本条件同上题,区别在于上题求的是固定长度滑窗内的中位数,本题要求左固定而右不断扩大的数据结构中的中位数。

代码分析:

         经过上一题的洗礼,本题我们可以仿照写出。并且我们没有写erase()和prune()的必要了,makeBalance()都得到了极大的简化。

  1. class MedianFinder {
  2. public:
  3. priority_queue<int, vector<int> > queMin;
  4. priority_queue<int, vector<int>, greater<int> > queMax;
  5. MedianFinder() {}
  6. void addNum(int num) {
  7. if (queMin.empty() || num <= queMin.top()) {
  8. queMin.push(num);
  9. if (queMax.size() + 1 < queMin.size()) {
  10. queMax.push(queMin.top());
  11. queMin.pop();
  12. }
  13. } else {
  14. queMax.push(num);
  15. if (queMax.size() > queMin.size()) {
  16. queMin.push(queMax.top());
  17. queMax.pop();
  18. }
  19. }
  20. }
  21. double findMedian() {
  22. if (queMin.size() > queMax.size()) {
  23. return queMin.top();
  24. }
  25. return (queMin.top() / 2.0 + queMax.top() / 2.0) ;
  26. }
  27. };

方法二:有序集合+双指针

        我们也可以使用有序集合维护这些数。我们把有序集合看作自动排序的数组,使用双指针指向有序集合中的中位数元素即可。当累计添加的数的数量为奇数时,双指针指向同一个元素。当累计添加的数的数量为偶数时,双指针分别指向构成中位数的两个数。

        当我们尝试添加一个数 num 到数据结构中,我们需要分情况讨论:

  • 初始有序集合为空时,我们直接让左右指针指向 num 所在的位置。
  • 有序集合中元素为奇数时,left 和 right 同时指向中位数。如果 num 大于等于中位数,那么只要让 right 右移,否则让 left 左移即可。
  • 有序集合中元素为偶数时,left 和 right 分别指向构成中位数的两个数。

        针对第三点:

  1. 当 num 成为新的唯一的中位数,那么我们让 left 右移,right 左移,这样它们即可指向 num 所在的位置;
  2. 当 num 大于等于 right,那么我们让 left 右移即可;
  3. 当 num 小于 right 指向的值,那么我们让 right 左移,注意到如果 num 恰等于 left 指向的值,那么 num 将被插入到 left 右侧,使得 left 和 right 间距增大,所以我们还需要额外让 left 指向移动后的 right。
  1. class MedianFinder {
  2. //基于红黑树,允许键值重复的有序集合
  3. multiset<int> nums;
  4. multiset<int>::iterator left, right;
  5. public:
  6. MedianFinder() : left(nums.end()), right(nums.end()) {}
  7. void addNum(int num) {
  8. const size_t n = nums.size();
  9. nums.insert(num);
  10. //若初始集合为空,直接指向num所在位置
  11. if (!n) {
  12. left = right = nums.begin();
  13. } else if (n & 1) {
  14. if (num < *left) {
  15. left--;
  16. } else {
  17. right++;
  18. }
  19. } else {
  20. if (num > *left && num < *right) {
  21. left++;
  22. right--;
  23. } else if (num >= *right) {
  24. left++;
  25. } else {
  26. right--;
  27. left = right;
  28. }
  29. }
  30. }
  31. double findMedian() {
  32. return (*left + *right) / 2.0;
  33. }
  34. };
  35. 作者:力扣官解

LeetCode2024.考试的最大困扰度:

问题描述:

(2022.8.30 字节跳动)简单讲就是给你一个长度为n个字符的字符串,每个字符只有“T”或“F”两种状态。现在要求不超过k次地改变字符的状态,返回最大的连续“T”或“F”的数目。

代码分析:

        本题十分类似 1004. 最大连续1的个数 III  。只不过对于1004.每个位置仅有一个状态是有效的,而本题两个状态都是有效的。因此我们考虑分别统计“T”串和“F”串。

  1. class Solution {
  2. public:
  3. int maxConsecutiveChar(string& answerKey, int k, char ch) {
  4. int n = answerKey.size();
  5. int ans = 0;
  6. for (int left = 0, right = 0, sum = 0; right < n; right++) {
  7. sum += answerKey[right] != ch;
  8. while (sum > k) {
  9. sum -= answerKey[left++] != ch;
  10. }
  11. ans = max(ans, right - left + 1);
  12. }
  13. return ans;
  14. }
  15. int maxConsecutiveAnswers(string answerKey, int k) {
  16. return max(maxConsecutiveChar(answerKey, k, 'T'),
  17. maxConsecutiveChar(answerKey, k, 'F'));
  18. }
  19. };
  20. 作者:力扣官解

LeetCode1208.尽可能使字符串相等:

问题描述:

给你两个长度相同的字符串,st

s 中的第 i 个字符变到 t 中的第 i 个字符需要 |s[i] - t[i]| 的开销(开销可能为 0),也就是两个字符的 ASCII 码值的差的绝对值。

用于变更字符串的最大预算是 maxCost。在转化字符串时,总开销应当小于等于该预算,这也意味着字符串的转化可能是不完全的。

如果你可以将 s 的子字符串转化为它在 t 中对应的子字符串,则返回可以转化的最大长度。

如果 s 中没有子字符串可以转化成 t 中对应的子字符串,则返回 0

代码分析:

        除了像上题的标准双指针滑窗做法,我们还可以借鉴 424. 替换后的最长重复字符 使得滑窗长度不变或只增大的做法。

  1. class Solution {
  2. public int equalSubstring(String s, String t, int maxCost) {
  3. int n = s.length();
  4. int[] diff = new int[n];
  5. for (int i = 0; i < n; i++) {
  6. diff[i] = Math.abs(s.charAt(i) - t.charAt(i));
  7. }
  8. int maxLength = 0;
  9. int start = 0, end = 0;
  10. int sum = 0;
  11. while (end < n) {
  12. sum += diff[end];
  13. while (sum > maxCost) {
  14. sum -= diff[start];
  15. start++;
  16. }
  17. maxLength = Math.max(maxLength, end - start + 1);
  18. end++;
  19. }
  20. return maxLength;
  21. }
  22. };

        这样写也可以:

  1. class Solution {
  2. public int equalSubstring(String s, String t, int maxCost) {
  3. int n = s.length();
  4. int[] diff = new int[n];
  5. for (int i = 0; i < n; i++) {
  6. diff[i] = Math.abs(s.charAt(i) - t.charAt(i));
  7. }
  8. int maxLength = 0;
  9. int start = 0, end = 0;
  10. int sum = 0;
  11. while (end < n) {
  12. sum += diff[end];
  13. if (sum > maxCost) {
  14. sum -= diff[start];
  15. start++;
  16. }
  17. end++;
  18. }
  19. return end - start;
  20. }
  21. }

方法二:前缀和+二分搜索

        首先计算数组 diff 的前缀和,创建长度为 n+1 的数组 accDiff,其中 accDiff[0]=0,对于 0≤i<n,有 accDiff[i+1]=accDiff[i]+diff[i]。

        即当 1≤i≤n 时,accDiff[i] 为 diff 从下标 0 到下标 i−1 的元素和:

        accDiff[i]=i1j=0diff[j]accDiff[i]=i1j=0diff[j]

        当 diff 的子数组以下标 j 结尾时,需要找到最小的下标 k(k≤j),使得 diff 从下标 k 到 j 的元素和不超过 maxCost,此时子数组的长度是 j−k+1。由于已经计算出前缀和数组 accDiff,因此可以通过 accDiff 得到 diff 从下标 k 到 j 的元素和:

        ji=kdiff[i]=ji=0diff[i]k1i=0diff[i]=accDiff[j+1]accDiff[k]ji=kdiff[i]=ji=0diff[i]k1i=0diff[i]=accDiff[j+1]accDiff[k]

        因此,找到最小的下标 k(k≤j),使得 diff 从下标 k 到 j 的元素和不超过 maxCost,等价于找到最小的下标 k(k≤j),使得 accDiff[j+1]−accDiff[k]≤maxCost

        由于 diff 的的每个元素都是非负的,因此 accDiff 是递增的,对于每个下标 j,可以通过在 accDiff 内进行二分查找的方法找到符合要求的最小的下标 k。

        对于下标范围 [1,n] 内的每个 i,通过二分查找的方式,在下标范围 [0,i] 内找到最小的下标 start,使得 accDiff[start] ≥ accDiff[i]−maxCost,此时对应的 diff 的子数组的下标范围是从 start 到 i−1,子数组的长度是 i−start。

        遍历下标范围 [1,n] 内的每个 i 之后,即可得到符合要求的最长子数组的长度,即字符串可以转化的最大长度。

  1. class Solution {
  2. public int equalSubstring(String s, String t, int maxCost) {
  3. int n = s.length();
  4. int[] accDiff = new int[n + 1];
  5. for (int i = 0; i < n; i++) {
  6. accDiff[i + 1] = accDiff[i] + Math.abs(s.charAt(i) - t.charAt(i));
  7. }
  8. int maxLength = 0;
  9. for (int i = 1; i <= n; i++) {
  10. int start = binarySearch(accDiff, i, accDiff[i] - maxCost);
  11. maxLength = Math.max(maxLength, i - start);
  12. }
  13. return maxLength;
  14. }
  15. public int binarySearch(int[] accDiff, int endIndex, int target) {
  16. int low = 0, high = endIndex;
  17. while (low < high) {
  18. //防止(high+low)/2溢出
  19. int mid = (high - low) / 2 + low;
  20. if (accDiff[mid] < target) {
  21. low = mid + 1;
  22. } else {
  23. high = mid;
  24. }
  25. }
  26. return low;
  27. }
  28. }
  29. 作者:力扣官解

        计算前缀和数组 accDiff 的时间复杂度是 O(n)。 需要进行 n 次二分查找,每次二分查找的时间复杂度是 O(log⁡n),二分查找共需要 O(nlog⁡n) 的时间。 因此总时间复杂度是 O(nlog⁡n)。


持续更新......(40000字)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/276866
推荐阅读
相关标签
  

闽ICP备14008679号