题目描述


给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。

异位词 指字母相同,但排列不同的字符串。

示例 1:

输入: s = "cbaebabacd", p = "abc"

输出: [0,6]

解释:

起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。

起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。

说明:
s 和 p 仅包含小写字母

条件分析


  1. 不需要考虑字符顺序;
  2. s和p仅包含小写字母,可考虑使用字符的ascii码来记录字符出现的频率;
  3. p中的字符可能会重复;
  4. 如何快速判断子串已匹配;

解题思路(滑动窗口)


  1. 定义一个int数组freq,记录p中字符对应ascii码出现的频率;定义一个matchSize,代表出现字符匹配的数量;

  2. 定义两个下标left,right,遍历s,right一直向右遍历,如果right对应的元素在p中的频率大于0,则freq对应下标频率减1,同时matchSize++,当matchSize和p的字符长度相等时,说明[left,right]之间的字符是p的异位词,则代表找到了一个解,记录left;

  3. 如果right对应的元素在p中的频率不大于0,此时[left,right)之间可能存在与right相等的字符,需要将left定位到该字符之后,同时在定位的过程中,如果发现left所在的元素不等于right所在的元素,相应的freq和matchSize要回退。最后直接left++,right++即可;

  4. 遍历right,直到right到达数组末尾;

编码如下

 public List<Integer> findAnagrams(String s, String p) {
    List<Integer> result = new ArrayList<>();
    int sLength = s.length();
    int pLength = p.length();
    if (sLength < pLength) {
        return result;
    }
    char[] pChar = p.toCharArray();
    int[] freq = new int[256];
    for (char c : pChar) {
        freq[c]++;
    }
    char[] sChar = s.toCharArray();
    int right = 0;
    int left = right;
    int matchSize = 0;
    while (right < sLength) {
        if (freq[sChar[right]] > 0) {
            freq[sChar[right]]--;
            matchSize++;
            if (matchSize == pLength) {
                result.add(left);
                freq[sChar[left++]]++;
                matchSize--;
            }
            right++;
        } else {
            while (left < right) {
                if (sChar[left] == sChar[right]) {
                    break;
                }
                freq[sChar[left++]]++;
                matchSize--;
            }
            right++;
            left++;
        }
    }
    return result;
}