题目描述
给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
异位词 指字母相同,但排列不同的字符串。
示例 1:
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。
说明:
s 和 p 仅包含小写字母
条件分析
- 不需要考虑字符顺序;
- s和p仅包含小写字母,可考虑使用字符的ascii码来记录字符出现的频率;
- p中的字符可能会重复;
- 如何快速判断子串已匹配;
解题思路(滑动窗口)
-
定义一个int数组freq,记录p中字符对应ascii码出现的频率;定义一个matchSize,代表出现字符匹配的数量;
-
定义两个下标left,right,遍历s,right一直向右遍历,如果right对应的元素在p中的频率大于0,则freq对应下标频率减1,同时matchSize++,当matchSize和p的字符长度相等时,说明[left,right]之间的字符是p的异位词,则代表找到了一个解,记录left;
-
如果right对应的元素在p中的频率不大于0,此时[left,right)之间可能存在与right相等的字符,需要将left定位到该字符之后,同时在定位的过程中,如果发现left所在的元素不等于right所在的元素,相应的freq和matchSize要回退。最后直接left++,right++即可;
-
遍历right,直到right到达数组末尾;
编码如下
public List<Integer> findAnagrams(String s, String p) {
List<Integer> result = new ArrayList<>();
int sLength = s.length();
int pLength = p.length();
if (sLength < pLength) {
return result;
}
char[] pChar = p.toCharArray();
int[] freq = new int[256];
for (char c : pChar) {
freq[c]++;
}
char[] sChar = s.toCharArray();
int right = 0;
int left = right;
int matchSize = 0;
while (right < sLength) {
if (freq[sChar[right]] > 0) {
freq[sChar[right]]--;
matchSize++;
if (matchSize == pLength) {
result.add(left);
freq[sChar[left++]]++;
matchSize--;
}
right++;
} else {
while (left < right) {
if (sChar[left] == sChar[right]) {
break;
}
freq[sChar[left++]]++;
matchSize--;
}
right++;
left++;
}
}
return result;
}