【每日算法Day 64】正则表达式匹配
Wallace Xu 2020-08-03 字符串动态规划
非常经典的一到动态规划题目,状态转移的逻辑有些复杂。联系到之前的AtoI那一题,其实还可以考虑用确定有限状态机来表示题目中的pattern。
# LeetCode 10. 正则表达式匹配 (opens new window)
# 题目描述
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
'.' 匹配任意单个字符 '*' 匹配零个或多个前面的那一个元素 所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
说明:
s 可能为空,且只包含从 a-z 的小写字母。 p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
# 示例
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
1
2
3
4
5
6
7
8
9
10
11
2
3
4
5
6
7
8
9
10
11
# 解题思路
我们考虑s的最后一个字符s[i]和p的最后一个字符p[j]。如果两个字符相同或pl是“.”,则s和p能否匹配取决于除去最后一个字符的s'和p'是否匹配;如果不匹配但pl是“*”,则可以根据通配符前的字符出现次数来进一步判断。
我们使用dp[i][j]来表示s的前i个字符和p的前j个字符是否匹配。
public boolean isMatch(String s, String p) {
if (s==null) s="";
if (p==null) p="";
if (s.equals(p)) return true;
int m = s.length(), n = p.length();
boolean[][] dp = new boolean[m + 1][n + 1];
//边界case
dp[0][0] = true;
/*其实初始化时就是false
for (int i = 1; i <= m; i++) {
dp[i][0]=false;
}*/
for (int j = 1; j <= n; j++) {
if (p.charAt(j-1)=='*')
dp[0][j] = dp[0][j - 2];
}
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
char pattern = p.charAt(j - 1);
char chara = s.charAt(i - 1);
if (pattern == '.' || pattern == chara) {//单个字符匹配的情况
dp[i][j] = dp[i - 1][j - 1];
} else if (pattern == '*') {
//能匹配的情况,为了逻辑清楚这里不合并if判断了
if (dp[i][j - 2]) {
//*前的字符出现0次
dp[i][j] = true;
} else if ((p.charAt(j - 2) == '.' || p.charAt(j - 2) == chara) && dp[i - 1][j]) {
//*前的字符出现1次,出现多次的情况可以从dp[0][j]传递过来
dp[i][j] = true;
}
}
/*完全不匹配
else {
dp[i][j] = false;
} */
}
}
return dp[m][n];
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
空间复杂度和时间复杂度为O(m*n),我们需要计算出所有的状态,在状态间转移的时间复杂度为O(1)。