算法思想
算法解释参考:《算法图解》ISBN 978-7-115-44763-0
详细求解参考:算法:最长公共子序列(输出所有最长公共子序列/Python实现)
主要利用了动态规划思想:从小问题着手
算法举例解释:
代码实现
由上图的思路总结,可以得到一个网格。想要得到具体的序列,还需要反向回推。
首先,需要在左边和上边添加一列0作为辅助。
然后看下面代码的while部分,从右下角往上找,找到值变化的地方,再往左找,找到值变化的地方,此处对应最后一个词。
也可以从右下角先往左,再往上,可能会有不一样的结果(可以用注释掉的l1,l2试试看)。只要修改while语句的1,2行及3,4行对换,就会有另一个结果。
下面的代码只能找到一个最长子序列,当存在多个子序列时,下面的代码不适用,可以作为参考。如何把所有最长子序列都找到?欢迎评论留下你的建议。
import numpy as np
def lcs_test(list1, list2):
"""
两个序列的最大公共子序列
:param list1: 行
:param list2: 列
"""
cell = np.zeros((len(list2) + 1, len(list1) + 1))
for i in range(len(list2)):
for j in range(len(list1)):
if list2[i] == list1[j]:
cell[i + 1][j + 1] = cell[i][j] + 1
else:
cell[i + 1][j + 1] = max(cell[i][j + 1], cell[i + 1][j])
print("网格:\n", cell)
print("子序列长度的最大值:", int(cell[len(list2)][len(list1)]))
max_len = int(cell[len(list2)][len(list1)])
max_list = [0] * max_len
x = len(list2)
y = len(list1)
while True:
while cell[x][y] == cell[x - 1][y]:
x -= 1
while cell[x][y] == cell[x][y - 1]:
y -= 1
if cell[x][y] > cell[x - 1][y] and cell[x][y] > cell[x][y - 1]:
max_list[max_len - 1] = list1[y - 1]
max_len -= 1
x -= 1
y -= 1
if max_len == 0:
break
print(max_list)
if __name__ == '__main__':
l1 = ['I', 'love', 'python']
l2 = ['You', 'love', 'python', 'and', 'java']
# l1 = ['b', 'a', 'e', 'a', 'l', 'u', 'c']
# l2 = ['a', 'i', 'e', 'b', 'u', 'a', 'e']
lcs_test(l1, l2)
结果如下:
网格:
[[0. 0. 0. 0.]
[0. 0. 0. 0.]
[0. 0. 1. 1.]
[0. 0. 1. 2.]
[0. 0. 1. 2.]
[0. 0. 1. 2.]]
子序列长度的最大值: 2
['love', 'python']