847. 访问所有节点的最短路径

方法一:状态压缩 + 广度优先搜索

由于题目需要求出「访问所有节点的最短路径的长度」,并且图中每一条边的长度均为 1,因此我们可以考虑使用广度优先搜索的方法求出最短路径。

三元组 (u, mask, dist) 表示队列中的每一个元素中:

  • u 节点编号;
  • mask 是一个长度为 n 的二进制数,表示每一个节点是否经过。
  • dist 到当前节点为止经过的路径长度。

初始时,将所有的 (i, 2i, 0) 放入队列,表示可以从任一节点开始。在搜索的过程中,如果当前三元组中的 mask 包含 n 个 1( 2n - 1),那么就可以返回 dist 作为答案。

同一个节点 u 以及节点的经过情况 mask 只被搜索到一次,可以使用数组或者哈希表记录 (u, mask) 是否已经被搜索过,防止无效的重复搜索。

class Solution:
    def shortestPathLength(self, graph: List[List[int]]) -> int:
        n = len(graph)
        q = deque((i, 1 << i, 0) for i in range(n))
        vis = {(i, 1 << i) for i in range(n)}        
        
        while q:
            u, mask, dist = q.popleft()
            if mask == (1 << n) - 1: # 找到答案,返回结果
                return dist
            # 扩展 搜索相邻的节点
            for v in graph[u]:
                # 将 mask 的第 v 位置为 1
                mask_v = mask | (1 << v)
                if (v, mask_v) not in seen:
                    q.append((v, mask_v, dist + 1))
                    vis.add((v, mask_v))
        
        return 0

方法二:预处理点对间最短路 + 状态压缩动态规划

由于题目中给定的图是连通图,那么可以计算出任意两个节点之间 u, v 间的最短距离,记为 d(u, v)。这样一来,就可以使用动态规划的方法计算出最短路径。

对于任意一条经过所有节点的路径,它的某一个子序列(可以不连续)一定是 0, 1, ⋯, n−1 的一个排列。我们称这个子序列上的节点为「关键节点」。在动态规划的过程中,通过枚举「关键节点」进行状态转移。

我们用 f[u][mask] 表示从任一节点开始到节点 u 为止,并且经过的「关键节点」对应的二进制表示为 mask 时的最短路径长度。由于 u 是最后一个「关键节点」,那么在进行状态转移时,我们可以枚举上一个「关键节点」v,即:

847. 访问所有节点的最短路径_最短路径


其中 mask\u 表示将 mask 的第 u 位从 1 变为 0 后的二进制表示。也就是说,「关键节点」v 在 mask 中的对应位置必须为 1,将 f[v][mask\u] 加上从 v 走到 u 的最短路径长度为 d(v, u),取最小值即为 f[u][mask]。

最终的答案即为:

847. 访问所有节点的最短路径_搜索_02


当 mask 中只包含一个 1 时,我们无法枚举满足要求的上一个「关键节点」v。这里的处理方式与方法一中的类似:若 mask 中只包含一个 1,说明位于开始的节点,还未经过任何路径,因此状态转移方程直接写为:

f[u][mask] = 0

此外,在状态转移方程中,需要多次求出 d(v, u),因此我们可以考虑在动态规划前将所有的 d(v, u) 预处理出来。这里有两种可以使用的方法,时间复杂度均为 O(n^3):

可以使用 Floyd 算法求出所有点对之间的最短路径长度;

可以进行 n 次广度优先搜索,第 i 次从节点 i 出发,也可以得到所有点对之间的最短路径长度。

class Solution:
    def shortestPathLength(self, graph: List[List[int]]) -> int:
        n = len(graph)
        d = [[n + 1] * n for _ in range(n)]
        for i in range(n):
            for j in graph[i]:
                d[i][j] = 1
        
        # 使用 floyd 算法预处理出所有点对之间的最短路径长度
        for k in range(n):
            for i in range(n):
                for j in range(n):
                    d[i][j] = min(d[i][j], d[i][k] + d[k][j])

        f = [[float("inf")] * (1 << n) for _ in range(n)]
        for mask in range(1, 1 << n):
            # 如果 mask 只包含一个 1,即 mask 是 2 的幂
            if (mask & (mask - 1)) == 0:
                u = bin(mask).count("0") - 1
                f[u][mask] = 0
            else:
                for u in range(n):
                    if mask & (1 << u):
                        for v in range(n):
                            if (mask & (1 << v)) and u != v:
                                f[u][mask] = min(f[u][mask], f[v][mask ^ (1 << u)] + d[v][u])

        ans = min(f[u][(1 << n) - 1] for u in range(n))
        return ans

1、旅行商问题的一般形式

旅行商问题(TSP):给定一系列城市和每对城市之间的距离,求解访问每一座城市一次并回到起始城市的最短回路。从图论的角度来看,该问题实质是在一个带权完全无向图中,找一个权值最小的哈密顿回路。

本题是一道类似旅行商问题,区别在于:可以重复访问某些节点,且在遍历完最后一个节点后不用回到出发点。

2、广度优先搜索的原理

广度优先搜索(BFS)算法是一种盲目搜索算法,目的是系统地检查图中所有节点,直到找到结果为止。由于广度优先搜索的扩展原则是先生成的节点先扩展,所以可以求得最短路径。一般而言,利用一个队列 queue 来存储当前已经生成的节点,每次弹出队头元素进行下一步扩展。

例子:在以下图中寻找值为 8 的节点

847. 访问所有节点的最短路径_最短路径_03


首先将起点放入队列,这是第一个生成的节点。

847. 访问所有节点的最短路径_状态压缩_04

开始第一轮循环,本轮队列中仅 1 个元素。

弹出队头元素 1,扩展,生成了 2, 3 两个节点,均放入队列。

队列中 1 个元素扩展完成,本次循环结束。开始新一轮循环,本轮队列中有 2 个元素

847. 访问所有节点的最短路径_状态压缩_05


弹出队头元素 2,扩展,生成了 4, 5 两个节点,放入队列。

847. 访问所有节点的最短路径_搜索_06


弹出队头元素 3,扩展生成 6, 7,放入队列。

队列中 2 个元素扩展完成,本次循环结束。开始新一轮循环,本轮队列中有 4 个元素

847. 访问所有节点的最短路径_状态压缩_07


弹出队头元素 4,扩展生成 8,找到了答案,当前处在第 3 轮循环,所以最短路径为 3。此时本轮仍有 3 个元素未被扩展,但因为已经找到了答案,所以直接退出搜索。

但是 BFS 算法扩展的前提是,每个节点可以以任意顺序扩展,也即一个节点与所有它可以扩展的节点距离都相同。对于本题而言,需要求最短路径,且任意两个节点之间距离均为 1,所以可以使用 BFS 算法。

特别地,根据上述例子,我们需要每次记录本轮循环队列中的节点数量,以便最终判定最短路径长度;另一方面,对于已生成的节点,需要标记,防止重复被生成。**一般而言,为了写代码时更加方便直观,在扩展过程中不判断是否找到了答案,而是每次弹出队头元素时进行判断。**所以一般的 BFS 代码框架如下:

# 1.初始化队列及标记数组,存入起点
# 1.初始化队列及标记数组,存入起点
from collections import deque

q = deque()

# graph = [[1],[0,2,4],[1,3,4],[2],[1,2]]
graph = [[1,2],[0,3,4],[0,5,6],[1,7],[1,7],[2,7,8],[2,8],[3,4,5],[5,6]]
target = 4
vis = [False for i in graph] # vector

q.extend(graph[0]) # 存入起点,标记
vis[0] = True

# 2.开始搜索
while q:
    cur = q.popleft() # 弹出队头元素
#         找到答案,退出搜索
    if cur == target: 
        print("hello")
        break

#         action(cur) # 有些题目需要对当前元素做处理

    for x in graph[cur]:
        if not vis[x]:
            q.append(x)
            vis[x] = True

当然,我们也可以将当前扩展的距离作为一个变量一起存入队列:

from collections import deque

q = deque()
# graph = [[1],[0,2,4],[1,3,4],[2],[1,2]]
graph = [[1,2],[0,3,4],[0,5,6],[1,7],[1,7],[2,7,8],[2,8],[3,4,5],[5,6]]
target = 7
vis = [False for i in graph] 

q.append((0,0))         
vis[0] = True

while q:
    cur, dist = q.popleft() 
    print(cur,dist)
    if cur == target: 
        print("distance = ", dist)
        break
    
#         action(cur) # 有些题目需要对当前元素做处理

    for x in graph[cur]:
        if not vis[x]:
            q.append((x, dist + 1))
            vis[x] = True

3、状态压缩

本题与一般的图论题目不同的是,需要遍历完图内全部节点,且可以重复访问某些节点。所以需要在搜索过程中,记录当前已经遍历了哪些节点。如果利用数组来存储每个节点的状态,在传参时较为不方便,效率不高。本题数据范围 n ≤12,说明可以利用状态压缩。

状态压缩也即用一个变量来表示当前状态,比较常用的方式是利用一个 n 位 k 进制数 mask 表示当前 n 个节点的所处的 k 个不同状态。对于本题而言,某个节点只需要记录是否遍历过,所以利用二进制即可。

一般而言,mask 从低到高第 i 位为 0 表示第 i 个节点还未被访问过,为 1 则相反。例如,假设有 3 个点,点 1 遍历过,点 2, 3 未遍历,则 mask = 001;若点 3 遍历过,点 1, 2 未遍历,则 mask = 100 。特别地,三个点均未遍历时,mask = 000 = 0,均遍历过时,mask = 111 = 2 k
−1
一些状态压缩的基本操作如下:

  • 访问第 i 个点的状态:state = (1 << i) & mask
  • 更改第 i 个点状态为 1:mask = mask | (1 << i)

4、基于状态压缩的广度优先搜索算法

根据之前的介绍,本题可以通过广度优先搜索算法对图中节点进行扩展,并利用状态压缩记录节点的遍历情况。具体实现细节如下:

  • BFS 参数:当前节点编号 idx,当前搜索状态 mask,当前扩展距离 dist
  • BFS 起点:题目不限制起点,所以最开始可以将每个点都存入队列,对应状态为仅该点遍历。例如图中有 2 个点时,分别将第一个点及其对应的 mask = 01,第二个点和其对应的 mask = 10 存入。
  • BFS 终点:最终要求所有点均遍历,所以当 mask = 2n - 1 时搜索结束。
  • BFS 标记:尽管本题可以重复访问某些节点,但是在同一状态下重复访问某一节点必然是无用功。所以在实现时,利用一个二维标记数组记录某一状态下,某一节点的拓展情况,防止被重复扩展。