Monodyee

这个屌丝很懒，什么也没留下！

热门标签

【动态规划】最长公共子序列——算法设计与分析_最长公共子序列动态规划算法

作者：Monodyee | 2024-02-15 22:08:49

踩

最长公共子序列动态规划算法

文章目录

一、问题定义
二、求解策略
三、算法分析
- 3.1 伪代码
- 3.2 时间复杂度

一、问题定义

1.1 子序列

子序列是给定序列中在任意位置去掉任意多个字符后得到的结果。例如：

给定序列 $X$ ：

$X ： A BCB D A B$

$X$ 的子序列：

$X_1：ABCBDAB$

$X_2：ABCB$

$X_3：ACBB$

1.2 公共子序列

给定两个序列 $X$ 和 $Y$ ：

$X ： A BCB D A B$

$Y ： B D C A B A$

公共子序列示例：

$X_1=Y_1=CA$

$X_2=Y_2=ABA$

$X_3=Y_3=BCAB$

1.3 问题形式化定义

最长公共子序列问题：

输入：

$\quad$ 序列 $X=<x_1,x_2,...,x_n>$ 和序列 $Y=<y_1,y_2,...,y_m>$

输出：

$\quad$ 求解一个公共子序列 $Z=<z_1,z_2,...,z_l>$

$\quad$ $\quad$ $\quad$ 优化目标： $ma x ∣ Z ∣$

$\quad$ $\quad$ $\quad$ 约束条件： $z_1,z_2,...,z_l>=<x_{i_1},x_{i_2},...,x_{l_1}>=<y_{j_1},y_{j_2},...,y _{j_l}>$ ，其中 $1\leq i_1< i_2<...<i_l\leq n；1\leq j_1<j_2<...<j_l\leq m$

二、求解策略

给定两个序列 $X$ 和 $Y$ ：

$X ： A BCB D A B$

$Y ： B D C A B A$

其最长公共子序列 $Z = B D A B$ ，观察可以发现，其后3位为长度为3的最长公共子序列，其后2位为长度为2的最长公共子序列，最后一位为长度为一的最长公共子序列。这便启示我们可能存在最优子结构和重叠子问题，可以采用动态规划进行求解。

2.1 分析问题结构

形式化给出问题表示：

$C [i, j]$ ： $X [1.. i]$ 和 $Y [1.. j]$ 的最长公共子序列长度

明确原始问题：

$C [n, m]$ ： $X [1.. n]$ 和 $Y [1.. m]$ 的最长公共子序列长度

2.2 建立递推关系

对于给定序列：

在这里插入图片描述

对于末尾来说，有两种情况：

① $x_i=y_j$

此时，
$C[i,j]=max\left\{$

\begin{matrix} C [i - 1, j - 1] + 1 & ① \\ C [i - 1, j] & ② \\ C [i, j - 1] & ③ \end{matrix}

$\begin{matrix} C[i-1,j-1]+1 & ①\\ C[i-1,j] & ②\\ C[i,j-1] &③ \end{matrix}$ \right.

C [i, j] = ma x ⎩ ⎨ ⎧ C [i - 1, j - 1] + 1 C [i - 1, j] C [i, j - 1] ① ② ③

但是，

{①\ge max\left \{ ②，③ \right \} }

，因此，

C [i, j] = C [i - 1, j - 1] + 1

② $x_i \ne y_j$

此时，
$C[i,j]=max\left\{$

\begin{matrix} C [i - 1, j] & ① \\ C [i, j - 1] & ② \end{matrix}

$\begin{matrix} C[i-1,j] & ①\\ C[i,j-1] & ② \end{matrix}$ \right.

C [i, j] = ma x {C [i - 1, j] C [i, j - 1] ① ②

综上所述，得到递推关系式：

\begin{matrix} C [i - 1, j - 1] + 1 & x_{i} = y_{j} \\ m a x {C [i - 1, j], C [i, j - 1]} & x_{i} \neq y_{j} \end{matrix}

2.3 自底向上计算

（1）初始化

当其中一段序列长度为0时，最长公共子序列长度为0，即： $C [i, 0] = C [0, j] = 0$

在这里插入图片描述

（2）依照递推公式计算

在这里插入图片描述

2.4 追踪最优方案

构造追踪数组 $rec [1.. n]$ ，用来记录子问题的来源：
$rec[i,j]=\left\{$

\begin{matrix} L U & i f C [i, j] = C [i - 1, j - 1] + 1 \\ U & i f C [i, j] = C [i - 1, j] \\ L & i f C [i, j] = C [i, j - 1] \end{matrix}

$\begin{matrix} LU & if\quad C[i,j]=C[i-1,j-1]+1\\ U & if\quad C[i,j]=C[i-1,j]\\ L & if\quad C[i,j]=C[i,j-1] \end{matrix}$ \right.

rec [i, j] = ⎩ ⎨ ⎧ LU U L i f C [i, j] = C [i - 1, j - 1] + 1 i f C [i, j] = C [i - 1, j] i f C [i, j] = C [i, j - 1]

（使用

U

代表来自上方，

L

代表来自左方，

LU

代表来自左上角）

当左值和上值相等时，任取其一即可。

从右下角开始追踪，如果其值为 $L$ ，则向左移动1格， $U$ 则向上移动一格， $LU$ 向左上角移动一格。当且仅当 $rec [i, j] = LU$ 时， $X [i] = Y [j]$ 为最长公共子序列中的一个字符，记录下来。如此寻找，直至抵达 $rec$ 数组的边界。

2.5 算法实例

给定序列 $X$ 和 $Y$ ：

在这里插入图片描述

初始化辅助数组：

在这里插入图片描述

计算完毕：

在这里插入图片描述

追踪最优方案：

在这里插入图片描述

得到最长公共子序列 $BCB A$

三、算法分析

3.1 伪代码

在这里插入图片描述

3.2 时间复杂度

时间复杂度 $O (nm)$

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Monodyee/article/detail/87451