赞
踩
定义最优解数组的含义是什么?--C[i][j]表示序列X[1:i]和序列Y[1:j]的公共子序列长度(左闭右闭区间)
递归关系是什么?每次添加一个元素进入数组,就判断一次他们的最后一个元素是否相同,相同的话就可以留下,不相同就删除其中一个序列的最后一个元素。
如何构造最优解?用一个新的数组b记录尾巴的元素来自上面三种情况的哪一种情况,便于还原。
定义最长公共子序列为:若给定序列X={x1,x2,…,xm},则另一序列Z={z1,z2,…,zk},是X的子序列是指存在一个严格递增下标序列{i1,i2,…,ik}使得对于所有j=1,2,…,k有:zj=xij。 给定2个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,称Z是序列X和Y的公共子序列。
例如,序列Z={B,C,D,B}是序列X={A,B,C,B,D,A,B}的子序列,相应的递增下标序列为{2,3,5,7}。
最长公共子序列问题:给定序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},找出他们的最长公共子序列。
就是说,存在一个严格递增下标的序列,使得这个序列是另一个序列的子序列。
例如: X={A,B,C,B,D,A,B}
Y={B,D,C,A,B,A}
序列{B,C,B,A}是X和Y的一个子序列,长度为4,也是最长的公共子序列。
最优子结构性质
设序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}的最长公共子序列为Z={z1,z2,…,zk} ,
(1)若xm=yn,则zk=xm=yn,且Zk-1是Xm-1和Yn-1的最长公共子序列。
(2)若xm≠yn且zk≠xm,则Z是Xm-1和Y的最长公共子序列。
(3)若xm≠yn且zk≠yn,则Z是X和Yn-1的最长公共子序列。
由此可知,2个序列的最长公共子序列包含了这2个序列的前缀的最长公共子序列。因此,最长公共子序列问题具有最优子结构性质。
子问题的递归结构--由最优子结构性质建立子问题最优值的递归关系。
用c[i][j]记录序列和的最长公共子序列的长度。其中, Xi={x1,x2,…,xi};Yj={y1,y2,…,yj}。
当i=0或j=0时,空序列是Xi和Yj的最长公共子序列。故此时C[i][j]=0。
其它情况下,由最优子结构性质可建立递归关系如下:
序列X={x1,x2,…,xi}和Y={y1,y2,…,yj}的最长公共子序列长度计算:
(1)若xi=yj,则zk=xi=yi,最长的长度为:序列Xi-1和Yj-1的最长公共子序列长度+1。
(2)若xi≠yj,最长的长度在X[1: i-1]或者是Y[1 :j-1]中取得。
(3)如果其中一个是空序列,那么最长的公共子序列就是0(就像递归的结束条件一样)
计算最优值
总共有θ(mn)个不同的子问题,因此,用动态规划算法自底向上地计算最优值能提高算法的效率。
构造最长公共子序列
空间复杂度的算法的改进--只计算最大长度不需要还原的情况(废话)
在算法lcsLength和lcs中,可进一步将数组b省去。
事实上,数组元素c[i][j]的值仅由c[i-1][j-1],c[i-1][j]和c[i][j-1]这3个数组元素的值所确定。
对于给定的数组元素c[i][j],可以不借助于数组b而仅借助于c本身在O(1)时间内确定c[i][j]的值是由c[i-1][j-1],c[i-1][j]和c[i][j-1]中哪一个值所确定的。 如果只需要计算最长公共子序列的长度,则算法的空间需求可大大减少。事实上,在计算c[i][j]时,只用到数组c的第i行和第i-1行。因此,用2行的数组空间就可以计算出最长公共子序列的长度。进一步的分析还可将空间需求减至O(min(m,n))。
- #include <iostream>
- #include <string>
- #include <stack>
- using namespace std;
- void LCS(string s1,string s2)
- {
- int m=s1.length()+1;
- int n=s2.length()+1;
- int **c;
- int **b;
- c=new int* [m];
- b=new int* [m];
- for(int i=0;i<m;i++)
- {
- c[i]=new int [n];
- b[i]=new int [n];
- for(int j=0;j<n;j++)
- b[i][j]=0;
- }
- for(int i=0;i<m;i++)
- c[i][0]=0;
- for(int i=0;i<n;i++)
- c[0][i]=0;
- for(int i=0;i<m-1;i++)
- {
- for(int j=0;j<n-1;j++)
- {
- if(s1[i]==s2[j])
- {
- c[i+1][j+1]=c[i][j]+1;
- b[i+1][j+1]=1; //1表示箭头为 左上
- }
- else if(c[i][j+1]>=c[i+1][j])
- {
- c[i+1][j+1]=c[i][j+1];
- b[i+1][j+1]=2; //2表示箭头向 上
- }
- else
- {
- c[i+1][j+1]=c[i+1][j];
- b[i+1][j+1]=3; //3表示箭头向 左
- }
- }
- }
- for(int i=0;i<m;i++) //输出c数组
- {
- for(int j=0;j<n;j++)
- {
- cout<<c[i][j]<<' ';
- }
- cout<<endl;
- }
- stack<char> same; //存LCS字符
- stack<int> same1,same2; //存LCS字符在字符串1和字符串2中对应的下标,方便显示出来
- for(int i = m-1,j = n-1;i >= 0 && j >= 0; )
- {
- if(b[i][j] == 1)
- {
- i--;
- j--;
- same.push(s1[i]);
- same1.push(i);
- same2.push(j);
- }
- else if(b[i][j] == 2)
- i--;
- else
- j--;
- }
- cout<<s1<<endl; //输出字符串1
- for(int i=0;i<m && !same1.empty();i++) //输出字符串1的标记
- {
- if(i==same1.top())
- {
- cout<<1;
- same1.pop();
- }
- else
- cout<<' ';
- }
- cout<<endl<<s2<<endl; //输出字符串2
- for(int i=0;i<n && !same2.empty();i++) //输出字符串2的标记
- {
- if(i==same2.top())
- {
- cout<<1;
- same2.pop();
- }
- else
- cout<<' ';
- }
- cout<<endl<<"最长公共子序列为:";
- while(!same.empty())
- {
- cout<<same.top();
- same.pop();
- }
- cout<<endl<<"长度为:"<<c[m-1][n-1]<<endl;
- for (int i = 0; i<m; i++)
- {
- delete [] c[i];
- delete [] b[i];
- }
- delete []c;
- delete []b;
- }
- int main()
- {
- string s1="ABCPDSFJGODIHJOFDIUSHGD";
- string s2="OSDIHGKODGHBLKSJBHKAGHI";
- LCS(s1,s2);
- return 0;
- }
代码是我抄的,应该自己画一遍数组的表。其余的博客也讲的很清楚了,具体过程可以看这个:
动态规划解最长公共子序列(LCS)(附详细填表过程)_z-k的博客-CSDN博客_最长公共子序列动态规划算法
得理解那个数组是怎么填的!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。