赞
踩
买卖股票问题的一个进阶,其实化简空间的方法从题目的角度不好理解,从代码的角度反而是可以发现下一步用的是上一步的值,可以直接替换,不放心的话用个临时变量,但是从原理上来说好像没必要。
123. 买卖股票的最佳时机 III - 力扣(Leetcode)
买卖股票题目的一个升级,因为只能买卖两次,关键在于记录“两次”这个关键值。
键在于至多买卖两次,这意味着可以买卖一次,可以买卖两次,也可以不买卖。
接来下我用动态规划五部曲详细分析一下:
一天一共就有五个状态,
dp[i][j]中 i表示第i天,j为 [0 - 4] 五个状态,dp[i][j]表示第i天状态j所剩最大现金。
需要注意:dp[i][1],表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,这是很多同学容易陷入的误区。
达到dp[i][1]状态,有两个具体操作:
那么dp[i][1]究竟选 dp[i-1][0] - prices[i],还是dp[i - 1][1]呢?
一定是选最大的,所以 dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1]);
同理dp[i][2]也有两个操作:
所以dp[i][2] = max(dp[i - 1][1] + prices[i], dp[i - 1][2])
同理可推出剩下状态部分:
dp[i][3] = max(dp[i - 1][3], dp[i - 1][2] - prices[i]);
dp[i][4] = max(dp[i - 1][4], dp[i - 1][3] + prices[i]);
第0天没有操作,这个最容易想到,就是0,即:dp[0][0] = 0;
第0天做第一次买入的操作,dp[0][1] = -prices[0];
第0天做第一次卖出的操作,这个初始值应该是多少呢?
首先卖出的操作一定是收获利润,整个股票买卖最差情况也就是没有盈利即全程无操作现金为0,
从递推公式中可以看出每次是取最大值,那么既然是收获利润如果比0还小了就没有必要收获这个利润了。
所以dp[0][2] = 0;
第0天第二次买入操作,初始值应该是多少呢?应该不少同学疑惑,第一次还没买入呢,怎么初始化第二次买入呢?
第二次买入依赖于第一次卖出的状态,其实相当于第0天第一次买入了,第一次卖出了,然后在买入一次(第二次买入),那么现在手头上没有现金,只要买入,现金就做相应的减少。
所以第二次买入操作,初始化为:dp[0][3] = -prices[0];
同理第二次卖出初始化dp[0][4] = 0;
从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
以输入[1,2,3,4,5]为例
可以看到红色框为最后两次卖出的状态。
现在最大的时候一定是卖出的状态,而两次卖出的状态现金最大一定是最后一次卖出。
所以最终最大利润是dp[4][4]
以上五部都分析完了,不难写出如下代码:
// 版本一 class Solution { public: int maxProfit(vector<int>& prices) { if (prices.size() == 0) return 0; vector<vector<int>> dp(prices.size(), vector<int>(5, 0)); dp[0][1] = -prices[0]; dp[0][3] = -prices[0]; for (int i = 1; i < prices.size(); i++) { dp[i][0] = dp[i - 1][0]; dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i]); dp[i][2] = max(dp[i - 1][2], dp[i - 1][1] + prices[i]); dp[i][3] = max(dp[i - 1][3], dp[i - 1][2] - prices[i]); dp[i][4] = max(dp[i - 1][4], dp[i - 1][3] + prices[i]); } return dp[prices.size() - 1][4]; } };
当然,大家可以看到力扣官方题解里的一种优化空间写法,我这里给出对应的C++版本:
// 版本二 class Solution { public: int maxProfit(vector<int>& prices) { if (prices.size() == 0) return 0; vector<int> dp(5, 0); dp[1] = -prices[0]; dp[3] = -prices[0]; for (int i = 1; i < prices.size(); i++) { dp[1] = max(dp[1], dp[0] - prices[i]); dp[2] = max(dp[2], dp[1] + prices[i]); dp[3] = max(dp[3], dp[2] - prices[i]); dp[4] = max(dp[4], dp[3] + prices[i]); } return dp[4]; } };
大家会发现dp[2]利用的是当天的dp[1]。 但结果也是对的。
我来简单解释一下:
dp[1] = max(dp[1], dp[0] - prices[i]); 如果dp[1]取dp[1],即保持买入股票的状态,那么 dp[2] = max(dp[2], dp[1] + prices[i]);中dp[1] + prices[i] 就是今天卖出。
如果dp[1]取dp[0] - prices[i],今天买入股票,那么dp[2] = max(dp[2], dp[1] + prices[i]);中的dp[1] + prices[i]相当是在今天再卖出股票,一买一卖收益为0,对所得现金没有影响。相当于今天买入股票又卖出股票,等于没有操作,保持昨天卖出股票的状态了。
188. 买卖股票的最佳时机 IV - 力扣(Leetcode)
由两次扩展为买卖k次,其实还是要记录能够买卖的状态
本题其实依然可以用一个二维dp数组。
使用二维数组 dp[i][j] :第i天的状态为j,所剩下的最大现金是dp[i][j]
j的状态表示为:
大家应该发现规律了吧 ,除了0以外,偶数就是卖出,奇数就是买入。
题目要求是至多有K笔交易,那么j的范围就定义为 2 * k + 1 就可以了。
所以二维dp数组的C++定义为:
vector<vector<int>> dp(prices.size(), vector<int>(2 * k + 1, 0));
还要强调一下:dp[i][1],表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,这是很多同学容易陷入的误区。
达到dp[i][1]状态,有两个具体操作:
选最大的,所以 dp[i][1] = max(dp[i - 1][0] - prices[i], dp[i - 1][1]);
同理dp[i][2]也有两个操作:
所以dp[i][2] = max(dp[i - 1][1] + prices[i], dp[i - 1][2])
同理可以类比剩下的状态,代码如下:
for (int j = 0; j < 2 * k - 1; j += 2) {
dp[i][j + 1] = max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]);
dp[i][j + 2] = max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]);
}
这里要类比j为奇数是买,偶数是卖的状态。
第0天没有操作,这个最容易想到,就是0,即:dp[0][0] = 0;
第0天做第一次买入的操作,dp[0][1] = -prices[0];
第0天做第一次卖出的操作,这个初始值应该是多少呢?
首先卖出的操作一定是收获利润,整个股票买卖最差情况也就是没有盈利即全程无操作现金为0,
从递推公式中可以看出每次是取最大值,那么既然是收获利润如果比0还小了就没有必要收获这个利润了。
所以dp[0][2] = 0;
第0天第二次买入操作,初始值应该是多少呢?
不用管第几次,现在手头上没有现金,只要买入,现金就做相应的减少。
第二次买入操作,初始化为:dp[0][3] = -prices[0];
所以同理可以推出dp[0][j]当j为奇数的时候都初始化为 -prices[0]
代码如下:
for (int j = 1; j < 2 * k; j += 2) {
dp[0][j] = -prices[0];
}
在初始化的地方同样要类比j为偶数是卖、奇数是买的状态。
从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
以输入[1,2,3,4,5],k=2为例。
最后一次卖出,一定是利润最大的,dp[prices.size() - 1][2 * k]即红色部分就是最后求解。
以上分析完毕,C++代码如下:
class Solution { public: int maxProfit(int k, vector<int>& prices) { if (prices.size() == 0) return 0; vector<vector<int>> dp(prices.size(), vector<int>(2 * k + 1, 0)); for (int j = 1; j < 2 * k; j += 2) { dp[0][j] = -prices[0]; } for (int i = 1;i < prices.size(); i++) { for (int j = 0; j < 2 * k - 1; j += 2) { dp[i][j + 1] = max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]); dp[i][j + 2] = max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]); } } return dp[prices.size() - 1][2 * k]; } };
其实这道题改成一维数组以后依然是没有问题的:
class Solution { public: int maxProfit(int k, vector<int>& prices) { if(prices.size() < 1 || k < 1) return 0; // vector<vector<int>> dp(prices.size(), vector<int>(2*k+1, 0)); vector<int> dp(2*k+1, 0); for(int j = 1; j < 2*k; j+=2){ dp[j] = -prices[0]; } for(int i = 1; i<prices.size();i++){ for(int j = 1; j<2*k; j+=2){ dp[j] = max(dp[j], dp[j-1]-prices[i]); dp[j+1] = max(dp[j+1], dp[j]+prices[i]); } } return dp[2*k]; } };
一个猜想:股票一定是要先买后卖,这个就相当是说,对于买操作来说,要选不操作或买一笔的最大值。对于买操作,当天就是要选什么也不干保持状态dp[j],或者是用前一天剩下的钱买一笔dp[j-1]-prices[i];对于卖操作,因为卖操作必须在买操作之后,而且也是同样的道理,要从保持dp[j+1]和卖出赚钱dp[j]+prices[i]中选一个。因为买操作总是在前,又不能在当天同时买卖。所以这个dp数组更新的逻辑就是卖的状态由前一个买的状态决定, 买状态也由前一个卖状态决定。要么就是本身,这个就是原逻辑,如果更新又带入,相当于不买不卖,保持的其实是前一天的最优值。所以看似虽然是同一天内的状态,其实也并不用担心“买”状态dp[j]更新后会对“卖”状态dp[j+1]有影响。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。