赞
踩
30. 串联所有单词的子串:
给定一个字符串 s 和一些 长度相同 的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符 ,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]
示例 3:
输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出:[6,9,12]
提示:
- 1 <= s.length <= 10^4
- s 由小写英文字母组成
- 1 <= words.length <= 5000
- 1 <= words[i].length <= 30
- words[i] 由小写英文字母组成
哈希算法+双指针尺取
由于所有单词长度相同,尺取时可以利用hash算法判断每一个单词是否存在,由于单词可能不一定从第1个位置开始,所有要枚举一个单词长度来让每一个位置都有被取到的可能。
代码如下:
typedef long long ll; typedef unsigned long long ull; const int MAXN=1e4+5; const ull base=997; //或者233317,大一点的素数 const ull mod=INT_MAX; //一般不超过INT_MAX,因为后面求子串mod值有Hash[l-1]*po[r-l+1],超过INT_MAX可能会超ull。注意:取1e9+7可能被出题人卡 class Solution { ull po[MAXN]; ull Hash[MAXN]; map<ull,int>mp; map<ull,int>vis; void init(string s) { po[0]=1; po[1]=base; for(int i=2;i<=10002;++i){ po[i]=(po[i-1]*base)%mod; } int len=s.size(); Hash[0]=s[0]-'a'; for(int i=1;i<len;++i){ Hash[i]=(Hash[i-1]*base%mod+(s[i]-'a'))%mod; } } ull get_hash(int l,int r){ if(l==0) return Hash[r]; ull ans=((Hash[r]+mod-Hash[l-1]*po[r-l+1]%mod)%mod+mod)%mod; //这里要先加mod,防止相减小于0,溢出 return ans; } ull hash_fun(string s){ int len=s.size(); ull ans=0; for(int i=0;i<len;++i) ans=(ans*base%mod+(s[i]-'a'))%mod; return ans; } //将word的所有Hash值放入map中 void deal_word(vector<string>& words){ mp.clear(); int len=words.size(); for(int i=0;i<len;++i) { ull tmp=hash_fun(words[i]); ++mp[tmp]; } } public: vector<int> findSubstring(string s, vector<string>& words) { init(s); deal_word(words); //将word的所有Hash值放入map中 vector<int>ans; int s_len=s.size(); int len=words[0].size(); int total=words.size(); for(int i=0;i<len;++i) { //枚举每一个位置 int l=i,r=l; int cnt=0; vis.clear(); while(r+len<=s_len){ r+=len; ull val=get_hash(r-len,r-1); if(mp[val]!=0) { if(vis[val]<mp[val]){ ++vis[val]; ++cnt; if(cnt==total) ans.push_back(l); } else{ //已经满了 while(vis[val]>=mp[val]) { l+=len; ull sub=get_hash(l-len,l-1); --vis[sub]; --cnt; } ++vis[val]; ++cnt; if(cnt==total) ans.push_back(l); } } else{ vis.clear(); cnt=0; l=r; } } } return ans; } };
map标记+双指针尺取
在上面思路下,直接用map标记记录子串+尺取就行
代码如下:
class Solution { map<string,int>mp; map<string,int>vis; void deal_word(vector<string>& words) { int len=words.size(); for(int i=0;i<len;++i) ++mp[words[i]]; } public: vector<int> findSubstring(string s, vector<string>& words) { deal_word(words); //将word的所有Hash值放入map中 vector<int>ans; int s_len=s.size(); int len=words[0].size(); int total=words.size(); for(int i=0;i<len;++i) { //枚举每一个位置 int l=i,r=l; int cnt=0; vis.clear(); while(r+len<=s_len){ r+=len; string val=s.substr(r-len,len); //cout<<"string="<<val<<endl; if(mp[val]!=0) { if(vis[val]<mp[val]) { ++vis[val]; ++cnt; if(cnt==total) ans.push_back(l); } else { //这个字符串已经够了 while(vis[val]>=mp[val]) { string sub=s.substr(l,len); --vis[sub]; --cnt; l+=len; } ++vis[val]; ++cnt; if(cnt==total) ans.push_back(l); } } else { l=r; vis.clear(); cnt=0; } } } return ans; } };
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。