poj 3415 Common Substrings(長度大於k的相同子串對數xian 字尾陣列+單調桟統計)
地址:http://poj.org/problem?id=3415
題意:給你兩個字串,還有一個數字K,要求這兩個字串長度大於等於K的相同子串對數,具體看題目
分析:這題求相同子串,自然就會讓人想到字尾陣列之類的解法,不過字尾陣列只能求出最長的公共子串,還有一些公共字首的資訊,沒辦法完成統計子串對數,我想了半天都沒想出辦法,然後看了一眼討論,有人說是單調性。。。我就繼續往這方面思考了,仔細研究了下高度陣列height,你會發現,當height[ i ]> heigh[ i-1 ]時,它跟前面的公共字首不可能大於height[ i ]了,也就是對於j<i,如果height[ j ]> height[ i ],那麼height[ j ]-height[ i ]這部分加上公共部分height[ i ]組成的相同子串不會與後面的相同了,也就是說,這部分可以獨自統計,而剩下的部分height[ i ]可以與i一起算就行。我們維護一個桟,保證桟中的高度不斷遞增,當出現一個高度比桟頂元素低的,說明棧頂元素比他高的部分組成的子串可以統計了,統計完後就退桟,知道桟為空,或者棧頂元素低於當前元素,這裡需要注意的地方就是統計時統計的部分要認真考慮,我在這裡錯了,導致wa了n次T_T
看不明白的話,就看下面的圖吧:
程式碼:
/** head files*/
#include <cstdlib>
#include <cctype>
#include <cstring>
#include <cstdio>
#include <cmath>
#include <algorithm>
#include <vector>
#include <string>
#include <iostream>
#include <sstream>
#include <map>
#include <set>
#include <queue>
#include <stack>
#include <fstream>
#include <numeric>
#include <iomanip>
#include <bitset>
#include <list>
#include <stdexcept>
#include <functional>
#include <utility>
#include <ctime>
using namespace std;
/** some operate*/
#define PB push_back
#define MP make_pair
#define REP(i,n) for(i=0;i<(n);++i)
#define UPTO(i,l,h) for(i=(l);i<=(h);++i)
#define DOWN(i,h,l) for(i=(h);i>=(l);--i)
#define MSET(arr,val) memset(arr,val,sizeof(arr))
#define MAX3(a,b,c) max(a,max(b,c))
#define MAX4(a,b,c,d) max(max(a,b),max(c,d))
#define MIN3(a,b,c) min(a,min(b,c))
#define MIN4(a,b,c,d) min(min(a,b),min(c,d))
/** some const*/
#define N 222222
#define M 222222
#define PI acos(-1.0)
#define oo 1111111111
/** some alias*/
typedef long long ll;
/** Global variables*/
/** some template names, just push ctrl+j to get it in*/
//manacher 求最長迴文子串
//pqueue 優先佇列
//combk n元素序列的第m小的組合和
//pmatrix n個點的最大子矩陣
//suffixarray 字尾陣列
template <typename T, int LEN>
struct suffixarray
{
int str[LEN*3],sa[LEN*3];
int rank[LEN],height[LEN];
int id[LEN];
int len;
bool equal(int *str, int a, int b)
{
return str[a]==str[b]&&str[a+1]==str[b+1]&&str[a+2]==str[b+2];
}
bool cmp3(int *str, int *nstr, int a, int b)
{
if(str[a]!=str[b])return str[a]<str[b];
if(str[a+1]!=str[b+1])return str[a+1]<str[b+1];
return nstr[a+b%3]<nstr[b+b%3];
}
void radixsort(int *str, int *sa, int *res, int n, int m)
{
int i;
REP(i,m)id[i]=0;
REP(i,n)++id[str[sa[i]]];
REP(i,m)id[i+1]+=id[i];
DOWN(i,n-1,0)res[--id[str[sa[i]]]]=sa[i];
}
void dc3(int *str, int *sa, int n, int m)
{
#define F(x) ((x)/3+((x)%3==1?0:one))
#define G(x) ((x)<one?(x)*3+1:((x)-one)*3+2)
int *nstr=str+n, *nsa=sa+n, *tmpa=rank, *tmpb=height;
int i,j,k,len=0,num=0,zero=0,one=(n+1)/3;
REP(i,n)if(i%3)tmpa[len++]=i;
str[n]=str[n+1]=0;
radixsort(str+2, tmpa, tmpb, len, m);
radixsort(str+1, tmpb, tmpa, len, m);
radixsort(str+0, tmpa, tmpb, len, m);
nstr[F(tmpb[0])]=num++;
UPTO(i,1,len-1)
nstr[F(tmpb[i])]=equal(str,tmpb[i-1],tmpb[i])?num-1:num++;
if(num<len)dc3(nstr,nsa,len,num);
else REP(i,len)nsa[nstr[i]]=i;
if(n%3==1)tmpa[zero++]=n-1;
REP(i,len)if(nsa[i]<one)tmpa[zero++]=nsa[i]*3;
radixsort(str, tmpa, tmpb, zero, m);
REP(i,len)tmpa[nsa[i]=G(nsa[i])]=i;
i=j=0;
REP(k,n)
if(j>=len||(i<zero&&cmp3(str,tmpa,tmpb[i],nsa[j])))sa[k]=tmpb[i++];
else sa[k]=nsa[j++];
}
void initSA(T *s, int n,int m)
{
int i,j,k=0;
str[len=n]=0;
REP(i,n)str[i]=s[i];
dc3(str,sa,n+1,m);
REP(i,n)sa[i]=sa[i+1];
REP(i,n)rank[sa[i]]=i;
REP(i,n)
{
if(k)--k;
if(rank[i])for(j=sa[rank[i]-1];str[i+k]==str[j+k];++k);
else k=0;
height[rank[i]]=k;
}
}
};
suffixarray<char,N> msa;
stack<int> stk;
char s[N],tmp[N];
int sum[N][2],suma,sumb;
int main()
{
int i,l,r,k,n,m,now,left,low;
ll ans;
while(~scanf("%d",&k))
{
if(k==0)break;
scanf("%s%s",s,tmp);
s[n=strlen(s)]=1;
m=strlen(tmp);
REP(i,m)s[n+i+1]=tmp[i];
m=n+m+1;
msa.initSA(s,m,256);
REP(i,m)MSET(sum[i],0);
REP(i,m)
{
if(msa.sa[i]<n)++sum[i][0];
if(msa.sa[i]>n)++sum[i][1];
sum[i+1][0]+=sum[i][0];
sum[i+1][1]+=sum[i][1];
}
while(!stk.empty())stk.pop();
ans=0;
msa.height[m]=0;
left=0;
REP(i,m)
{
if(!stk.empty())
{
r=stk.top();
while(!stk.empty()&&msa.height[stk.top()]>=msa.height[i+1])
{
now=msa.height[stk.top()];
stk.pop();
if(stk.empty())l=left,low=k-1;
else l=stk.top(),low=msa.height[stk.top()];
low=max(low,msa.height[i+1]);
suma=sum[r][0]-sum[l-1][0];
sumb=sum[r][1]-sum[l-1][1];
ans+=(ll)suma*sumb*(now-low);
}
}
if(msa.height[i+1]>=k)stk.push(i+1);
else left=i+1;
}
cout<<ans<<endl;
}
return 0;
}
相關文章
- POJ 3415-Common Substrings(字尾陣列+單調棧-公共子串的長度)陣列
- [POJ 3415] Common Substrings (字尾陣列+單調棧優化)陣列優化
- POJ 3415 Common Substrings(字尾陣列求重複字串)陣列字串
- POJ 3294 Life Forms(字尾陣列求k個串的最長子串)ORM陣列
- POJ 2217-Secretary(字尾陣列+高度陣列-最大公共子串長度)陣列
- POJ 2774-Long Long Message(字尾陣列+高度陣列-最大公共子串長度)陣列
- poj 2774 求兩字串的最長公共子串 字尾陣列字串陣列
- POJ 3693 Maximum repetition substring(字尾陣列求最長重複子串)陣列
- HDU 5769-Substring(字尾陣列-不相同的子串的個數)陣列
- POJ 1743 Musical Theme (字尾陣列,求最長不重疊重複子串)陣列
- HDU 4622 Reincarnation( 任意區間子串的長度, 字尾陣列+RMQ)陣列MQ
- ural 1297 最長迴文子串 字尾陣列陣列
- SPOJ 687. Repeats(字尾陣列求最長重複子串)陣列
- SPOJ 694. Distinct Substrings,705. New Distinct Substrings(字尾陣列)陣列
- 查詢陣列中出現次數大於陣列長度一半的數字陣列
- POJ 3581-Sequence(字尾陣列)陣列
- POJ 1743 Musical Theme(字尾陣列)陣列
- POJ 2752+KMP+利用next陣列性質求出所有相同的字首和字尾KMP陣列
- poj3080-kmp+列舉子串 求最長公共子串KMP
- 【Kmp求既是字首又是字尾的子串】POJ - 2752 Seek the Name, Seek the FameKMP
- hdu 3415 單調佇列佇列
- SPOJ 220. Relevant Phrases of Annihilation(字尾陣列多次不重疊子串)陣列
- Codeforces #123D: 字尾陣列+單調棧3D陣列
- POJ1743 Musical Theme(字尾陣列 二分)陣列
- POJ2774Long Long Message(字尾陣列模板)陣列
- Matlab統計陣列中相同元素的個數Matlab陣列
- 字尾陣列模板陣列
- 字尾陣列 SA陣列
- 字尾陣列,SA陣列
- SPOJ 694 求一個字串有多少子串 字尾陣列字串陣列
- 1588 所有奇數長度子陣列的和(字首和)陣列
- 203. 長度最小的子陣列陣列
- 找出陣列中第 k 大的數字及其出現次數陣列
- 最長公共子串 二維陣列 Go實現陣列Go
- 字尾陣列複習陣列
- 字尾陣列(後續)陣列
- 字尾陣列詳解陣列
- 【筆記】字尾陣列筆記陣列