AT_abc343_G [ABC343G] Compress Strings 題解

harmis_yz發表於2024-03-07

分析

水題,評分能有 \(2100\) 可能是因為很多人卡 E 了。

我說真的,E 好難啊。

\(n\) 只有 \(20\),考慮從狀壓的角度入手。定義狀態函式 \(f_{s,i}\) 表示當某個字串 \(T\) 包含了所有 \(s\) 的二進位制中為 \(1\) 的下標 \(S_j\)\(T\) 末尾包含的子串為 \(S_i\)\(T\) 的最小長度。那很顯然的就有轉移方程:\(f_{s\mid2^{j},j}=\min(f_{s\mid2^{j}},f_{s,i}+|S_j|-\Delta)\)。其中 \(\Delta\) 表示 \(S_j\)\(S_i\) 拼起來時,\(S_i\) 的字尾與 \(S_j\) 的字首的最大匹配長度。

有個問題,當 \(S_1=aab,S_2=bc,S_3=abc\) 時,上面的 DP 得到的答案是 \(7\),即 \(T=aabcabc\)。但是很顯然在 \(S_1\)\(S_2\) 拼起來之後,\(S_3\) 與其的 \(\Delta\)\(3\)。此時的 \(S_2\) 已經被 \(S_3\) 完全包含了,就相當於是 \(S_1\)\(S_3\) 拼起來的情況。所以當 \(S_i\)\(S_j(j \ne i)\) 包含時,\(S_i\) 對答案的代價為 \(0\)(可以不管 \(S_i\))。

任意 \(S_i,S_j\)\(\Delta\) 可以暴力雜湊,判斷 \(S_i\) 是否被 \(S_j\) 包含也可以暴力雜湊。這兩個預處理出來之後跑狀壓就行了。

複雜度 \(O(n^2 2^{n})\),實測刪掉被包含的之後飛快。

程式碼

#include<bits/stdc++.h>
using namespace std;
#define int long long
#define re register
#define il inline
#define pii pair<int,string>
#define x first
#define y second
#define gc getchar()
#define rd read()
#define debug() puts("------------")

namespace yzqwq{
	il int read(){
		int x=0,f=1;char ch=gc;
		while(ch<'0'||ch>'9'){if(ch=='-') f=-1;ch=gc;}
		while(ch>='0'&&ch<='9') x=(x<<1)+(x<<3)+(ch^48),ch=gc;
		return x*f;
	}
	il int qmi(int a,int b,int p){
		int ans=1;
		while(b){
			if(b&1) ans=ans*a%p;
			a=a*a%p,b>>=1;
		}
		return ans;
	}
	il auto max(auto a,auto b){return (a>b?a:b);}
	il auto min(auto a,auto b){return (a<b?a:b);}
	il int gcd(int a,int b){
		if(!b) return a;
		return gcd(b,a%b);
	}
	il int lcm(int a,int b){
		return a/gcd(a,b)*b;
	}
	il void exgcd(int a,int b,int &x,int &y){
		if(!b) return x=1,y=0,void(0);
		exgcd(b,a%b,x,y);
		int t=x;
		x=y,y=t-a/b*x;
		return ;
	}
	mt19937 rnd(time(0));
}
using namespace yzqwq;

const int N=21,M=2e5+10;
int n,m;
string s_[N],s[N];
int f[1<<N][N];
int b[M],c[N][N];
int hs_,hs[N][M],bk=12347;
bool vis[N];

il int get(int now,int l,int r){
	return hs[now][r]-hs[now][l-1]*b[r-l+1];
}
il bool check(int now,string a,int hs_){
	if(s_[now].size()<=a.size()) return 0;
	for(re int l=0;l+a.size()-1<s_[now].size();++l){
		int r=l+a.size()-1;
		if(get(now,l+1,r+1)==hs_) return 1;
	}
	return 0;
}

il void solve(){
	n=rd,b[0]=1;
	for(re int i=1;i<M;++i) b[i]=b[i-1]*bk;
	for(re int i=1;i<=n;++i){
		cin>>s_[i];
		for(re int j=0;j<s_[i].size();++j)
			hs[i][j+1]=hs[i][j]*bk+s_[i][j]-'A'+1;
	}
	for(re int i=1;i<=n;++i){
		hs_=0;
		for(re int j=0;j<s_[i].size();++j)
			hs_=hs_*bk+s_[i][j]-'A'+1;
		for(re int j=1;j<=n;++j)
			if(check(j,s_[i],hs_)){
				vis[i]=1;break;
			}
	}
	for(re int i=1;i<=n;++i)
		if(!vis[i]){
			s[++m]=s_[i];
			for(re int j=0;j<s[m].size();++j)
				hs[m][j+1]=hs[m][j]*bk+s[m][j]-'A'+1;	
		}
	for(re int i=1;i<=m;++i)
	for(re int j=1;j<=m;++j){
		int Mx=0;
		for(re int len=1;len<=min(s[i].size(),s[j].size());++len)
			if(hs[j][len]==get(i,s[i].size()-len+1,s[i].size())) Mx=len;
		c[i][j]=Mx;		
	}
	for(re int i=0;i<(1<<m);++i)
	for(re int j=1;j<=m;++j)
		f[i][j]=1e9;
	for(re int i=1;i<=m;++i) f[1<<(i-1)][i]=s[i].size();
	for(re int i=0;i<(1<<m);++i)
	for(re int lst=1;lst<=m;++lst)
		if((i>>(lst-1))&1)
			for(re int now=1;now<=m;++now){
				if((i>>(now-1))&1) continue;
				f[i+(1<<(now-1))][now]=min(f[i+(1<<now-1)][now],f[i][lst]+s[now].size()-c[lst][now]);
			}
	int ans=1e9;
	for(re int i=1;i<=m;++i) ans=min(ans,f[(1<<m)-1][i]);
	printf("%lld\n",ans);
	return ;
}

signed main(){
//	freopen(".in","r",stdin);
//	freopen(".out","w",stdout);
	int t=1;while(t--)
	solve();
	return 0;
}

注:P2322 是這題的輸出方案版。

相關文章